Python

Python

0
推荐
17
浏览

贷款发放决策

                                                        &...

邬书豪 发表了文章 • 12 小时前

0
投票
1
回答
56
浏览
0
推荐
35
浏览

简单的Seq2Seq实现作对联

Seq2Seq全称Sequence to Sequence,在机器翻译、文章摘要等领域有着广泛的应用。其本身很简单,是一个如下图所示的Encoder-Decoder框架。本文不纠结于Seq2Seq的原理介绍,而是着重介绍代码实战。本文基于python3...

ruc_wenwen 发表了文章 • 19 小时前

3
推荐
47
浏览

第二周:业务篇,学习笔记

无小意知乎主页:无小意丶公众号: 数据路(shuju_lu)业务篇-指标1.为什么业务重要唯有理解业务,才能建立完整的一套体系,简称业务数据模型。想进入某个行业的数据分析,尽量需要一些业务知识,敲门砖。1.经典...

无小意 发表了文章 • 1 天前

1
推荐
62
浏览

《七周成为数据分析师》第一周之数据分析的三种核心思维

感谢秦璐老师的《七周成为数据分析师》系列,让我得以系统地梳理数据分析思路,懂得围绕”What?Why?How?“三层来分析问题,解决问题。由于年前家里的零售业工作繁忙,闲暇之余学习了该课程前五部分,受益匪浅,却迟...

顾小t 发表了文章 • 1 天前

2
推荐
104
浏览

第一周:数据分析思维,学习笔记

无小意知乎主页:无小意丶公众号: 数据路(shuju_lu)为什么需要七周?数据分析师,最主要的是,解决问题的能力!工具是其次锻炼思维能力第一,其次是业务能力!可视化+sql+python=Superset一定得实现一个Supers...

无小意 发表了文章 • 2 天前

0
推荐
82
浏览

经典Kaggle之泰坦尼克(二)

                            上一期我们对泰坦尼克数据进行了部分预处理和可视化探索,这一期继续我们的可视化探索和建模预测。这...

邬书豪 发表了文章 • 4 天前

1
推荐
89
浏览

经典Kaggle之泰坦尼克(一)

                                       1912年4月15日,载着1316号乘客和891名船员的豪华巨轮泰...

邬书豪 发表了文章 • 4 天前

1
推荐
147
浏览

使用Tensorflow实现简单的RNN

之前我们用word2vec训练了词向量,但光词向量其实没有什么实际的用处,我们还要结合深度学习模型比如rnn,LSTM,seq2seq才行,所以我们首先来介绍一下如何使用时下最为流行的tensorflow模型实现一个简单的循环神...

ruc_wenwen 发表了文章 • 5 天前

0
推荐
84
浏览

【算法趣题】Q07 日期的二进制转换

写在前面【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。我只是想自己用python3来解题,锻炼自己的python能力。问题描述把年月日表示为YYYYMMDD这样的8位整数,然后把这...

简单的happy 发表了文章 • 2018-02-15 20:30

0
推荐
60
浏览

【算法趣题】Q06(改版)考拉慈猜想

写在前面【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。我只是想自己用python3来解题,锻炼自己的python能力。考拉慈猜想对自然数n循环执行如下操作。 n是偶数时,...

简单的happy 发表了文章 • 2018-02-15 20:02

1
推荐
134
浏览

麻(shi)雀(zhan)虽小,五脏俱全

                                                        &...

邬书豪 发表了文章 • 2018-02-14 13:24

0
投票
1
回答
161
浏览

python怎样操作360浏览器

ID王大伟 回复了问题 • 2018-02-13 23:22
条新动态, 点击查看
建议你尝试安装Twisted

可在cmd中用下载命令: python -m pip install Twisted 它是用Python实现的基于事件驱动的网络引擎框架。下载地址:

http://twistedmatrix.com/trac/wiki/Do... 显示全部 »
建议你尝试安装Twisted

可在cmd中用下载命令: python -m pip install Twisted 它是用Python实现的基于事件驱动的网络引擎框架。下载地址:

http://twistedmatrix.com/trac/wiki/Downloads
 
 
报错的很明显,没找到win32api,你要安装win32py,下载地址 : https://sourceforge.net/projects/pywin32/files/
 
具体安装步骤我博客有 Python网络爬虫(六)- Scrapy框架   里边有详... 显示全部 »
报错的很明显,没找到win32api,你要安装win32py,下载地址 : https://sourceforge.net/projects/pywin32/files/
 
具体安装步骤我博客有 Python网络爬虫(六)- Scrapy框架   里边有详细安装依赖包win32py的步骤
 
设置提取规则 对链接中新的链接进行内容采集   或者用yield返回新的链接再进行爬取
核心处理规则: from scrapy.spiders import CrawlSpider, Rule
核心处理提取: from scrapy.linkextrac... 显示全部 »
设置提取规则 对链接中新的链接进行内容采集   或者用yield返回新的链接再进行爬取
核心处理规则: from scrapy.spiders import CrawlSpider, Rule
核心处理提取: from scrapy.linkextractors import LinkExtractor
杜雨

杜雨 回答了问题 • 2018-01-31 23:56 • 2 个回复 不感兴趣

现在做大数据分析,R和Python那个更好?

赞同来自:

如果非要说做大数据分析的话,可能第一关要过hadoop、hive、hbase、spark这一关哈哈哈,然后才是R或者Python的选择问题~
如果非要说做大数据分析的话,可能第一关要过hadoop、hive、hbase、spark这一关哈哈哈,然后才是R或者Python的选择问题~
  r.status_code == ? 查看返回的状态码即可。
 
  r.status_code == ? 查看返回的状态码即可。
 
有专门的打码平台  你也可以用机器学习图像识别
有专门的打码平台  你也可以用机器学习图像识别
50744

查看你的pycharm使用的python版本是否是Anaconda的Python版本

 
50744

查看你的pycharm使用的python版本是否是Anaconda的Python版本

 
这里应该是Scrapy的依赖包没有安装  从你的报错信息应该是lxml有问题,如果还是不行那就不要使用mac自带的python环境,Scrapy需要一个C编译器和开发头文件,mac没有.怎么安装看文档或者问度娘,另外一种方法是你安装新的Python环境在新的环... 显示全部 »
这里应该是Scrapy的依赖包没有安装  从你的报错信息应该是lxml有问题,如果还是不行那就不要使用mac自带的python环境,Scrapy需要一个C编译器和开发头文件,mac没有.怎么安装看文档或者问度娘,另外一种方法是你安装新的Python环境在新的环境安装Scrapy,应该是没什么问题的。
有些url中一些数是开发人员迷惑别人的 其实没用 这里get方式传递过去的参数主要是页码 条件 如果你要采集北京二手房新房信息的话 后边那一串是没用的 你可以看下边两个链接 少了后边一长串返回的数据还是北京二手房新房信息 http://bj.58.com/er... 显示全部 »
有些url中一些数是开发人员迷惑别人的 其实没用 这里get方式传递过去的参数主要是页码 条件 如果你要采集北京二手房新房信息的话 后边那一串是没用的 你可以看下边两个链接 少了后边一长串返回的数据还是北京二手房新房信息 http://bj.58.com/ershoufang/pn2/?key=新房undefinedcmcskey=新房undefinedfinal=1undefinedjump=1undefinedspecialtype=glsundefined http://bj.58.com/ershoufang/pn2/?key=%E6%96%B0%E6%88%BFundefinedcmcskey=%E6%96%B0%E6%88%BFundefinedfinal=1undefinedjump=1undefinedspecialtype=glsundefinedPGTID=0d300000-0000-0780-0443-7b618e45d6cdundefinedClickID=1
没有设置环境变量的或者安装不完整
没有设置环境变量的或者安装不完整
许胜利

许胜利 回答了问题 • 2018-01-31 14:36 • 1 个回复 不感兴趣

为什么使用scrapy时有些第三方库无法找到?

赞同来自:

你的Python 环境变量设置的有问题 把Python环境和Python的包的也加进去
 
你的Python 环境变量设置的有问题 把Python环境和Python的包的也加进去
 
ID王大伟

ID王大伟 回答了问题 • 2018-02-03 21:35 • 1 个回复 不感兴趣

Mac终端idle更改了快捷键就打不开了?

赞同来自:

用jupyter notebook吧
用jupyter notebook吧
这就需要在你的代码中设计增量抓取。
代码中加入逻辑判断,如果是新更新的内容,就进行采集保存。如果历史数据,就pass。
这就需要在你的代码中设计增量抓取。
代码中加入逻辑判断,如果是新更新的内容,就进行采集保存。如果历史数据,就pass。
li052468

li052468 回答了问题 • 2018-02-05 12:48 • 1 个回复 不感兴趣

break跳出循环

赞同来自:

第一个的时候break在if外面,当num是15,i是2的时候,if是假,然后执行了break,退出了15的循环;第二个break在if里面,num是15,i是2的时候,if是假,然后i变成3重新if判断
第一个的时候break在if外面,当num是15,i是2的时候,if是假,然后执行了break,退出了15的循环;第二个break在if里面,num是15,i是2的时候,if是假,然后i变成3重新if判断
许胜利

许胜利 回答了问题 • 2018-02-05 10:05 • 1 个回复 不感兴趣

爬虫只能爬取到一条信息

赞同来自:

建议贴上网页结构或链接 不清楚你这个xpath写的是否合理
建议贴上网页结构或链接 不清楚你这个xpath写的是否合理
3
推荐
569
浏览

《人人都会数据分析》20万字电子版

去年的时间把之前的数据分析工作经历、大环境背景、职场选择、公司选择、岗位选择、统计学的基本常识、需要掌握的分析工具、怎么写好一个报告、互联网和金融行业的分析场景这些都整理了下。具体购买链接:https:/...

面包君 发表了文章 • 2018-01-03 15:15

5
推荐
394
浏览

《R的极客理想》系列图书作者张丹:用R语言把数据玩出花样

前言作为数据分析师,每天都有大量的数据需要处理,我们会根据业务的要求做各种复杂的报表,包括了分组、排序、过滤、转置、差分、填充、移动、合并、分裂、分布、去重、找重、填充 等等的操作。有时为了计算一个...

R语言中文社区 发表了文章 • 2017-09-28 09:59

4
推荐
595
浏览

Python简介

什么是Python Python是一种解释型的、 面向对象的带有动态语义的高级程序设计语言Python的诞生第1个Python编译器/解释器于1991年诞生 Python名称来自Guido挚爱的电视剧Monty Python's Flying Circ...

· 发表了文章 • 2017-09-19 10:26

7
推荐
695
浏览

拉勾网数据分析岗数据分析

简介:试着,做了一个拉勾网数据分析师职位的数据分析。其实,虽然很想做数据分析师,但是是跨行,心里相当忐忑,做这个分析就相当于加深自己对数据分析这个行业的了解了。思路大致思路起始数据来源本来是想自己...

wangtianshan 发表了文章 • 2017-08-23 12:51

5
推荐
1800
浏览

NLP从入门到喜欢之jieba分词器

前言好久没写文章了,前段时间在准备程序猿考试。我今天很认真,就不发表情了!说到做到!之前说好的二手房的数据分析也没能如期发出来,因为要查文献了解一下业务知识,所以还在进行中。最近迷上了NLP今天介绍一...

ID王大伟 发表了文章 • 2017-05-23 13:27

7
推荐
768
浏览

我爬了某宝上4000+网店只为了告诉你中国人最爱喝什么绿茶

作者:吴人链接:http://blog.csdn.net/liu_sn/article/details/72567476微信:1521172694求实习:本人明年3月份浙大硕士毕业,想找一份今年暑期的实习,若能推荐,不胜感激!著作权归作者所有。商业转载请联系作...

吴人beng越 发表了文章 • 2017-05-20 18:37

18
推荐
1658
浏览

为啥214被塞狗粮的单身汪,520还会被塞狗粮

马上就是520,又是一大波狗粮即将来袭,又是一片单身汪呼天抢地,又是一批《为什么优秀的男生都不追女生》这种直男癌YY文开始传播。套路如此熟悉,结果却依然相同:该单身的还在单身啊!到底是什么阻碍了单身汪们...

陈老师 发表了文章 • 2017-05-19 16:28

4
推荐
1275
浏览

使用Tornado+Redis维护ADSL拨号服务器代理池

我们尝试维护过一个免费的代理池,但是代理池效果用过就知道了,毕竟里面有大量免费代理,虽然这些代理是可用的,但是既然我们能刷到这个免费代理,别人也能呀,所以就导致这个代理同时被很多人使用来抓取网站,...

崔庆才 发表了文章 • 2017-05-19 14:48

1
推荐
596
浏览

数据分析,R还是Python?真的是个问题么?

R和Python作为数据分析的两大主流语言,究竟哪一个更好的争论不绝于耳。但对于两个语言都了解尝试过的小伙伴而言,结论其实非常简单:都好但都有不好。下面从几个方面聊聊我的看法。开发目的据我近期的观察了解,...

张土豆 发表了文章 • 2017-05-17 18:05

3
推荐
701
浏览

绪论:第一个机器学习样例

作为“绪论”的总结,我们来运用 Python 解决一个实际问题以对机器学习有具体的感受吧。由于该样例只是为了提供直观,我们就拿比较有名的一个小问题来进行阐述。俗话云:“麻雀虽小,五脏俱全”,我们完全可以通过这...

射命丸咲 发表了文章 • 2017-05-17 09:54

10
推荐
1229
浏览

数据分析师VS算命先生,除了算盘与键盘,还有啥差别?

想了解自己数据分析能力到了哪一层,戳{数据分析6个能力等级}想和大牛学更多思维方式,戳{和管理咨询顾问学思考}我们到底是在做预测还是算命 无论从各个层次,各个维度看,数据分析师和算命先生都有天渊之别...

陈老师 发表了文章 • 2017-05-16 16:32

1
推荐
601
浏览

【数据分析】员工奖金合理性分析

分析目的:根据20**年以来的奖金分配数据分析分公司员工奖金分配是否合理。分析结果:按月份不分分公司,从整体数据来看经理奖金与人均奖金符合y=2.2308x-308.81,且拟合度达到了0.981,即98.1%的数据符合两者的关...

w卫东 发表了文章 • 2017-05-12 17:47

8
推荐
887
浏览

数据分析师该这样霸气回应“0.00008的转化也很好”的谬论

活动做的好不好,到底谁说了算? “花费300万成本做促销推广,买了一堆KOL,淘宝广告,微博刷屏,最后转化率0.00008,也是极其成功的活动,原因有三:”“第一,花钱做社交媒体就是没转化的,这是常识”“第二,...

陈老师 发表了文章 • 2017-05-12 16:26

1
推荐
462
浏览

爬取百度音乐5000热门歌单10万音乐数据

平时喜欢用百度音乐随便找个歌单听听歌,一来搜索打开方便,二来歌曲曲目也全。今天在找歌单的时候,突然想看看热门歌单里都有哪里歌曲,于是便有了这个小程序。首先,需要获取各个歌单的地址,我们从百度音乐的...

州的先生 发表了文章 • 2017-05-12 14:46

0
推荐
266
浏览

【学习笔记】Python基础入门(四)

【学习笔记】Python基础入门(一)【学习笔记】Python基础入门(二)【学习笔记】Python基础入门(三)用于引用(绑定)对象的标识符语法变量名 = 对象(数值、表达式等)如计算圆面积pi = 3.14radius = 12.3area...

李亮辰 发表了文章 • 2017-05-12 14:10

0
投票
1
回答
56
浏览
0
投票
1
回答
161
浏览

python怎样操作360浏览器

ID王大伟 回复了问题 • 2018-02-13 23:22
0
投票
1
回答
140
浏览

如果参加课程,有老师回答问题嘛?

梁勇 回复了问题 • 2018-02-09 10:00
0
投票
3
已解决
267
浏览
0
投票
0
回答
157
浏览
0
投票
1
回答
141
浏览
0
投票
1
回答
155
浏览
0
投票
1
回答
69
浏览
0
投票
1
已解决
75
浏览

break跳出循环

li052468 回复了问题 • 2018-02-05 12:48
0
投票
1
已解决
78
浏览

爬虫只能爬取到一条信息

许胜利 回复了问题 • 2018-02-05 10:05
0
投票
1
回答
84
浏览
0
投票
1
已解决
117
浏览
0
推荐
84
浏览

【算法趣题】Q07 日期的二进制转换

写在前面【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。我只是想自己用python3来解题,锻炼自己的python能力。问题描述把年月日表示为YYYYMMDD这样的8位整数,然后把这...

简单的happy 发表了文章 • 2018-02-15 20:30

0
推荐
60
浏览

【算法趣题】Q06(改版)考拉慈猜想

写在前面【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。我只是想自己用python3来解题,锻炼自己的python能力。考拉慈猜想对自然数n循环执行如下操作。 n是偶数时,...

简单的happy 发表了文章 • 2018-02-15 20:02

2
推荐
140
浏览

【算法趣题】Q05 还在用现金支付吗?——>店铺红包免费购物

写在前面【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。我只是想自己用python3来解题,锻炼自己的python能力。问题描述书中的例子是以安置在公交上的零钱兑换机为背景,...

简单的happy 发表了文章 • 2018-02-11 22:13

2
推荐
63
浏览

【算法趣题】Q04 切分木棒

写在前面【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。我只是想自己用python3来解题,锻炼自己的python能力。问题描述假设要把长度为n厘米的木棒切分为1厘米长的小段,...

简单的happy 发表了文章 • 2018-02-10 14:33

10
推荐
1197
浏览

转行数据科学路上看过的一些书总结推荐

前言这些书的看书周期大概有一年半吧一年半前决定转行数据科学之前写过一篇:回顾与展望转行数据科学路上的点点滴滴(2016-2018)深知转行学习的痛苦,入门踩过很多坑,所以写了Python入门连载,还录制了免费视频...

ID王大伟 发表了文章 • 2018-02-07 13:22

6
推荐
271
浏览

Python可以做哪些好玩的事之将喜欢的博客整理成pdf

最近在学习ETL,于是在天善关键词搜索,光看目录就已经觉得很牛逼了~ <数据仓库设计、ETL设计框架>等等。作为一个爱学习的人,看到这么多有内涵的博客,当然想学习新技能(flag+1),但是我更习惯在手机上浏...

许胜利 发表了文章 • 2018-02-05 19:52

2
推荐
467
浏览

Python数据结构与算法刷题(5)——回文串

前言前文传送门:Python数据结构与算法刷题(1)——害死人不偿命的(3n+1)猜想Python数据结构与算法刷题(2)——挖掘机技术哪家强Python数据结构与算法刷题(3)——跟奥巴马一起学编程Python数据结构与算法刷题(4...

ID王大伟 发表了文章 • 2018-01-31 20:53

2
推荐
125
浏览

Python 爬取数据并保存到Oracle数据库

环境win7  Python 3.6   工具PyCharm2017直接命令 pip install cx_Oracle导入cx_Oracleimport cx_Oracle 1.Python连接数据库 写法有多种 百度很多try: tns = cx_Oracle.makedsn('localhost','1...

黄金阳 发表了文章 • 2018-01-29 18:02

2
推荐
250
浏览

【算法趣题】 Q03 翻牌

写在前面【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。我只是想自己用python3来解题,锻炼自己的python能力。问题描述有100张写着数字1~100的牌,并按顺序排列着。最开...

简单的happy 发表了文章 • 2018-01-28 23:03

13
推荐
1253
浏览

回顾与展望转行数据科学路上的点点滴滴(2016-2018)

大家好,我叫王大伟,热爱数据科学。转行之前的迷茫这个故事很长,请自备花生米和瓜子,故事要从2016年9月说起,那时候我大四,差一名保研成功,也就是说得考研才能读研究生。当时也没想过转行,还在读我的过程装...

ID王大伟 发表了文章 • 2018-01-28 16:45

1
推荐
480
浏览

Python数据结构与算法刷题(4)——D进制的A+B

前言前文传送门:Python数据结构与算法刷题(1)——害死人不偿命的(3n+1)猜想Python数据结构与算法刷题(2)——挖掘机技术哪家强Python数据结构与算法刷题(3)——跟奥巴马一起学编程正文输入两个非负10进制整数A...

ID王大伟 发表了文章 • 2018-01-28 13:42

2
推荐
363
浏览

Python数据结构与算法刷题(3)——跟奥巴马一起学编程

前言前文传送门:Python数据结构与算法刷题(1)——害死人不偿命的(3n+1)猜想Python数据结构与算法刷题(2)——挖掘机技术哪家强正文美国总统奥巴马不仅呼吁所有人都学习编程,甚至以身作则编写代码,成为美国历...

ID王大伟 发表了文章 • 2018-01-27 23:53

3
推荐
427
浏览

Python数据结构与算法刷题(2)——挖掘机技术哪家强

前言前文传送门:Python数据结构与算法刷题(1)——害死人不偿命的(3n+1)猜想正文为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛。现请你根据比赛结果统计出技术最强的那个学校。输入格式:...

ID王大伟 发表了文章 • 2018-01-27 00:33

3
推荐
439
浏览

Python数据结构与算法刷题(1)——害死人不偿命的(3n+1)猜想

前言其实想写Python数据结构算法文章很久了,相信很多读到这里的小伙伴还是在校学生,要面临校招。不管你是数据分析、数据挖掘还是机器学习,基本上都逃不过笔试数据结构算法大题。而国内关于Python的数据结构算...

ID王大伟 发表了文章 • 2018-01-26 12:52

3
推荐
400
浏览

一个Python Web工程师的面试总结

本文获得原作者授权转载作者:AyoCross文章来源:http://blog.csdn.net/AyoCross/article/details/565098401,个人情况先介绍下我的情况:通信背景,工作一年多不到两年。之前一直在做C++的MFC软件界面开发工作,...

菜鸟学Python 发表了文章 • 2018-01-25 10:57

  Python 是一种面向对象的解释型计算机程序设计语言,在设计中注重代码的可读性,同时也是一种功能强大的通用型语言。