Python

Python

0
推荐
15
浏览

2018年 九大改变世界的技术趋势

技术的世界正在爆炸式发展,“日新月异”不再是一个修辞,而是正在发生的现实。在这其中,有一些发展趋势注定要改变世界,改变我们的生活方式。在此,我们借鉴美国大数据专家Bernard Marr的观点,为大家介绍2018...

数据观 发表了文章 • 7 小时前

0
推荐
15
浏览

一元(多元)线性回归分析之Excel实现

作者简介okajun个人博客:https://ask.hellobi.com/blog/okajun工作中最常用、最简单的估计就是一元(多元)线性回归分析了,比如预测销量等,今天来分享一下Excel的实现方法。1. 一元线性回归先说一元:使用R语...

R语言中文社区 发表了文章 • 8 小时前

0
推荐
12
浏览

基于Spark ALS算法的个性化推荐(仅需三行代码)

今天来使用spark中的ALS算法做一个小推荐。需要数据的话可以点击查看初识sparklyr—电影数据分析,在文末点击阅读原文即可获取。其实在R中还有一个包可以做推荐,那就是recommenderlab。如果数据量不大的时候可以...

王亨 发表了文章 • 10 小时前

1
推荐
17
浏览

为jupyter_notebook增加目录

前言jupyter_notebook是数据相关岗位从业者的一个不错的选择,很清晰、很方便,可以将分析过程和分析结果同步显示在一起。但是有的时候随着你的分析增多,你的代码就会变得很长,这个时候就需要目录这样的功能,...

张俊红 发表了文章 • 13 小时前

1
推荐
18
浏览

Python学习笔记:字典分组函数 itertools.groupby() 的用法

问题:假设我们有如下字典数据,我们想根据date字段来进行分组并且迭代访问,这时要怎么做呢?解决方法:itertools.groupby() 函数正好可以满足我们的需求,我们首先按照对date字段进行排序,然后调用 itert...

扶七 发表了文章 • 14 小时前

1
推荐
25
浏览

Python学习笔记:对字典进行快速排序

 itemgetter 函数:我们有一个字典列表,想根据某个字段进行排序,这时我们可以使用 operator 模块的 itemgetter 函数。举例:1、我们想根据下面字典中的fname 字段进行排序,这时我们可以这么写:2、i...

扶七 发表了文章 • 1 天前

0
推荐
18
浏览

Python学习笔记:collections.Counter 类的用法

collections.Counter 描述:计算序列中出现次数最多的元素示例:1、查找出现频率最高的3个单词2、查找某个单词出的次数:

扶七 发表了文章 • 1 天前

0
推荐
16
浏览

Python学习笔记:slice 切片函数

函数的作用:slice() 函数实现切片对象,主要用在切片操作函数里的参数传递。函数的使用:截取下标2到3的元素。

扶七 发表了文章 • 1 天前

1
推荐
23
浏览

使用Python爬取天猫店铺联系方式|思路与方法 ​

1、获取商家信息很多初创公司为了获得客户资源,通常会有大量的可拜访客户信息的需求。如果是在以前,那么可以通过查看黄页上的企业信息数据,获得企业的联系方式,从而联系上企业负责人得以亲自拜访,获得业务上...

州的先生 发表了文章 • 1 天前

1
推荐
25
浏览

Python数据科学(八)- 资料探索与资料视觉化

传送门:Python数据科学(一)- python与数据科学应用(Ⅰ)Python数据科学(二)- python与数据科学应用(Ⅱ)Python数据科学(三)- python与数据科学应用(Ⅲ)Python数据科学(四)- 数据收集系列Python数据科学...

许胜利 发表了文章 • 1 天前

0
推荐
37
浏览

R语言实现统计分析——非参数假设检验

作者:糖甜甜甜 公众号:经管人学数据分析往期回顾:词云一分钟了解周董的歌词非参数检验是指总体不服从正态分布,且分布情况不明时,用来检验数据是否来自同一个总体假设等一类检验方法。非参数检验通常是...

R语言中文社区 发表了文章 • 1 天前

1
推荐
43
浏览

【译】如何使用Python debugger

作者:Zygmunt Z来源:FastML参与:Cynthia翻译:本文为天善智能编译,未经容许,禁止转载在编写代码时,每个人都会犯错误。有时很难调试它们。使用调试器可能有所帮助,但也可能令人生畏。本文是在IPython中使用...

sw_Yang 发表了文章 • 1 天前

1
推荐
38
浏览

Flask前端页面使用column_property调用rownumber函数显示行号

今天碰到一个需求,页面上需要显示一个行号,程序是使用Flask写的.我使用PostgresSQL数据库,开始我想就建一个view create view view01 as  SELECT row_number() OVER (ORDER BY col1) AS rownum, ..... --然...

seng 发表了文章 • 1 天前

0
推荐
49
浏览

小微企业的福音,大道至简的办公化BI

请点击此处输入图片描述还记得上次小麦跟大家聊的SaaS BI吗?详情见文章《无需浏览器 ,这样的SaaS BI,你喜欢吗?》,小微企业等轻量级BI用户一直被商业智能BI应用所“排挤”,硬件环境跟不上、人才跟不上,想想真...

大麦 发表了文章 • 1 天前

1
推荐
41
浏览

五个步骤,搭建企业的“大数据视野”

大数据时代,大多数企业都对大数据寄予厚望。通过数据分析,企业既能够实现危机预警,也能做到洞察先机。但是,企业规模不同、数据应用的成熟度不同,大数据技术的发展更是一日千里。俗话说,“一口气吃不成胖...

数据观 发表了文章 • 2 天前

条新动态, 点击查看
这就需要在你的代码中设计增量抓取。
代码中加入逻辑判断,如果是新更新的内容,就进行采集保存。如果历史数据,就pass。
这就需要在你的代码中设计增量抓取。
代码中加入逻辑判断,如果是新更新的内容,就进行采集保存。如果历史数据,就pass。
ID王大伟

ID王大伟 回答了问题 • 2018-03-21 19:54 • 1 个回复 不感兴趣

python多线程返回值调用

赞同来自:

http://cache.baiducontent.com/c?m=9d78d513d9850aed0ffa950e5a56973b594381132bd6a3027fa5d00fce220c564616f4bc533511748785213816ae394b... 显示全部 »
http://cache.baiducontent.com/c?m=9d78d513d9850aed0ffa950e5a56973b594381132bd6a3027fa5d00fce220c564616f4bc533511748785213816ae394bed84217347536bf1cc899f4aacac9259388957633a5ed11054844fb8cb37758a66c71bfde859b9b5aa74d5ec93c4de274ed7124329d1a9d61e57549e31ad5126e3d1c8154a4253fdba7123a4042b6882224bb045fce1306c1adfab880710d42aa63a4d80af43f46545f004a4695d7305e60da608277763a70e7ca3112a04e4ad16a57d2e0063eb08a4b9b7f5ac15ca8bfd31eeae8bf27082609095a1bf260367528c72f4e9eae37b331315d9bc8e5d8265fdedeccc17b503d7660ae20e2a&p=9c6cc54ad6c340b50fa4822d021481&newp=aa67c64ad48111a058ed953c4659c6231610db2151d7db176b82c825d7331b001c3bbfb423251102d7c3796004ad4259eff53c733d0523a3dda5c91d9fb4c57479ca&user=baidu&fm=sc&query=TypeError%3A+quote%5Ffrom%5Fbytes%28%29+expected+bytes&qid=cd53b35400074357&p1=2
可以看看这个https://www.cnblogs.com/Lands-ljk/p/5447723.html
可以看看这个https://www.cnblogs.com/Lands-ljk/p/5447723.html
ID王大伟

ID王大伟 回答了问题 • 2018-03-28 23:37 • 2 个回复 不感兴趣

人工智能学习规划

赞同来自:

如果你具备了基础  你应该找一个方向深入学习  
目前Python学习较多的方向有:数据分析挖掘,机器学习,深度学习,自然语言处理,网络爬虫,计算机视觉,web开发等
如果你具备了基础  你应该找一个方向深入学习  
目前Python学习较多的方向有:数据分析挖掘,机器学习,深度学习,自然语言处理,网络爬虫,计算机视觉,web开发等
建议通过下载对应的wheel  3.8版本的lxml wheel  文件安装 【和Python版本对应的】
[list]
安装wheel插件 : python -m pip install wheel
[*]根据下载的本地文件安装lxml:切换到whl文... 显示全部 »
建议通过下载对应的wheel  3.8版本的lxml wheel  文件安装 【和Python版本对应的】
[list]
安装wheel插件 : python -m pip install wheel
[*]根据下载的本地文件安装lxml:切换到whl文件所在的路径,进行安装 python -m pip install lxml-3.8.0-cp27-none-win32.whl

注意:wheel名一定要跟pip支持的文件名和版本符合
 
详情见  Python网络爬虫(四)- XPath(lxml的安装)
Python可以正常import自定义的包 import 自定义的包时注意以下几点即可

不要和内置模块重名
路径一定要写对

至于__init__.py这个文件是否必要,我觉得有的话更规范,为空也没问题,但是如果没有,路径只要写对,也可以正常使用... 显示全部 »
Python可以正常import自定义的包 import 自定义的包时注意以下几点即可

不要和内置模块重名
路径一定要写对

至于__init__.py这个文件是否必要,我觉得有的话更规范,为空也没问题,但是如果没有,路径只要写对,也可以正常使用。
ID王大伟

ID王大伟 回答了问题 • 2018-04-09 14:06 • 1 个回复 不感兴趣

爬取糗事百科

赞同来自:

因为部分或者全部编码是拉丁的编码结构   而你使用utf8解码  所以抛出异常
因为部分或者全部编码是拉丁的编码结构   而你使用utf8解码  所以抛出异常
许胜利

许胜利 回答了问题 • 2018-04-04 10:26 • 1 个回复 不感兴趣

为什么在pycharm里面不能用pip

赞同来自:

在pycharm打开终端可正常使用pip。
在pycharm打开终端可正常使用pip。
许胜利

许胜利 回答了问题 • 2018-04-08 08:56 • 1 个回复 不感兴趣

安装scrapy 请大神指导

赞同来自:

可以参考  Scrapy框架   的安装
可以参考  Scrapy框架   的安装
ID王大伟

ID王大伟 回答了问题 • 2018-04-09 14:05 • 1 个回复 不感兴趣

numpy 计算矩阵特征值为什么会出现复数呢

赞同来自:

只有对称方阵的特征根才全是实数, 非对称方阵特征根一般是复数
 
只有对称方阵的特征根才全是实数, 非对称方阵特征根一般是复数
 
一种是设置一个类别变动数量,当继续迭代时,分类变化的样本小于这个值,就可以认为是ok了
一种是设置一个类别变动数量,当继续迭代时,分类变化的样本小于这个值,就可以认为是ok了
网页有些数据是通过ajax加载的,这样可能出现抓出来的内容和html源代码
网页有些数据是通过ajax加载的,这样可能出现抓出来的内容和html源代码
扶七

扶七 回答了问题 • 2018-04-20 10:33 • 4 个回复 不感兴趣

PyCharm连接mysql有错误

赞同来自:

1.首先确定输入的账户和密码是正确的 
2.确定输入的host是否正确
3.确认网络是否是通的
4.防火墙端口3306打开(这是MySQL的端口)
5.确认是否安装mysql
1.首先确定输入的账户和密码是正确的 
2.确定输入的host是否正确
3.确认网络是否是通的
4.防火墙端口3306打开(这是MySQL的端口)
5.确认是否安装mysql
ID王大伟

ID王大伟 回答了问题 • 2018-04-27 18:26 • 3 个回复 不感兴趣

python导入文本

赞同来自:

可以试试
ti=pds.read_table("C:/Users/My/Desktop/1.txt",encoding='gbk)
可以试试
ti=pds.read_table("C:/Users/My/Desktop/1.txt",encoding='gbk)
如果是用 read_csv( ) 函数的话,注意一下文件的列与列之间的分隔符,默认是逗号,如果不是逗号的话,使用 sep 参数指定分割符。从结果来看,列与列之间的分隔符是制表符 \t,所以 read_csv ( ) 函数里要有 sep = '\t' 这个参数
如果是用 read_csv( ) 函数的话,注意一下文件的列与列之间的分隔符,默认是逗号,如果不是逗号的话,使用 sep 参数指定分割符。从结果来看,列与列之间的分隔符是制表符 \t,所以 read_csv ( ) 函数里要有 sep = '\t' 这个参数
0
推荐
228
浏览

淘宝童装市场儿童内衣裤子类目市场分析简报·第十九期

    本篇分析报告主要是针对淘宝市场2018年儿童内衣裤类目在春季的热卖属性进行分析,消费者人群的基本特征以及洞察消费者在给宝宝购买内衣裤时更关注哪方面的信息,围绕这三个方面的内容进行详细...

零一老师 发表了文章 • 2018-01-25 09:55

3
推荐
790
浏览

《人人都会数据分析》20万字电子版

去年的时间把之前的数据分析工作经历、大环境背景、职场选择、公司选择、岗位选择、统计学的基本常识、需要掌握的分析工具、怎么写好一个报告、互联网和金融行业的分析场景这些都整理了下。具体购买链接:https:/...

面包君 发表了文章 • 2018-01-03 15:15

5
推荐
556
浏览

《R的极客理想》系列图书作者张丹:用R语言把数据玩出花样

前言作为数据分析师,每天都有大量的数据需要处理,我们会根据业务的要求做各种复杂的报表,包括了分组、排序、过滤、转置、差分、填充、移动、合并、分裂、分布、去重、找重、填充 等等的操作。有时为了计算一个...

R语言中文社区 发表了文章 • 2017-09-28 09:59

4
推荐
805
浏览

Python简介

什么是Python Python是一种解释型的、 面向对象的带有动态语义的高级程序设计语言Python的诞生第1个Python编译器/解释器于1991年诞生 Python名称来自Guido挚爱的电视剧Monty Python's Flying Circ...

· 发表了文章 • 2017-09-19 10:26

7
推荐
924
浏览

拉勾网数据分析岗数据分析

简介:试着,做了一个拉勾网数据分析师职位的数据分析。其实,虽然很想做数据分析师,但是是跨行,心里相当忐忑,做这个分析就相当于加深自己对数据分析这个行业的了解了。思路大致思路起始数据来源本来是想自己...

wangtianshan 发表了文章 • 2017-08-23 12:51

6
推荐
2284
浏览

NLP从入门到喜欢之jieba分词器

前言好久没写文章了,前段时间在准备程序猿考试。我今天很认真,就不发表情了!说到做到!之前说好的二手房的数据分析也没能如期发出来,因为要查文献了解一下业务知识,所以还在进行中。最近迷上了NLP今天介绍一...

ID王大伟 发表了文章 • 2017-05-23 13:27

7
推荐
955
浏览

我爬了某宝上4000+网店只为了告诉你中国人最爱喝什么绿茶

作者:吴人链接:http://blog.csdn.net/liu_sn/article/details/72567476微信:1521172694求实习:本人明年3月份浙大硕士毕业,想找一份今年暑期的实习,若能推荐,不胜感激!著作权归作者所有。商业转载请联系作...

吴人beng越 发表了文章 • 2017-05-20 18:37

18
推荐
1767
浏览

为啥214被塞狗粮的单身汪,520还会被塞狗粮

马上就是520,又是一大波狗粮即将来袭,又是一片单身汪呼天抢地,又是一批《为什么优秀的男生都不追女生》这种直男癌YY文开始传播。套路如此熟悉,结果却依然相同:该单身的还在单身啊!到底是什么阻碍了单身汪们...

陈老师 发表了文章 • 2017-05-19 16:28

4
推荐
1577
浏览

使用Tornado+Redis维护ADSL拨号服务器代理池

我们尝试维护过一个免费的代理池,但是代理池效果用过就知道了,毕竟里面有大量免费代理,虽然这些代理是可用的,但是既然我们能刷到这个免费代理,别人也能呀,所以就导致这个代理同时被很多人使用来抓取网站,...

崔庆才 发表了文章 • 2017-05-19 14:48

1
推荐
750
浏览

数据分析,R还是Python?真的是个问题么?

R和Python作为数据分析的两大主流语言,究竟哪一个更好的争论不绝于耳。但对于两个语言都了解尝试过的小伙伴而言,结论其实非常简单:都好但都有不好。下面从几个方面聊聊我的看法。开发目的据我近期的观察了解,...

张土豆 发表了文章 • 2017-05-17 18:05

3
推荐
816
浏览

绪论:第一个机器学习样例

作为“绪论”的总结,我们来运用 Python 解决一个实际问题以对机器学习有具体的感受吧。由于该样例只是为了提供直观,我们就拿比较有名的一个小问题来进行阐述。俗话云:“麻雀虽小,五脏俱全”,我们完全可以通过这...

射命丸咲 发表了文章 • 2017-05-17 09:54

10
推荐
1359
浏览

数据分析师VS算命先生,除了算盘与键盘,还有啥差别?

想了解自己数据分析能力到了哪一层,戳{数据分析6个能力等级}想和大牛学更多思维方式,戳{和管理咨询顾问学思考}我们到底是在做预测还是算命 无论从各个层次,各个维度看,数据分析师和算命先生都有天渊之别...

陈老师 发表了文章 • 2017-05-16 16:32

1
推荐
714
浏览

【数据分析】员工奖金合理性分析

分析目的:根据20**年以来的奖金分配数据分析分公司员工奖金分配是否合理。分析结果:按月份不分分公司,从整体数据来看经理奖金与人均奖金符合y=2.2308x-308.81,且拟合度达到了0.981,即98.1%的数据符合两者的关...

w卫东 发表了文章 • 2017-05-12 17:47

8
推荐
988
浏览

数据分析师该这样霸气回应“0.00008的转化也很好”的谬论

活动做的好不好,到底谁说了算? “花费300万成本做促销推广,买了一堆KOL,淘宝广告,微博刷屏,最后转化率0.00008,也是极其成功的活动,原因有三:”“第一,花钱做社交媒体就是没转化的,这是常识”“第二,...

陈老师 发表了文章 • 2017-05-12 16:26

1
推荐
547
浏览

爬取百度音乐5000热门歌单10万音乐数据

平时喜欢用百度音乐随便找个歌单听听歌,一来搜索打开方便,二来歌曲曲目也全。今天在找歌单的时候,突然想看看热门歌单里都有哪里歌曲,于是便有了这个小程序。首先,需要获取各个歌单的地址,我们从百度音乐的...

州的先生 发表了文章 • 2017-05-12 14:46

0
投票
2
回答
61
浏览
0
投票
0
回答
45
浏览
0
投票
1
已解决
70
浏览
0
投票
0
回答
58
浏览
0
投票
0
回答
67
浏览
0
投票
0
回答
77
浏览
0
投票
2
回答
132
浏览

Python 文本挖掘

cdn007 回复了问题 • 2018-05-02 10:00
0
投票
0
回答
57
浏览

为什么有的图片返回的是403

spiller 发起了问题 • 2018-04-30 19:50
0
投票
1
回答
84
浏览
0
投票
0
回答
66
浏览
0
投票
3
已解决
117
浏览

python导入文本

ID王大伟 回复了问题 • 2018-04-27 18:26
1
推荐
17
浏览

为jupyter_notebook增加目录

前言jupyter_notebook是数据相关岗位从业者的一个不错的选择,很清晰、很方便,可以将分析过程和分析结果同步显示在一起。但是有的时候随着你的分析增多,你的代码就会变得很长,这个时候就需要目录这样的功能,...

张俊红 发表了文章 • 13 小时前

1
推荐
18
浏览

Python学习笔记:字典分组函数 itertools.groupby() 的用法

问题:假设我们有如下字典数据,我们想根据date字段来进行分组并且迭代访问,这时要怎么做呢?解决方法:itertools.groupby() 函数正好可以满足我们的需求,我们首先按照对date字段进行排序,然后调用 itert...

扶七 发表了文章 • 14 小时前

1
推荐
25
浏览

Python学习笔记:对字典进行快速排序

 itemgetter 函数:我们有一个字典列表,想根据某个字段进行排序,这时我们可以使用 operator 模块的 itemgetter 函数。举例:1、我们想根据下面字典中的fname 字段进行排序,这时我们可以这么写:2、i...

扶七 发表了文章 • 1 天前

0
推荐
18
浏览

Python学习笔记:collections.Counter 类的用法

collections.Counter 描述:计算序列中出现次数最多的元素示例:1、查找出现频率最高的3个单词2、查找某个单词出的次数:

扶七 发表了文章 • 1 天前

0
推荐
16
浏览

Python学习笔记:slice 切片函数

函数的作用:slice() 函数实现切片对象,主要用在切片操作函数里的参数传递。函数的使用:截取下标2到3的元素。

扶七 发表了文章 • 1 天前

1
推荐
23
浏览

使用Python爬取天猫店铺联系方式|思路与方法 ​

1、获取商家信息很多初创公司为了获得客户资源,通常会有大量的可拜访客户信息的需求。如果是在以前,那么可以通过查看黄页上的企业信息数据,获得企业的联系方式,从而联系上企业负责人得以亲自拜访,获得业务上...

州的先生 发表了文章 • 1 天前

1
推荐
25
浏览

Python数据科学(八)- 资料探索与资料视觉化

传送门:Python数据科学(一)- python与数据科学应用(Ⅰ)Python数据科学(二)- python与数据科学应用(Ⅱ)Python数据科学(三)- python与数据科学应用(Ⅲ)Python数据科学(四)- 数据收集系列Python数据科学...

许胜利 发表了文章 • 1 天前

1
推荐
43
浏览

【译】如何使用Python debugger

作者:Zygmunt Z来源:FastML参与:Cynthia翻译:本文为天善智能编译,未经容许,禁止转载在编写代码时,每个人都会犯错误。有时很难调试它们。使用调试器可能有所帮助,但也可能令人生畏。本文是在IPython中使用...

sw_Yang 发表了文章 • 1 天前

1
推荐
38
浏览

Flask前端页面使用column_property调用rownumber函数显示行号

今天碰到一个需求,页面上需要显示一个行号,程序是使用Flask写的.我使用PostgresSQL数据库,开始我想就建一个view create view view01 as  SELECT row_number() OVER (ORDER BY col1) AS rownum, ..... --然...

seng 发表了文章 • 1 天前

0
推荐
54
浏览

数据城堡参赛代码实战篇(四)---使用pandas合并数据表

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(三)---使用pandas合并数据表 数据城堡参赛代码实战篇(二)---使用pandas进行数据去重 数据城堡参赛代码实战篇...

Python爱好者社区 发表了文章 • 2 天前

2
推荐
146
浏览

【算法趣题】Q14 世界杯参赛国的国名接龙

引言【算法趣题】是来自图灵程序设计丛书绝云译的《程序员的算法趣题》,书中是用Ruby实现的。这里是用python来实现。问题描述FIFA世界杯对足球爱好者而言是四年一次的盛事。下面我们拿2014年世界杯参赛国的国名...

_缘君_ 发表了文章 • 4 天前

1
推荐
79
浏览

Python模块smtplib让群发邮件变得简单

1.smtplib模块介绍SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。Python创建 SMTP 对象语法如下:import smtplib smtpOb...

许胜利 发表了文章 • 6 天前

0
推荐
76
浏览

数据城堡参赛代码实战篇(三)---使用pandas合并数据表

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(一)---手把手教你使用pandas数据城堡参赛代码实战篇(二)---使用pandas进行数据去重关注Python爱好者社区,回复"数据代码...

Python爱好者社区 发表了文章 • 6 天前

2
推荐
138
浏览

如何入手数据科学竞赛——以kaggle为例

一些初学者会犹豫要不要参加 Kaggle 竞赛,这并不让人奇怪,他们通常有以下顾虑:我该如何开始?我要和经验丰富的博士研究者比赛吗?如果没有获胜的机会,还值得参与吗?这就是数据科学吗?(如果我在 Kaggle 上...

Python爱好者社区 发表了文章 • 2018-05-16 15:44

1
推荐
123
浏览

【译】利用Python进行机器学习:简单强劲的非线性数据处理办法

作者:Tirthajyoti Sarkar来源:codementor参与:Cynthia、大伟、周剑翻译:本文为天善智能编译,未经容许,禁止转载 利用Python库,管道特性以及正则化建立简单且强效的非线性数据模型。非线性数据模型是数...

sw_Yang 发表了文章 • 2018-05-16 11:21

  Python 是一种面向对象的解释型计算机程序设计语言,在设计中注重代码的可读性,同时也是一种功能强大的通用型语言。