张俊红的博客专栏

数据分析路上的学习者和实践者,与你分享我的所见,所学、所想

0
推荐
1375
阅读

带你走进网站分析的世界!

                                                                                   &nbs...

发表了文章 • 2017-03-23 13:44 • 0 条评论

0
推荐
1261
阅读

数据分析学习笔记——数据可视化

你有什么数据关于可视化,人们一般的理解是先设想要达到的可视化效果,然后在去寻找相应的数据。这样经常会造成:“现有的数据不能够做出事先设想的可视化效果,或者是想要制作理想的图表需要获取更多的数据。”而实际上关于可视化的步骤应该是先认清你有什么数据。为了更好的进行可视化,我们将数据分为分类数据、时序数...

发表了文章 • 2017-03-23 13:25 • 0 条评论

0
推荐
1177
阅读

一些算法的总结

算法目的:分类、预测算法分类:监督型、非监督型算法的核心:你有什么数据、你要解决什么问题01|线性回归:1、什么是回归回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。2、回归算法根据给予的训练集训练出一定的回归模型(即找出最佳回归直线 ),...

发表了文章 • 2017-03-23 11:26 • 0 条评论

0
推荐
1360
阅读

python数据分析学习笔记—python基础知识

python数据分析学习笔记系列——基础知识篇总第44篇基本概念 1、数在Python中有4种类型的数——整数、长整数、浮点数和复数。一般我们默认只使用整数—int;浮点数—float两种。可以用type(object)来检测一个数是什么类型的。>>> type(4)<class 'int'> 2、变量变量就是我们想要的东西——它们的值可...

发表了文章 • 2017-03-22 13:46 • 0 条评论

1
推荐
1333
阅读

python数据分析笔记——数据加载与整理

                                                             数据加载 导入文本数据               ...

发表了文章 • 2017-03-22 13:20 • 0 条评论

0
推荐
1725
阅读

Python数据分析笔记——Numpy、Pandas库

利用Python进行数据分析中有两个重要的库是Numpy和Pandas,本章将围绕这两个库进行展开介绍。Numpy库                                              Numpy最重要的一个特点是就是其N维数组...

发表了文章 • 2017-03-22 13:04 • 0 条评论

1
推荐
1386
阅读

数据分析系列——SQL数据库

 创建数据库使用数据库时第一步就是要创建数据库,SQL中的数据库通常由数据文件和事务日志组成,一个数据库可以有一到多个数据文件和事务日志组成。数据文件就是存储数据的地方,而事务日志是用来记录存储记录存储数据的时间和操作的。数据文件的扩展名是.mdf,而事务日志文件的扩展名是.ldf。1、创建数据库的语法...

发表了文章 • 2017-03-22 12:47 • 0 条评论

0
推荐
1344
阅读

关于数据分析:你想知道的都在这里!

本篇学习整理笔记来源于:简书@功彬eleven、《谁说菜鸟不会数据分析》、公众号:杜王丹、公众号:数据分析。在原作者的基础上进行整理分类,将本篇分为:数据分析的概念、做数据分析的原因、数据分析的作用、数据分析的逻辑、数据分析的方法、数据分析流程、数据分析的误区、专业数据分析的能力要求、数据分析的职业发展...

发表了文章 • 2017-03-21 21:16 • 0 条评论

3
推荐
1543
阅读

泰坦尼克号幸存率研究

import pandas as pdimport numpy as npimport matplotlibimport matplotlib.pyplot as plt%matplotlib inline#为能够jupyter在线使用matplotlib  df=pd.read_csv('C:\\Users\\dell\\Desktop\\titanic_data.csv')df.head(5)#先显示出前5行,观察有哪些数据数据概况:PassengerId:乘客序号;Survived:最终是否存活...

发表了文章 • 2017-03-21 21:12 • 0 条评论