数据

数据

0
推荐
85
浏览

pandas札记10_数据清洗工作

数据处理之前需要对数据进行清理工作,包含:缺失值的去除drop缺失值的填充fillna删除重复数据duplicated()和drop_duplicates()数据转换索引重命名数据离散化或面元化缺失值的去除pandas处理缺失值pandas默认的处...

皮大大 发表了文章 • 2019-08-02 14:55

0
推荐
118
浏览

MySQL札记7_DML(数据操作语言)

DML,data manipulation language,数据操作语言, 主要是对数据库中的表记录进行操作的语言,包含表中插入数据、表中数据的更新、表的删除等:表中插入数据表中数据更新删除表复习DDL创建表在对表中的数据进行操...

皮大大 发表了文章 • 2019-07-31 22:42

0
推荐
143
浏览

如何建立数据驱动文化

是什么驱使企业建立成功的数据驱动文化?未必是数据本身。这是次要的。技术本身排在第三位。数据驱动决策才是第一位的。在向实施数据运维的数据驱动企业转变时,最重要也是最困难的是向数据心态的文化转变。这种...

大麦 发表了文章 • 2019-07-22 16:10

0
推荐
136
浏览

关于产品、数据和人才的8条经验

引言:这是一篇经验帖,作者 Daniel Shenfeld 曾在 12 家创业公司工作过,这些公司覆盖金融科技、医疗、教育技术、生物技术等多个领域,所处的阶段也各有不同,从种子前(pre-seed)到收购后都有。Daniel 在不同...

大麦 发表了文章 • 2019-07-05 11:02

0
推荐
144
浏览

Python3.6内置函数(18)——enumerate()

英文文档enumerate(iterable, start=0)Return an enumerate object. iterable must be a sequence, an iterator, or some other object which supports iteration. The __next__() method of the iterator return...

Airy 发表了文章 • 2019-06-30 23:45

0
推荐
160
浏览

Python3.6内置函数(17)——divmod()

英文文档Take two (non complex) numbers as arguments and return a pair of numbers consisting of their quotient and remainder when using integer division. With mixed operand types, the rules for bina...

Airy 发表了文章 • 2019-06-30 23:44

0
推荐
140
浏览

Python3.6内置函数(16)——dir()

英文文档dir([object])Without arguments, return the list of names in the current local scope. With an argument, attempt to return a list of valid attributes for that object.If the object has a metho...

Airy 发表了文章 • 2019-06-30 23:43

0
推荐
168
浏览

Python3.6内置函数(15)——dict()

英文文档class dict(**kwarg)class dict(mapping, **kwarg)class dict(iterable, **kwarg)Create a new dictionary. The dict object is the dictionary class. See dict and Mapping Types — dict for documenta...

Airy 发表了文章 • 2019-06-29 15:42

0
推荐
157
浏览

Python3.6内置函数(14)——delattr()

英文文档delattr(object, name)This is a relative of setattr(). The arguments are an object and a string. The string must be the name of one of the object’s attributes. The function deletes the named...

Airy 发表了文章 • 2019-06-29 15:34

0
推荐
167
浏览

Python3.6内置函数(13)——complex()

英文文档Return a complex number with the value real + imag*1j or convert a string or number to a complex number. If the first parameter is a string, it will be interpreted as a complex number and t...

Airy 发表了文章 • 2019-06-29 15:32

0
推荐
150
浏览

Python3.6内置函数(12)——compile()

英文文档compile(source, filename, mode, flags=0, dont_inherit=False, optimize=-1)Compile the source into a code or AST object. Code objects can be executed by exec() or eval(). source can either be...

Airy 发表了文章 • 2019-06-29 15:11

0
推荐
191
浏览

MySQL常用函数汇总学习

前言MySQL函数是MySQL数据库提供的内置函数,这些内置函数可以更方便处理表中的数据。下面简单介绍一下MySQL中包含的几类常用函数。聚合函数聚合函数可实现根据一组数据求出一个值,聚合函数的结果值只根据选定数...

Airy 发表了文章 • 2019-06-29 15:08

0
推荐
416
浏览

营销数据中台白皮书

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 秒针系统(公众号ID:miaozhensystems)编者按:2018年,DMP、CDP、CEM、Data Lake突然引起市场关注,「数据...

数智物语 发表了文章 • 2019-05-07 15:15

1
推荐
581
浏览

《零售行业智能数据分析白皮书》正式发布(点击下载)

新零售认知2.0阶段进入2019年,随着新零售概念的逐步降温,大家对零售的认知经历了一个螺旋式的上升,并达成更高维度的共识:无论是什么业态的零售,本质上依然围绕着“人、货、场”三个核心要素,这个从来没有改变...

观远数据 发表了文章 • 2019-04-30 11:36

0
推荐
312
浏览

[分析报告]美国枪击暴力事件分析Gun Violence Data

相关数据下载页面:https://www.kaggle.com/jameslko/gun-violence-data附件为图片导出的PPT原件。

抱个西瓜走 发表了文章 • 2019-04-08 09:04

条新动态, 点击查看
两个思路:
1.是想办法把自己的队伍做起来。工作零散,没有专题,没有挖掘项目,去哪里都是这熊样子,地位是自己争取来的。

常见的战术是:把日常工作和专题分开,把日常工作的流程建起来,要提需求单,要排序,要有期望收货时间。所有只要一个数的需求都这么干。到半年或者... 显示全部 »
两个思路:
1.是想办法把自己的队伍做起来。工作零散,没有专题,没有挖掘项目,去哪里都是这熊样子,地位是自己争取来的。

常见的战术是:把日常工作和专题分开,把日常工作的流程建起来,要提需求单,要排序,要有期望收货时间。所有只要一个数的需求都这么干。到半年或者一年的时候,把这些零散的需求分分类,集中打包提给上级,说:这里80%需求可以通过三个新报表搞掂。然后就为自己争取到第一个独立属于自己的项目,有了项目就能想办法招人,这样就慢慢把自己培养成领导。

同时,不要贪多,贪新,就深耕bi技术,对小公司没那么多专题,挖掘需求,bi才是正道。

专题类分析,和那些和你关系好的部门做。不鸟你的部门你也不鸟他,用数据为工具,帮自己在企业内拉盟友,找能为自己发声的业务部门。对于上项目非常有帮助。

这样能帮你,把一个人做成一个部门,越是小企业,越有这种机会。本质上,数据分析是个支撑岗位,总是需要领导岗位的,公司的数据部门领导拿的钱不比大公司专家岗少。

2.熟练python,跳槽去大公司,再锻炼两年。

再具体的建议得更多了解你个人情况。不过你目前这个简历其实并不非常出色,在bi和python上都显得浅,而零碎的活也不容易体现能力。集中一个方向深入一下哈
你的目的是减少文件的个数,设置合理的分区数就可以了,例如设置分区数为5,对应5个文件。coalesce和repartitions都能设置分区数量,其底层原理有稍微的差别。从你的问题来看应该是设置的分区数太少,导致并行度不够,故写入速度慢。意见是尝试吧分区数调整... 显示全部 »
你的目的是减少文件的个数,设置合理的分区数就可以了,例如设置分区数为5,对应5个文件。coalesce和repartitions都能设置分区数量,其底层原理有稍微的差别。从你的问题来看应该是设置的分区数太少,导致并行度不够,故写入速度慢。意见是尝试吧分区数调整为5或10再试试
0
推荐
85
浏览

pandas札记10_数据清洗工作

数据处理之前需要对数据进行清理工作,包含:缺失值的去除drop缺失值的填充fillna删除重复数据duplicated()和drop_duplicates()数据转换索引重命名数据离散化或面元化缺失值的去除pandas处理缺失值pandas默认的处...

皮大大 发表了文章 • 2019-08-02 14:55

0
推荐
118
浏览

MySQL札记7_DML(数据操作语言)

DML,data manipulation language,数据操作语言, 主要是对数据库中的表记录进行操作的语言,包含表中插入数据、表中数据的更新、表的删除等:表中插入数据表中数据更新删除表复习DDL创建表在对表中的数据进行操...

皮大大 发表了文章 • 2019-07-31 22:42

0
推荐
143
浏览

如何建立数据驱动文化

是什么驱使企业建立成功的数据驱动文化?未必是数据本身。这是次要的。技术本身排在第三位。数据驱动决策才是第一位的。在向实施数据运维的数据驱动企业转变时,最重要也是最困难的是向数据心态的文化转变。这种...

大麦 发表了文章 • 2019-07-22 16:10

0
推荐
136
浏览

关于产品、数据和人才的8条经验

引言:这是一篇经验帖,作者 Daniel Shenfeld 曾在 12 家创业公司工作过,这些公司覆盖金融科技、医疗、教育技术、生物技术等多个领域,所处的阶段也各有不同,从种子前(pre-seed)到收购后都有。Daniel 在不同...

大麦 发表了文章 • 2019-07-05 11:02

0
推荐
144
浏览

Python3.6内置函数(18)——enumerate()

英文文档enumerate(iterable, start=0)Return an enumerate object. iterable must be a sequence, an iterator, or some other object which supports iteration. The __next__() method of the iterator return...

Airy 发表了文章 • 2019-06-30 23:45

0
推荐
160
浏览

Python3.6内置函数(17)——divmod()

英文文档Take two (non complex) numbers as arguments and return a pair of numbers consisting of their quotient and remainder when using integer division. With mixed operand types, the rules for bina...

Airy 发表了文章 • 2019-06-30 23:44

0
推荐
140
浏览

Python3.6内置函数(16)——dir()

英文文档dir([object])Without arguments, return the list of names in the current local scope. With an argument, attempt to return a list of valid attributes for that object.If the object has a metho...

Airy 发表了文章 • 2019-06-30 23:43

0
推荐
168
浏览

Python3.6内置函数(15)——dict()

英文文档class dict(**kwarg)class dict(mapping, **kwarg)class dict(iterable, **kwarg)Create a new dictionary. The dict object is the dictionary class. See dict and Mapping Types — dict for documenta...

Airy 发表了文章 • 2019-06-29 15:42

0
推荐
157
浏览

Python3.6内置函数(14)——delattr()

英文文档delattr(object, name)This is a relative of setattr(). The arguments are an object and a string. The string must be the name of one of the object’s attributes. The function deletes the named...

Airy 发表了文章 • 2019-06-29 15:34

0
推荐
167
浏览

Python3.6内置函数(13)——complex()

英文文档Return a complex number with the value real + imag*1j or convert a string or number to a complex number. If the first parameter is a string, it will be interpreted as a complex number and t...

Airy 发表了文章 • 2019-06-29 15:32

0
推荐
150
浏览

Python3.6内置函数(12)——compile()

英文文档compile(source, filename, mode, flags=0, dont_inherit=False, optimize=-1)Compile the source into a code or AST object. Code objects can be executed by exec() or eval(). source can either be...

Airy 发表了文章 • 2019-06-29 15:11

0
推荐
191
浏览

MySQL常用函数汇总学习

前言MySQL函数是MySQL数据库提供的内置函数,这些内置函数可以更方便处理表中的数据。下面简单介绍一下MySQL中包含的几类常用函数。聚合函数聚合函数可实现根据一组数据求出一个值,聚合函数的结果值只根据选定数...

Airy 发表了文章 • 2019-06-29 15:08

0
推荐
416
浏览

营销数据中台白皮书

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 秒针系统(公众号ID:miaozhensystems)编者按:2018年,DMP、CDP、CEM、Data Lake突然引起市场关注,「数据...

数智物语 发表了文章 • 2019-05-07 15:15

1
推荐
581
浏览

《零售行业智能数据分析白皮书》正式发布(点击下载)

新零售认知2.0阶段进入2019年,随着新零售概念的逐步降温,大家对零售的认知经历了一个螺旋式的上升,并达成更高维度的共识:无论是什么业态的零售,本质上依然围绕着“人、货、场”三个核心要素,这个从来没有改变...

观远数据 发表了文章 • 2019-04-30 11:36

0
推荐
312
浏览

[分析报告]美国枪击暴力事件分析Gun Violence Data

相关数据下载页面:https://www.kaggle.com/jameslko/gun-violence-data附件为图片导出的PPT原件。

抱个西瓜走 发表了文章 • 2019-04-08 09:04