菜鸟数据岛 专栏

菜鸟数据岛正式开岛了!欢迎各位菜鸟在这里栖息,成长,并且起飞到更远更辽阔的地方,比如梦想,比如成功。

1
推荐
2978
阅读

实用|R语言的常用报错及解决方法

目录:连接数据库报错:negative length vectors are not allowed连接数据库报错:first argument is not an open RODBC channel连接数据库报错:incorrect number of dimensionsRStudio一运行就重启:R Session AbortedError: argument is not interpretable as logicalRStudio无法调试,下断点无效!编码错误:invalid...

发表了文章 • 2016-11-01 09:54 • 0 条评论

0
推荐
1436
阅读

老司机带你学习回归分析预测法

什么是回归分析预测法?回归分析预测法,是在分析市场现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量关系大多表现为相关关系,因此,回归分析预测法是一种重要的市场预测方法,当我们在对市场现象未来发展状况和水平进行预测时...

发表了文章 • 2016-10-31 09:47 • 0 条评论

0
推荐
1537
阅读

做数据分析是一份怎样的工作?

本文已获授权转载,转载自数据分析网作者:小菜鸟原文链接:http://xiaocainiao.baijia.baidu.com/article/643275【大数据分析】做数据分析是一份怎样的工作,这是一个完完整整的获取数据→处理数据→分析数据→呈现数据的过程,需要用到编程语言,统计工具、数据处理工具、模型、算法、逻辑、业务理解等。邓小姐变身数据分...

发表了文章 • 2016-10-31 09:44 • 0 条评论

0
推荐
1567
阅读

你不得不知道的机器学习十大算法(二)

6PageRank算法是google的页面排序算法,是基于从许多优质的网页链接过来的网页,必定还是优质网页的回归关系,来判定所有网页的重要性。(也就是说,一个人有着越多牛X朋友的人,他是牛X的概率就越大。)优点:完全独立于查询,只依赖于网页链接结构,可以离线计算。缺点:1)PageRank算法忽略了网页搜索的时效性。2)旧...

发表了文章 • 2016-09-22 08:58 • 0 条评论

1
推荐
1623
阅读

你不得不知道的机器学习十大算法(一)

1、C4.5算法:ID3算法是以信息论为基础,以信息熵和信息增益度为衡量标准,从而实现对数据的归纳分类。ID3算法计算每个属性的信息增益,并选取具有最高增益的属性作为给定的测试属性。C4.5算法核心思想是ID3算法,是ID3算法的改进,改进方面有:1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的...

发表了文章 • 2016-09-21 09:14 • 0 条评论

3
推荐
2404
阅读

写给新人的数据挖掘知识

1数据挖掘技术的基本概念随着计算机技术的发展,各行各业都开始采用计算机及相应的信息技术进行管理和运营,这使得企业生成、收集、存贮和处理数据的能力大大提高,数据量与日俱增。企业数据实际上是企业的经验积累,当其积累到一定程度时,必然会反映出规律性的东西;对企业来,堆积如山的数据无异于一个巨大的宝库。在...

发表了文章 • 2016-09-14 09:22 • 0 条评论

2
推荐
2900
阅读

【干货】如何写竞品分析报告

1、确定竞品的种类竞品可以分为:直接竞品:产品定位(目标方向、目标用户用户需求、产品功能等)相似,这一类是最容易找到也最需要市场关注的竞品。间接竞品:产品目标人群可能相似,但是功能需求方面不太相同;或者产品的商业模式不同,但是内容相似。潜在竞品:行业相近、业务相近的企业产品。下面以“滴滴出行”为例2...

发表了文章 • 2016-09-05 09:37 • 0 条评论

0
推荐
2045
阅读

常用大数据术语一览表

大数据有许多新术语,有时不好理解。因此,我们列出了一份大数据术语表,以便大家深入了解。A聚合-搜索、收集和显示数据的过程。算法-可以对数据执行某种分析的数学公式。分析―发现数据蕴含的洞察力。异常检测-搜索数据集中与预测模式或预期行为不匹配的数据项。异常又叫outlier、exception、surprise或 contaminant,它...

发表了文章 • 2016-09-02 09:40 • 0 条评论

0
推荐
1642
阅读

炙手可热的大数据是“泡沫”?

在互联网行业,你如果不能随口分析目前的大数据发展状况,估计你会沦落到鄙视链的最底端。即使在传统行业,数据意识也成为从员工到管理者眼中最具潜力的驱动力量……目前大数据的火热程度可见一斑。我们都在说大数据,大家都在挖掘大数据的潜在价值,又有人提出,大数据太过于热,产生了大量的泡沫。甚至有人说这个泡沫破...

发表了文章 • 2016-09-02 09:31 • 0 条评论

1
推荐
1666
阅读

王宝强有九套房,为什么大家知道的只有美国那一套?

答案很简单,因为在美国,要找到一个人的公开信息,实在是太容易了。从某种意义上来说,美国可能是世界上最没有个人隐私的国家。一方面所有的商业交易遵循规范的流程,数据可以快速地汇总到数据库里;另一方面这些数据都是透明公开的,任何人只要愿意,都可以合法地取得这些信息。再加上很多商业公司会有意识地收集这些...

发表了文章 • 2016-08-30 10:03 • 0 条评论

0
推荐
2631
阅读

【小菜数据经】如何计算客户终身价值

Hello,大家好,我是小菜,不知道大家最近有木有想我。这几天我被老大好顿折磨,额,你们别想歪,是精神上的折磨!最近他又给我出了一个难题,让我计算什么客户终身价值(CLV)。之前菜鸟数据岛推荐的《精益数据分析》,貌似有这个介绍,翻开书,在讲流失率这块找到了,要搞清客户终身价值,先要计算客户使用产品的寿命...

发表了文章 • 2016-08-29 09:11 • 0 条评论

1
推荐
3652
阅读

【用户画像系列】用户建模

为了满足用户的个性化需求,需要对用户画像进行建模,从而为行为分析习惯、兴趣偏好等重要的商业信息,提供大量的基础数据。1用户画像建模的核心是对用户潜在的意图和兴趣进行表示和存储,根据用户的基础信息、产品信息、访问信息、行为偏好、以及隐式兴趣等归纳出可读取、可计算的用户模型。一般来说,用户建模就是将用...

发表了文章 • 2016-08-26 11:44 • 0 条评论

1
推荐
1636
阅读

报告!A组岛民带着iphone4s的研究报告已登陆!

文章内容来源于菜鸟数据直播课程第一期学员的项目报告,此项目目的是为菜鸟数据学员提供一个学以致用的练习机会,所有报告内容均由菜鸟数据第一期A组学员完成。项目介绍假设你是苹果公司的产品运营,希望对刚上市的iphone4s的用户反馈进行分析,以对产品和宣传手段进行改进,已经给出了样本数据,你可以利用这些数据以及...

发表了文章 • 2016-08-23 09:33 • 0 条评论

0
推荐
2165
阅读

令人抓狂的转化率该如何提升?

提升转化率是运营中的核心工作之一,意味着投资回报率ROI更高,运营的利益效果更好。我们先来看一下转化率的公式,这里要注意的是,统计的原则是在统一的统计周期内,因此,公式里的总人数也必须要统计周期内的总人数。                           &n...

发表了文章 • 2016-08-22 10:40 • 0 条评论

0
推荐
2369
阅读

【大咖说】最不靠谱数据分析师面试+三招帮你防被坑

菜鸟数据岛的岛民,大家好,今天我们请到的是刚刚路遇不靠谱招聘的小小菜,用亲身经历给大家讲讲,不靠谱的数据分析面试到底有多坑!被采访人:小小菜背景:专业应用数学,数据分析专员,工作经验2年。面试公司:咨询公司。面试原来可以这么不靠谱?!最近在想着换工作,就投了几个社会招聘的岗位。但是没想到遇到这么不...

发表了文章 • 2016-08-22 10:38 • 0 条评论