0
推荐
1381
阅读
数据有价:数据资产定价研究初探
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 数据派THU(id:DatapiTHU)作者 | 张家林数据(Data)是一项资产的观念形成虽然时间不长,但已经成为人们的共识。成为资产的两个基本前提条件是能够确权和定价。确权是确定谁拥有什么权利或权益,定价使得资产具...
0
推荐
1085
阅读
机器学习模型应用方法综述
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 数据派THU(id:DatapiTHU)作者:Julien Kervizic翻译:陈之炎 校对:李海明本文整理比较模型部署到生产中使用的不同部署模型方式、生命周期管理方法及数据存储格式。Mantas Hesthaven拍的发表在 ...
0
推荐
1123
阅读
一篇值得收藏的ML数据预处理原理与实践文章
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | SAMshare作者 | Samshare选自 Python-Machine-Learning-Book On GitHub作者:Sebastian Raschka翻译&整理 By Sam本文的主体结构前置,如下:一. 处理数据缺失 1.1 删除有缺失的样本或特征 ...
0
推荐
1469
阅读
让客户一看就懂 ,赞不绝口的10个数据可视化技巧
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI开发者(id:okweiwu)作者 | skura我必须对你说实话:当我学习数据科学时,我完全低估了绘图的重要性。没错,那时一切都一团糟:我从头开始学习 python、熟悉了所有可能的算法、理解了所有东西背后的数学原理...
0
推荐
1315
阅读
数据科学工程师常犯的错误Top10
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。作者:Norm Niemer编译:ronghuaiyang导读无论是初学者还是有经验的工程师,都会或多或少的犯一些错误,这里总结了一些常犯的错误top10,大家可以参考一下。数据科学家是“比任何软件工程师都更擅长统计,比任何统计学家都更擅长软...
0
推荐
1442
阅读
数据科学的基础:A/B测试
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。作者:Tony Yiu编译:ronghuaiyang导读使用一个简单的例子来解释A/B测试的复杂细节(也就是假设检验)。01伪装的假设检验如果你有统计学背景,在某个时候你可能会想,“A/B测试和假设检验是一回事吗?”没错,就是一回事!因此,让我...
0
推荐
1736
阅读
为什么机器学习模型在生产中会退化?
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。作者:Alexandre Gonfalonieri编译:ronghuaiyang导读当你把一个模型投入生产,它就开始退化,那这个时候,我们该怎么办呢。由于意外的机器学习模型退化导致了几个机器学习项目的失败,我想分享一下我在机器学习模型退化方面的经验...
0
推荐
1328
阅读
AI改变出行:大兴机场高颜值下的科技内涵
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | HyperAI超神经(id:HyperAI)作者 | 神经小刀场景描述:大兴机场在 9 月底顺利通航,作为颜值爆表,黑科技满满的大型国际机场,大兴机场在多个方面实现了创举。除了美轮美奂的设计,华丽的造型,AI 技术,机器人...
0
推荐
1108
阅读
天哪!我的十一假期,被人工智能操控了
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | HyperAI超神经(id:HyperAI)作者 | 神经星星场景描述:这个假期,除了脑海一直在唱歌,庆祝祖国成立的 70 周年,当然也闲不住,要乘机出去浪一浪。但在旅行的过程中,人工智能的各种应用已经不知不觉的渗...
0
推荐
1206
阅读
AI技术加持高清彩色开国典礼,庆祝建国70周年,历史永不褪色
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | HyperAI超神经(id:HyperAI)场景描述:在最近刚刚上映的电影《决胜时刻》中,经过了 4K 修复的高清史料,和全国人民见面。这段来之不易的资料,是创作者们经历了繁重的修复工作得来。电影修复究竟是怎么一回事,AI ...
0
推荐
1038
阅读
AI 竞赛没有意义,模型实际不可用,冠军全凭运气?
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI开发者(id:okweiwu)近日,一个大型的新的 CT 脑数据集被发布,其目的是训练模型来检测颅内出血。由此,Luke Oakden-Rayner 写了一篇名为《AI competitions don’t produce useful models》的博文,这篇文章在社交...
0
推荐
1110
阅读
CVPR 2019:精确目标检测的不确定边界框回归
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI科技评论(id:aitechtalk)大规模的目标检测数据集(例如MS-COCO)在进行Ground Truth框标注时仍然存在歧义。这篇论文提出了新的边界框回归损失针对目标框的移动以及位置方差进行学习,这种方法在几乎不增加计算量的...
0
推荐
1064
阅读
干货:基于深度学习的文本数据特征提取方法之Word2Vec
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。作者:Dipanjan (DJ) Sarkar编译:ronghuaiyang01介绍处理非结构化文本数据非常困难,尤其是试图构建一个可以像人类一样解释和理解自由流动的自然语言的智能系统时。你需要能够处理和转换嘈杂的、非结构化的文本数据,并将其转换为...
0
推荐
1032
阅读
数据科学家需要知道的5种图算法
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。作者:Rahul Agarwal编译:ronghuaiyang图分析是数据科学家的未来。作为数据科学家,我们对pandas、SQL或任何其他关系数据库非常熟悉。我们习惯于将用户的属性以列的形式显示在行中。但现实世界真的是这样吗?在一个互联的世界里,...
0
推荐
2231
阅读
利用 Spark 和 scikit-learn 将你的模型训练加快 100 倍
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI开发者(okweiwu)作者 | skura在 Ibotta,我们训练了许多机器学习模型。这些模型为我们的推荐系统、搜索引擎、定价优化引擎、数据质量等提供动力。它们在与我们的移动应用程序交互时为数百万用户做出预测。当我们使...