【译Py】2018年8月,GitHub上的Python数据科学明星项目:自动化机器学习、自然语言处理、可视化、机器学习工作流

浏览: 1523

作者:呆鸟【翻译】

简书专栏:

https://www.jianshu.com/u/be48b04ecc3e

坚持学习Python和English两门语言,致力于让读译文就像读中文的呆鸟

原文作者: Matthew Mayo

原文地址:https://www.kdnuggets.com/2018/08/github-python-data-science-spotlight.html


Python数据分析

本文是“五个不容忽视的机器学习项目”一文的续篇。和上篇文章相比,这次选出的项目涉及更多数据科学领域,并且都是GitHub上的开源项目,我们为每个项目都附上了Repo、文档和入门指南的链接,并对每个项目进行了简单介绍。
下面一起来了解一下这些新兴的热门Python库吧,希望本文对你的工作能有所帮助:

1. Auto-Keras自动机器学习库

项目链接:https://github.com/jhfjhfj1/autokeras
文档:http://autokeras.com
入门指南:https://autokeras.com/#example
Auto-Keras是用于自动机器学习(AutoML)的开源软件库。自动机器学习的最终目标是让仅拥有一定数据科学知识或机器学习背景的行业专家可以轻松地应用深度学习模型。Auto-Keras提供了很多用于自动研究深度学习模型架构与超参数的函数。


2. Finetune Scikit-Learn风格的自然语言处理模型微调器


项目链接:https://github.com/IndicoDataSolutions/finetune
文档:https://finetune.indico.io
入门指南:https://finetune.indico.io
Finetune提供了“通过生成式预训练改进对语言的理解”的预训练语言模型,并扩充了OpenAI/finetune-language-model库。


3. GluonNLP - 让自然语言处理变得更简单

项目链接:https://github.com/dmlc/gluon-nlp
文档:http://gluon-nlp.mxnet.io
入门指南: https://github.com/dmlc/gluon-nlp#quick-start-guide
GluonNLP可以使文本处理、数据加载及构建神经模型变得更容易,加快自然语言处理研究的速度。


4. animatplot - 基于Matplotlib的Python动图库

项目链接:https://github.com/t-makaro/animatplot
文档:https://animatplot.readthedocs.io/en/latest
入门指南:https://animatplot.readthedocs.io/en/latest/tutorial/getting_started.html
请注意,本库文档里的例子比较简单,本文引用的是该库在GitHub上列出的功能更全、形式更酷的示例图。

animatplot

5. MLflow - 机器学习生命周期的开源平台

项目链接:https://github.com/mlflow/mlflow
文档:https://mlflow.org/docs/latest/index.html
入门指南:https://mlflow.org/docs/latest/quickstart.html
MLflow是用来管理机器学习整体生命周期的开源平台,这个平台提供了以下主要三个功能:

  • MLflow Tracking:跟踪实验,以用来记录和比较机器学习的参数。

  • MLflow Projects:以可复用、可再现的形式,将机器学习的代码进行打包,以便分享给其他数据科学家或传递给生产环境。

  • MLflow Models:管理各类机器学习库中的模型,并部署到不同的模型服务及应用平台。
    MLflow通过访问REST API和CLI实现其功能,所以它不依赖于某个库,并且支持多种机器学习库与编程语言,为了使用方便,它还内置了Python API。

Python爱好者社区历史文章大合集

Python爱好者社区历史文章列表(每周append更新一次)

福利:文末扫码立刻关注公众号,“Python爱好者社区”,开始学习Python课程:

关注后在公众号内回复课程即可获取

小编的Python入门免费视频课程!!!

【最新免费微课】小编的Python快速上手matplotlib可视化库!!!

崔老师爬虫实战案例免费学习视频。

陈老师数据分析报告制作免费学习视频。

玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。


推荐 0
本文由 Python爱好者社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册