DataOps 宣言与实践原则

浏览: 2489

原文:http://dataopsmanifesto.org/dataops-manifesto.html (已得到翻译同意)


透过第一手在组织、工具、以及产业中与资料工作的经验,我们发现更好的方式来开发以及交付分析成果及分析工具,我们称这种方式为 DataOps。

不论是在资料科学、资料工程、资料管理、大数据、商业智慧、或其他相关领域,透过我们的工作,将在分析领域建立以下价值观:

1. 个人与互动重于流程与工具

2. 可用的分析重于详尽的文件

3. 与客户合作重于合约协商

4. 实验、迭代以及回应重于大量的前期设计

5. 跨部门的营运所有权重于独立的责任


DataOps Principles

1. 持续地满足客户需求:

我们最优先的任务是透过及早并持续地交付有价值的分析洞察来满足客户需求,频率可以从数分钟到数个星期。


2. 有价值且可用的分析:

我们相信主要衡量数据分析成效的指标为:具洞察力的分析被交付的程度,包括正确的资料、顶级可靠的架构与系统。


3. 拥抱变化:

竭诚欢迎改变需求,甚至已处开发后期亦然。敏捷流程掌控变更以维护客户的竞争优势。我们相信最有效率、有效、以及最敏捷与客户沟通的方式为面对面的交谈。


4. 这是团队运动:

分析团队将具备多重角色、技能、工具以及职称。


5. 每日互动:

客户、分析团队与维运必须在专案全程中天天一起工作。


6. 自组织:

我们相信最好的分析洞察、演算法、架构、需求与设计皆来自能自我组织的团队。


7. 减少英雄主义:

对于具备深度及广度的分析洞察需求持续增加,我们相信分析团队应该致力减少英雄主义,并建立永续且可扩张的资料分析团队及流程。


8. 反省:

分析团队应该透过来自客户、团队本身、及运作数据的回馈,定期的自我反省来优化运作效能。


9. 分析即程式码:

分析团队使用不同的工具来访问、整合、建模、以及视觉化资料。基本上,这些工具都会产生程式码以及设定档,以此来描述操作资料的动作来交付洞察。


10. 编排协作:

资料、工具、程式码、环境及分析团队自始至终的编排协作是交付分析的成功关键。


11. 可再制的结果:

可再制的结果是必须的,因此我们可将任何事情做版本控管,包括资料、低阶软硬体的设定、程式码、以及在工具链上各工具的设定。


12. 抛弃式的环境:

我们相信让分析团队的成员有个容易创建、独立、安全、可抛弃、且与生产环境相同的技术环境,并且将其成本最小化是很重要的。


13. 精简:

我们相信持续关注技术优势及良好的设计有助于敏捷;如精简 ─ 最大化未完成的工作量之技艺 ─ 一样根本。


14. 分析即生产:

分析流程如同精实的生产线。我们相信 DataOps 的根本精神之一为专注于程序思维 ─ 达成持续且有效率的生产分析洞察。


15. 品质为一切:

建立好的分析流程应该具备的根本能力为自动(自働化)侦测异常,这些异常包括程式码、设定档、以及数据。并且应该能持续地提供维运人员回馈来避免错误发生(防呆)。


16. 监控品质与效能:

我们的目标是有效能以及品质的指标,这些指标可以被持续的监控来侦测无预期的变化,并且产生运作数据。


17. 再使用:

我们相信生产有效率的分析洞察的根本面向在于避免个人或团队的重复性工作。


18. 改进迭代周期:

我们应该减少将客户需求转换成分析想法的时间以及负担:在开发中建立它,以可重复的生产流程来发布,最后再重构及再使用该产品。

推荐 3
本文由 bryanyang 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册