利用Python实现报告自动生成

浏览: 4009

几天,在网上看到一篇介绍利用Python组件实现MS word内容生成的文章。可能是很久没接触编码,感觉在技术领域变得有点孤陋寡闻了,看见一些实用的功能都觉的屌屌的。以前经常通过代码写Excel文件,写Word相对较少,即使有也是基于XML/HTML来实现的。所以,今天我是以一种非专业的态度来分享这个功能,各路Python高手且擅长此类技术的同学请自行忽略。

背景介绍

这篇文章来自Chris Moffitt的《Populating MS Word Templates with Python》,文中提到了一个Python开源组件docx-mailmerge,组件的原理是依赖MS Word的mailmerge功能,基于模板式的内容填充,实现动态内容加载和生成。

在安装了docx-mailmerge包并亲自动手尝试后发现,这个包还存在一些缺陷,对于有数值型格式的数据支持不好。为了有一个比较好的演示效果,我将代码进行了简单修改并集成到了tushare里,所以以下的演示将通过tushare来实现。为了表示对作者的尊敬,有兴趣的同学可以直接参阅作者的github:https://github.com/Bouke/docx-mailmerge

方法步骤

1、新建模板

打开word(本演示环境是word2013),新建一个docx文件,按照一定的格式假设完成了一个报告。在需要动态加载文字或者数据的地方,可以预留基于word mailmerge功能的域。

2、选择域功能

在需要插入域的地方,点击word工具栏“插入”->"文档部件" -> "域"来设置。

Clipboard Image.png

3、设置域代码

在弹出的域值设置对话框里,在“域名”下拉框选择MergeField,在右边域属性输入一个域代码名称。

Clipboard Image.png


根据需要可设置各种文字域,也可以设置动态表格域。

我这里实现了一个简单的示例,展示当日沪深指数行情和当日涨幅前15位的股票列表数据。

Clipboard Image.png

代码实现

因为已经将代码集成到了tushare,我们只需要导入tushare包即可(需升级到0.6.9版本)。

Clipboard Image.png

为了展示当日涨幅排名前15位的股票,我们通过tushare取到行情数据。

Clipboard Image.png

导入模板,可查看所有域属性。

Clipboard Image.png

根据数据生成内容:

Clipboard Image.png

对于沪深指数行情部分,为了演示数据格式,这里写成了固定形式便于理解,通过动态获取数据并传入域值内也是很简单的。

运行代码后,我们来看看效果:

Clipboard Image.png

Clipboard Image.png

关键函数

1、初始代码

document
 = ts.MailMerge(template),将模板传入初始函数。

2、填充域数据

document.merge(dict_data),通过传入字典类型数据,实现域值填充。

3、生成多页数据报告

document.merge_pages(list_dict_data),传入数组字典,可生成多个数据页。

4、生成表格数据

document.merge_rows(field_name, list_dict_data),生成固定格式的表格数据。

总结

总的来看,这个工具还是很方便实用的,接口设计和使用都非常简单。可用于动态生成数据报告,类似于公司word版工资条的生成,每月看到公司HR同事发来的工资条,好几百人每个都不一样,如果手动实现的话,真心认为真的是辛苦他们了。如果有这么一个小工具,应该是非常方便的。当然,这里只是拿它举个例子,相信在如今高度发达的信息技术下,靠人肉来实现类似工作的情况应该越来越少见了。

Clipboard Image.png

推荐 5
本文由 挖地兔 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

2 个评论

我喜欢,好赞
可以可以!

要回复文章请先登录注册