Pandas在数据分析中的重要作用不必多言。不管是Confluence上的一篇文章、GitHub中Readme文档,抑或一篇科学论文,每个项目都会以报告之类来收尾。
使用Pandas,就不必再将数据帧(DataFrame)里的值逐一复制到另一个软件中,它的格式化函数能够将数据帧转换成多种格式。
无论是学生、数据科学家还是博士研究人员,这些技巧都一定能帮到你。
图源:medium.com
下载Jupyter notebook,一起动动小手来试试吧!
设置
创建一个10行3列的数据帧,数值随机。
- n =10
- df = pd.DataFrame(
- {
- "col1": np.random.random_sample(n),
- "col2": np.random.random_sample(n),
- "col3": [[random.randint(0,10) for _ in range(random.randint(3, 5))] for _ inrange(n)],
- }
- )
与HTML共享结果
通过使用to_html函数,可以将Pandas数据帧转换为HTML,这对于通过HTML发送自动报告十分有用。还可以在pandas分析服务器上制作API,这样就可以在网页浏览器的数据帧中追踪最新数值。
注意,这需要用到lxml软件包,可以用pip安装lxml。
- dfdf_html =df.to_html()with open( analysis.html , w ) as f:
- f.write(df_html)
read_html函数甚至可以将HTML解析为pandas数据帧。笔者还没有使用过通用HTML进行尝试,但无疑会很有用。
- df_list =pd.read_html( analysis.html )
- df_list
编写文件
在代码中编写注释时,将数据帧转换为字符串会非常有用。
- print(df.to_string())
Excel电子表格
Excel的大佬地位毋庸置疑,而Pandas能够将数据帧转化为Excel电子表格。使用pandas,人们可以轻松阅读Excel电子表格。
注意,需要xlwt和openpyxl软件包,可以用pip进行安装。
- df.to_excel( analysis.xlsx ,index=False)
- pd.read_excel( analysis.xlsx )
Github创作
在存储库中,Github使用Markdown格式语言来编写README和Wiki文件。一个优秀的README文件能让项目更有可能被其他人采用。虽然在GitHub上逐步进行示范相当普遍,但将pandas数据帧手动格式化为markdown标记语言,会花费大量时间。这时Pandas可就帮了我们大忙。
- print(df.to_markdown())
撰写科学论文
大部分高质量的研究论文都是用LaTeX——一个高质量的排版系统编写而成。许多LaTeX作者制作数据帧截图,然后放在自己的论文中,还有许多人花了相当多的时间将数据帧的值格式化为LaTe X表格。
图源:unsplash
pandas中的to_latex函数可以帮助人们完成繁重的任务。来看看这个例子:
- df.to_latex()
结合使用print函数,你可以得到一个格式工整的输出结果。
- print(df.to_latex())
这些技巧帮到你了吗?
前提条件 请您在购买前确保已完成注册和充值。详细操作请参见 如何注册公有云管...
信息化2.0时代提出开展智慧教育创新发展行动。2019年2月,中共中央、国务院印发...
Docker生成新镜像版本的两种方式 There are two ways Docker can generate new m...
从 10.0.0 版开始,异步迭代器就出现在 Node 中了,在本文中,我们将讨论异步迭...
摘要 元旦期间 订单业务线 告知 推送系统 无法正常收发消息,作为推送系统维护者...
建站 什么 虚拟主机 够用?这要看搭建的是什么类型的网站。比如个人博客类型的网...
本文整理自直播《Hologres 数据导入/导出实践-王华峰(继儒)》 视频链接: https:/...
【51CTO.com快译】 数据可视化工具不断发展,提供更强大的功能,同时改善可访问...
在Python语言中有如下3种方法: 成员方法 类方法(classmethod) 静态方法(staticm...
2021年3月24日,主题为《数据的世界,世界的数据》的星环科技2021春季新品发布会...