前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【程序源代码】python数据提取工具

【程序源代码】python数据提取工具

作者头像
程序源代码
发布2021-04-01 23:50:19
6130
发布2021-04-01 23:50:19
举报
文章被收录于专栏:程序源代码程序源代码

关键字:实用小工具

正文:python数据提取工具

一款使用Python编写的图像内表格数据提取工具,可以高效识别PDF原件、扫描件、复印件、彩色(黑白)照片、截图内的数据表格,提取后转为Excel文件输出。

01概述

一款使用 Python 编写的图像内表格数据提取工具,可以高效识别 PDF 原件、扫描件、复印件、彩色(黑白)照片、截图内的数据表格,提取后转为 Excel 文件输出。这是一款开源工具,我给它取名叫Any2Excel。顾名思义,往后的目标就是提取任意格式文件中的数据图表到可被结构化处理的 Excel 文件。识别度高,操作简单,使用场景广泛。支持手机拍照、扫描件、原件、复印件等等

02使用方法

  1. Python PIP 依赖
  2. pip install -r .\requirements.txt
  3. 外部依赖
  4. poppler 安装后将其bin路径加入系统变量中
  5. 配置腾讯云
  6. cp config+sample.yml config.yml后补全config.yml中的配置信息

源码

https://gitee.com/itcode-itcode/any-to-excel

本文参与?腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-03-29,如有侵权请联系?cloudcommunity@tencent.com 删除

本文分享自 程序源代码 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 01概述
  • 02使用方法
  • 源码
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com