python-office
python-office copied to clipboard
解决需求场景:按员工表(csv/xls)批量进行ocr检测(例如识别核酸打卡)
有没有这种使用场景:我有一个员工表(csv或者Excel),我每天需要统计他们的核酸记录(每天自动从微信缓存文件夹中复制过来,文件名都是雪花主键)
每天需要对所有图片进行OCR识别出是谁,最后输出没有提交核酸记录的员工
目前想到的实现需要
-
excel模块提供一个
forEach
函数,对特定列每一行的属性值进行给定操作(将一个回调函数作为参数传入) - ocr模块实现对绿码的识别(现在已经实现了,通过
ImgReader.classify()
可以将图片分类为["24小时", "48小时", "72小时"]中的一个) - ocr模块实现对特定文字的模糊匹配,例如给定员工名字总表,从一张截图模糊匹配出此人是谁(同上,已实现)
-
files模块提供
forEach
函数,对某目录下的每一个文件执行给定操作(例如遍历微信图片缓存文件夹下的每一个图片)
复旦博士实现这个功能写了130行,我们的目标是让任何一个学过1小时python的人都能在13行内实现这个功能。