python-office icon indicating copy to clipboard operation
python-office copied to clipboard

解决需求场景:按员工表(csv/xls)批量进行ocr检测(例如识别核酸打卡)

Open CNSeniorious000 opened this issue 2 years ago • 0 comments

有没有这种使用场景:我有一个员工表(csv或者Excel),我每天需要统计他们的核酸记录(每天自动从微信缓存文件夹中复制过来,文件名都是雪花主键)

每天需要对所有图片进行OCR识别出是谁,最后输出没有提交核酸记录的员工

目前想到的实现需要

  1. excel模块提供一个forEach函数,对特定列每一行的属性值进行给定操作(将一个回调函数作为参数传入)
  2. ocr模块实现对绿码的识别(现在已经实现了,通过ImgReader.classify()可以将图片分类为["24小时", "48小时", "72小时"]中的一个)
  3. ocr模块实现对特定文字的模糊匹配,例如给定员工名字总表,从一张截图模糊匹配出此人是谁(同上,已实现)
  4. files模块提供forEach函数,对某目录下的每一个文件执行给定操作(例如遍历微信图片缓存文件夹下的每一个图片)

复旦博士实现这个功能写了130行,我们的目标是让任何一个学过1小时python的人都能在13行内实现这个功能。

CNSeniorious000 avatar May 19 '22 08:05 CNSeniorious000