video-subtitle-extractor
video-subtitle-extractor copied to clipboard
合并重复行
用“精确”模式提取字幕时,出现了这样的结果 `8 00:02:05,200 --> 00:02:06,200 胜下臣等奉旨观听 Your Majesty,w
9 00:02:06,160 --> 00:02:07,160 陛下臣等奉旨观听 Your Majesty,we observed`
前一个是后一个的一部分,是不是考虑,相邻的这样的两行内容,合并下?
vsf一般不会出现这个问题
vsf一般不会出现这个问题
可是vsf会丢字幕啊
鱼和熊掌
可以config中降低下置信度,这样可以减少丢字幕,就是ocr出来的字幕可能不太准确,要手工改下 不过我使用中vsf这情况其实也不少 😅
可以config中降低下置信度,这样可以减少丢字幕,就是ocr出来的字幕可能不太准确,要手工改下
请教下:怎么查看是因为“置信度”原因丢字幕呢?
可以config中降低下置信度,这样可以减少丢字幕,就是ocr出来的字幕可能不太准确,要手工改下
请教下:怎么查看是因为“置信度”原因丢字幕呢?
可以看下vsf生成的图片文件夹resources\output\RGBImages
,假如文件夹中存在丢失字幕的图片,那就是ocr时因置信度太低被丢弃了
可以config中降低下置信度,这样可以减少丢字幕,就是ocr出来的字幕可能不太准确,要手工改下
请教下:怎么查看是因为“置信度”原因丢字幕呢?
可以看下vsf生成的图片文件夹
resources\output\RGBImages
,假如文件夹中存在丢失字幕的图片,那就是ocr时因置信度太低被丢弃了
i see...
如果能有log就好了
修改config.py文件里面的THRESHOLD_TEXT_SIMILARITY
# 文本相似度阈值
# 用于去重时判断两行字幕是不是统一行
# 采用动态算法实现相似度阈值判断: 对于短文本要求较低的阈值,对于长文本要求较高的阈值
THRESHOLD_TEXT_SIMILARITY = 0.8