RichardQin1
RichardQin1
使用标点符号添加模型进行处理, 书名号中内容被添加标点。 ` inference_pipline = pipeline( task=Tasks.punctuation, model='damo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch', model_revision="v1.1.7") tmp_str = "《内容测试》内容测试内容司内容" inference_pipline(text_in=tmp_str) ` 输出结果: 《内容测试。》内容测试内容司内容 期望: 书名号中内容不要进行添加
今天突然不可用了 请问是百度更新了么?
目标场景是使用paddle识别ocr结果 在另外的流程中使用modelscope的模型进行nlp分析。但似乎只要添加了from modelscope import pipeline, Tasks就报错。 注释掉就没问题。是否包冲突、有无解决优化和解决方案 - 系统环境/System Environment: ``` conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.8 -c pytorch -c nvidia ``` - 版本号/Version:Paddle: PaddleOCR: 问题相关组件/Related components: ``` paddleocr 2.7.0.3...
It is known that the text is a segment of the audio eg: ``` 特朗普右耳纏紗布現身 並將在大會上發表全國講話 特朗普表示槍擊事件之後 ``` test.mp3 input(text,test.mp3) output: ``` 特朗普右耳纏紗布現身 start_time:10000 end_time:12000 並將在大會上發表全國講話 start_time:12000 end_time:15000 特朗普表示槍擊事件之後 start_time:15000...
how to check hallucination. I wrote myself a check for duplicate text.
audio time: 4min 47s code: ``` python mp3_audio = 'test.mp4' asr_model = WhisperModel("large-v2", device="cuda", compute_type="float16") prompt = '春风多可太忙生 长共花边柳外行 以风邪为主 侵袭人体 我们就管它叫风痹 风的特点 在人体当中造成一些伤害 会出现类似于 风在自然现象中的一些情况 比如说它有这种走串的特点 就是今天这个地方关节疼 明天那个地方 它是经常变化的...
audio time: 4min 47s code: ``` python mp3_audio = 'test.mp4' asr_model = WhisperModel("large-v2", device="cuda", compute_type="float16") prompt = '春风多可太忙生 长共花边柳外行 以风邪为主 侵袭人体 我们就管它叫风痹 风的特点 在人体当中造成一些伤害 会出现类似于 风在自然现象中的一些情况 比如说它有这种走串的特点 就是今天这个地方关节疼 明天那个地方 它是经常变化的...