annian101

Results 16 comments of annian101

> 听说CMLR数据集,视频和音频对不上,得自己清洗一下,或者过滤一下 我看质量还行呀,我下载的数据集是视频和音频分开的,我合并完之后,抽查了一些,质量还可以

> 听说CMLR数据集,视频和音频对不上,得自己清洗一下,或者过滤一下 wav2lip对中文太不友好了,只能重新训练

> > > 听说CMLR数据集,视频和音频对不上,得自己清洗一下,或者过滤一下 > > > > > > wav2lip对中文太不友好了,只能重新训练 > > 我加载了它给的英文训练好的 sync_lip 权重,然后在 CMLR 上训练,loss 降的很慢,6500 step 的 loss 才到 0.7 附近,现在拿来训练 wav2lip 试试看,效果不好的话,我就不加载预训练好的权重,直接从零在 CMLR 上训练 sycn_lip...

> ``` > val url = "https://www.eeo.com.cn/2024/0330/648712.shtml" > val session = ScentContexts.createSession() > val document = session.harvestArticle(url, session.options()) > > println(document.contentTitle) > println(document.textContent) > ``` > > [eeo.com.cn爬虫](https://github.com/platonai/PulsarRPAPro/blob/a896725327482bf8cf2fc1b6372b2e2067436e42/exotic-app/exotic-examples/src/main/kotlin/ai/platon/exotic/examples/sites/news/eeo/EEO.kt) > >...

> 如果您需要开源解决方案,请使用以下代码: > > ``` > fun harvestArticle(page: WebPage): TextDocument { > return SAXInput().parse(page.baseUrl, page.contentAsSaxInputSource).also { ChineseNewsExtractor().process(it) } > } > ``` > > `ChineseNewsExtractor`在 PulsarRPA 中实现。 还有大佬,请问下Exotic可以提取详情页吗?

> 目前可以单独main方法跑 但是在springboot中找不到配置注册handler或者配置option的地方,有扩展点吗? 老哥,我有一些想法,可以加微信交流吗?

> 谢谢,已复现 同求分享大佬

> 你好,你的代码我没看,这套逻辑应该是可行的,我实现的效果看起来是正常的。 我估计你这里是ffmpeg命令编写的有问题,可以让gpt帮你写一个complex_filter,或者直接自己写。 分享我的ffmpeg指令给你(仅供参考): ffmpeg_command = [ 'ffmpeg', #'-ss', '10', '-i', original_video_path, # 原始视频路径 '-i', modified_video_path, # 修改后视频路径 '-filter_complex', f"[0:v]trim=duration={modified_video_duration}[ov];[ov][1:v]overlay={overlay_info['start_x']}:{overlay_info['start_y']}:shortest=1[v];[1:a]anull[a]", # 裁剪原始视频并覆盖 '-map', '[v]', # 选择视频流 '-map', '[a]', # 选择音频流...

> 这个简单贴回的逻辑必然对不上,太简单了就不会robust 我现在正常贴上了,我用了ffmpeg将视频截出头部,然后再用代码粘回去,这样完成的视频效果相当好,看不出有拼接的痕迹