kintan
kintan
这是个交错的视频。你可以测下不同的反交错模式。看下那个的效果更好。 现在默认是1 你可以改成其他的值。 Picker("yadif Mode", selection: $yadifMode) { Text("yadif").tag(0) Text("yadif_2x").tag(1) Text("yadif_spatial_skip").tag(2) Text("yadif_2x_spatial_skip").tag(3) }
我有用apple的 SFSpeechRecognizer来做实时的文字翻译。但是翻译效果很差。希望在iOS 18. apple能够实现利用ai的能力,让这个翻译效果变好。你说的Whisper CCP 我试下。看好不好接入。
我初步试了下,实时增量的语音转字幕是不行的。无法输出文字。后来我换成自己把音频汇总起来,那就可以输出文字了。但是只能输出第一段,并且视频就会变成没有声音。所以目前这个功能实现卡住了
这个你们可以找到复现的路径吗?
我是打算把这个做成一个功能:实时把播放的音频转为文字。实现实时字幕的能力。但是初步尝试了下。苹果的离线音频识别效果不是很好。这个功能还比较简陋。
我在app上增加了英语 ai字幕的能力。但是效果不是很好。你可以体验下。目前是使用apple的本地ai能力。
如果音频是dolby atoms的话,那会crash。你可以用其他的音频例如 双声道的立体声
我优化了下音频。你再试下会不会有这个问题
我在lgpl分支支持Annex-B videotoolbox硬解码了
这个crash是最近的代码引起的吗?还是很早就会了。有完整的crash堆栈的信息吗?你发的信息无法看出是哪一行代码引起的。