Lai
Lai
2024-01-09 22:57:55,160 - main.py[line:29] - ERROR: 程序发生了错误: Exception Type: OperationalError Exception Value: no such table: ContactLabel details: Traceback (most recent call last): File "app\ui\chat\chat_window.py", line 137, in run File "app\DataBase\micro_msg.py",...
同问
找一个更稳定的人脸关键点,替换掉预处理的extract_landmarks
[codes_0.zip](https://github.com/user-attachments/files/16104471/codes_0.zip) 解压后执行 python tools/vqgan/inference.py -i "codes_0.npy" --checkpoint-path "checkpoints/fish-speech-1.2/firefly-gan-vq-fsq-4x1024-42hz-generator.pth" 我的文本是:她的渴望让静水泛起涟漪。若代价只是孤独,那就让这份愿望肆意流淌。 https://github.com/fishaudio/fish-speech/assets/16934884/44341cb4-2f54-4c6f-b674-67290704d8e9 结果:出现了吞字和读不完的现象。更新了1.2版本之后,这个问题好像更严重了。是我的问题吗?
> You can try to recognize the face of the original video (half body or full body), and then also recognize the face of the 512 video, and scale it...
> 对齐人脸主要出现问题,1、如果1帧对1帧,2帧对2帧是肯定会抖动的,那么可以采用先对齐第一帧,后面的都对齐第一帧的坐标;但如果只对齐人脸会出现另外的问题,比如说话是,原视频是张嘴,而推理视频是闭嘴的时候,原视频的下巴就会过长,所有通常情况下,可以考虑识别人脸后扩大人脸区域做蒙版,就基本上可以解决这些问题了。 对齐之后使用,后面都使用第一帧的坐标?应该不行把,当你回帖的时候会出现问题把. 不知道你是使用什么方式人脸对齐后贴回的. 我这的做法是, 我说下伪代码 ``` python # align_frame : 源视频帧帧 nerf_frame : 推理视频帧 # 获取到对齐人脸,还原矩阵 align_source_frame , inverse_matrix_source = face_alignment_frame(align_frame) align_nerf_frame , inverse_matrix_nerf= face_alignment_frame(nerf_frame) # 换脸 align_swap_frame =...
> > 我现在也在这里卡住 > > 有解决思路吗 等个10来20分钟,它会执行下去的。或者使用单进程执行。加上--force_single_process再试试
>  应该是没有设置CUDA_VISIBLE_DEVICES=0,你更新下代码,我看作者已经加上了.
一样,你视频的收音好吗
改一下preload方式