kevin2yl comments

Results 4 comments of


                                            kevin2yl

一键三连第二步（SSL提取报错）

> ![image](https://private-user-images.githubusercontent.com/80459680/317187195-eff8c673-981e-4711-83ad-f634b77ac84f.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MTIwNDQ4MzYsIm5iZiI6MTcxMjA0NDUzNiwicGF0aCI6Ii84MDQ1OTY4MC8zMTcxODcxOTUtZWZmOGM2NzMtOTgxZS00NzExLTgzYWQtZjYzNGI3N2FjODRmLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA0MDIlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwNDAyVDA3NTUzNlomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTE2Y2M1NWQ3MWNhNGY1YzZkZjZhN2M0Nzg5Y2U0YTgzN2Y5OTI3ZjNiNDg2NjlkMzFkNzNlNTcxY2JhMDFmMjYmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.4qtoXntZPSEdPICl6FyjNJap3QjhskkM4Edf3FIJHZU) 请问各位这种错误要如何解决你可以尝试下，训练中文，看是否也有同样的问题；或者你可以试下，逐个操作，并检查你配置的标注和音频路径是不是对的

支持并发吗

> 每次选择模型的时候，会更改 ![image](https://private-user-images.githubusercontent.com/32160289/317975472-f5f18ee4-df46-4e81-b86c-2a3815f3cd49.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MTIwNDQ2MzksIm5iZiI6MTcxMjA0NDMzOSwicGF0aCI6Ii8zMjE2MDI4OS8zMTc5NzU0NzItZjVmMThlZTQtZGY0Ni00ZTgxLWI4NmMtMmEzODE1ZjNjZDQ5LnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA0MDIlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwNDAyVDA3NTIxOVomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWEyNWNhYjUzZDNlMzc1ZDMyZTkyMGFlMDg4NjBhZTZmZTkyNTkyNzAyYzg3NWIyODQ5MWRmZjhlMmQ0NjMyZmYmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.Sc7kjm4e-_ehLoI_JxbNh5yNKa24ZSWpmTVSHsDe41Q) 按我这样做，然后api可以启动多个 1、2、3、4、5 实测没问题请教一下，启用某个模型，不是一个全局的行为吗，这样做会不会存在并发时串模型的问题

0306版本GPT-SoVITS客户端推理多文本情况出现间接性复读参考文本内容的问题

> *运行项目版本号0306 数据集采用的是红血球大佬提供的原神音频数据集,且标注没有问题. > > ![1710250626006](https://private-user-images.githubusercontent.com/70120540/312097134-a652d284-9bbe-4f92-a42d-c452c7e66dda.jpg?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MTE2MjA1NjgsIm5iZiI6MTcxMTYyMDI2OCwicGF0aCI6Ii83MDEyMDU0MC8zMTIwOTcxMzQtYTY1MmQyODQtOWJiZS00ZjkyLWE0MmQtYzQ1MmM3ZTY2ZGRhLmpwZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDAzMjglMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwMzI4VDEwMDQyOFomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTUzMTZhYzQwN2IzMjg4Y2M5YjdiNDlhNzRjYTk2ZjVjOWEwMTgzMGRiZDk4ZjI4ZjY0ZjkwMWRiNmM3MjJkMDQmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.hfU-523na-Rk42b0mdudReXGRczVhgYfN_iqZCqEuwI) 1.大概从百度复制了500字左右的作文,填写到需要合成的文本的框中. 2.切分尝试过两种,分别是(按标点符号切,凑50字一切),这两种均有读着读着就念一下参考音频文本的问题,比如读着读着他就会念(好好放松一下.)这句话是参考音频文本内的话. 3.最开始我怀疑过是不是参考音频的问题,我就换了另外一个5秒的参考音频,但是任然有间接性复读参考音频文本部分内容的可能,读到后面甚至胡言乱语. 4.用的ubuntu系统环境搭建在conda上 5.使用python3.9 cuda11.8 有使用项目中提供的sh文件来搭建环境. 6.最开始我以为是在ubuntu才有这种问题，后面我换了一台电脑在win10上使用0306也是一样的复读问题 7.不只是一个模型，我也练了其他的角色的模型好像均有这种问题，我觉得不是模型的问题，因为我把0306训练好的模型拿到github主分支的项目上用没遇到复读问题。 8.推理短的文本不容易触发这个复读问题，请尝试使用0306版本的整合包使用百字以上的文本做测试，就可以复现了。 > > 最终我选择放弃0306整合包，去github上拉取仓库中主分支的代码，经过测试貌似这种问题只有0306版本会有，主分支的代码不会有这种复读的问题。我没有使用0306的整合包，直接使用官方的主分支（2天前下载的），然后在linux上搭建的，推理长文本，也会出现重复读，且偶尔还有吞字的情况

0306版本GPT-SoVITS客户端推理多文本情况出现间接性复读参考文本内容的问题

> 0306fix2 现在复读的概率变小了 500字只会出现一次读参考音频结尾几个字的情况，但是新的问题又出现了,貌似会小概率复读需要生成的文本框内的内容，以及出现了吞字现象。我两天前下载的主分支，自己按文档在linux搭，推理时，依然有你说的问题（重复读、吞字依然存在）