lishiying

Results 23 comments of lishiying

> 似乎可以通过修改noise_scale来调整语速 noise_scale是什么?在哪里控制?

> 现在只能通过参考语音。后面想加语速滑竿的 等待大佬出此功能!!!

你可以win运行?我安装环境都过不去

如果可以增加一个socks5的代理支持就好了,这样就可以通过一个通道连接所有端口了。我现在是 把转发的端口 定位到代理,如果内置代理的话,就可以省掉这个过程。

用accessToken 的貌似被封了界面不开看不到聊天,看控制台返回500错误。但该账号在美国服的api token还可以用!

> 似乎就是将embedding 由现有的text2vec改为LLM的embedding 层,外加直接io向量。 我认为现在的主要面临问题还是LLM总结能力不够 嗯,差不多就是这个意思,我不会调大语言模型。这点上我没什么发言权,要会的话我就自己实践了,有了成果总比一篇帖子更有说服力。 LLM的能力这点不用考虑,这和本文也没冲突,就算GPT4在咱们手上,理论上也可以用这个方案增强其能力。 就好像人和装备的关系,人可以换,而帖子其实讨论的是装备,或者说怎么指定人和装备的接口,人和装备怎么样配合才可以发挥更强大的实力。 如果实践成功,等有了更好LLM,直接换LLM,并从新挂载知识库训练就可以了。

同样的问题,win11 ![Image](https://github.com/user-attachments/assets/6917aceb-0ddc-4e6f-a3fe-32fbfcda95d0)

因为默认情况下,在预处理 wudao 语料时,每个文件的内容都被视为一个 document。因此,当将每个文件拆分成长度为 2000 的子序列并进一步拆分为长度为 500 的子序列时,每个子序列都属于同一文件中的同一个 document。因此,在构建 pretrain 的 source_tokens 和 target_tokens 时,通常不会涉及到跨越多个 document 的情况。 但是,如果在预处理过程中使用了其他的切割方法(如按照段落或句子进行切割),则可能会出现跨越多个 document 的情况。 GPT回答的

文心一言? 这东西你还用?送我都不用

同样的问题。win直接0字节。linux更气人,下载N久,说成功,最后一看0字节