lishiying comments

Results 23 comments of


                                            lishiying

生成语音时，可否控制语速，这个相关参数在哪里

> 似乎可以通过修改noise_scale来调整语速 noise_scale是什么？在哪里控制？

真好用,简直就是神器

如果可以增加一个socks5的代理支持就好了，这样就可以通过一个通道连接所有端口了。我现在是把转发的端口定位到代理，如果内置代理的话，就可以省掉这个过程。

从昨天开始开始封号？？

用accessToken 的貌似被封了界面不开看不到聊天，看控制台返回500错误。但该账号在美国服的api token还可以用！

> 似乎就是将embedding 由现有的text2vec改为LLM的embedding 层，外加直接io向量。我认为现在的主要面临问题还是LLM总结能力不够嗯，差不多就是这个意思，我不会调大语言模型。这点上我没什么发言权，要会的话我就自己实践了，有了成果总比一篇帖子更有说服力。 LLM的能力这点不用考虑，这和本文也没冲突，就算GPT4在咱们手上，理论上也可以用这个方案增强其能力。就好像人和装备的关系，人可以换，而帖子其实讨论的是装备，或者说怎么指定人和装备的接口，人和装备怎么样配合才可以发挥更强大的实力。如果实践成功，等有了更好LLM，直接换LLM，并从新挂载知识库训练就可以了。

Error response from daemon: unknown or invalid runtime name: nvidia

同样的问题，win11 ![Image](https://github.com/user-attachments/assets/6917aceb-0ddc-4e6f-a3fe-32fbfcda95d0)

在pretrain阶段，处理wudao语料后，用2000切割，后续又切割为500。在get_input_data.py中构建pretrain的source_tokens、target_tokens。这两个会跨越多个 document 吗

因为默认情况下，在预处理 wudao 语料时，每个文件的内容都被视为一个 document。因此，当将每个文件拆分成长度为 2000 的子序列并进一步拆分为长度为 500 的子序列时，每个子序列都属于同一文件中的同一个 document。因此，在构建 pretrain 的 source_tokens 和 target_tokens 时，通常不会涉及到跨越多个 document 的情况。但是，如果在预处理过程中使用了其他的切割方法（如按照段落或句子进行切割），则可能会出现跨越多个 document 的情况。 GPT回答的

建议添加文心一言

文心一言? 这东西你还用?送我都不用

希望能够兼容m3u8嵌套

同样的问题。win直接0字节。linux更气人，下载N久，说成功，最后一看0字节

lishiying

生成语音时，可否控制语速，这个相关参数在哪里

生成语音时，可否控制语速，这个相关参数在哪里

windows 下cpu部署将模型clone后报错

真好用,简直就是神器

从昨天开始开始封号？？

斗胆和大佬们讨论一个知识库相关的技术方案是否可行

Error response from daemon: unknown or invalid runtime name: nvidia

在pretrain阶段，处理wudao语料后，用2000切割，后续又切割为500。在get_input_data.py中构建pretrain的source_tokens、target_tokens。这两个会跨越多个 document 吗

建议添加文心一言

希望能够兼容m3u8嵌套