sxjeru comments

Results 212 comments of


                                            sxjeru

💄 style: Optimize smooth output

一次性全部输出确实不错，既简单又符合直觉。不过输出时最好关闭页面自动下滑到底部。今天测试了很久，感觉页面自动滚到底还是有问题，常常不会自动跟随，有待进一步优化。输出效果还是不错的。

💄 style: Optimize smooth output

英文二倍速显示后，英文的输出速度与中文基本保持一致，在中英文混杂时会有明显感觉。这里的输出速度是指观感上打字机从左往右刷新的速度，吐字符的速度。 https://github.com/user-attachments/assets/013e3447-2ca4-4a51-8dec-2ef438a046c1

💄 style: Optimize smooth output

那啥，我这边只调了 google gemini 的速度来着，其他模型的速度还没改，所以会很慢。从之前的一帧 n 字变成一秒 n 字了。

💄 style: Optimize smooth output

tps 的 t 是 token 吗？值的设置在下图，定义是一秒多少中文字符，英文字符会x2。 ![image](https://github.com/user-attachments/assets/1dbbd433-6086-4cda-9778-65639cbcdefc)

💄 style: Optimize smooth output

https://lobe-chat-c3aqmun0s-sxjerus-projects.vercel.app/ 是部署没更新吗？可以试下，这边感觉挺快，跟上面的视频一样。

💄 style: Optimize smooth output

可是流式输出时的“待显示的文本长度”是变化的，除了一个固定的速度输出，忽快忽慢的观感会很差。并且这个 pr 希望 api 那边输出结束后就直接输出剩余内容，不再浪费时间继续 smoothing。或者你的期望就是后段加速输出时，固定时间而不是固定速度输出剩余内容？

♻️ refactor: temperature should from 0 to 2

测试基本上都覆盖了，taichu 那边的测试有点问题，希望能帮忙看看怎么改。

♻️ refactor: temperature should from 0 to 2

#3356 #3347 也可以合并下，算是从这个 pr 里拆出去的内容。

[Bug] 使用历史消息数与设置不符

> 这个问题还在吗？ ~~还在，这边梳理了一下问题的重现方式。~~ 选择一个话题，其中只有4条对话，然后设置历史消息数为更大的数，例如10，这时由于话题中没有更多对话，右边的 token 计数器也不会改变。然后刷新，保持在这个话题，会发现历史消息数的“不限制”开关被自动开启。关闭“不限制”，刷新，会发现历史消息数被重置为1。理论上“不限制”开关不该自动开启，历史消息数也不该自动修改成1。

[Bug] 使用历史消息数与设置不符

抱歉，是我这边没更新，此问题已得到解决。