sxjeru

Results 212 comments of sxjeru

一次性全部输出确实不错,既简单又符合直觉。不过输出时最好关闭页面自动下滑到底部。 今天测试了很久,感觉页面自动滚到底还是有问题,常常不会自动跟随,有待进一步优化。 输出效果还是不错的。

英文二倍速显示后,英文的输出速度与中文基本保持一致,在中英文混杂时会有明显感觉。 这里的输出速度是指观感上打字机从左往右刷新的速度,吐字符的速度。 https://github.com/user-attachments/assets/013e3447-2ca4-4a51-8dec-2ef438a046c1

那啥,我这边只调了 google gemini 的速度来着,其他模型的速度还没改,所以会很慢。 从之前的一帧 n 字变成一秒 n 字了。

tps 的 t 是 token 吗?值的设置在下图,定义是一秒多少中文字符,英文字符会x2。 ![image](https://github.com/user-attachments/assets/1dbbd433-6086-4cda-9778-65639cbcdefc)

https://lobe-chat-c3aqmun0s-sxjerus-projects.vercel.app/ 是部署没更新吗?可以试下,这边感觉挺快,跟上面的视频一样。

可是流式输出时的“待显示的文本长度”是变化的,除了一个固定的速度输出,忽快忽慢的观感会很差。 并且这个 pr 希望 api 那边输出结束后就直接输出剩余内容,不再浪费时间继续 smoothing。 或者你的期望就是后段加速输出时,固定时间而不是固定速度输出剩余内容?

测试基本上都覆盖了,taichu 那边的测试有点问题,希望能帮忙看看怎么改。

#3356 #3347 也可以合并下,算是从这个 pr 里拆出去的内容。

> 这个问题还在吗? ~~还在,这边梳理了一下问题的重现方式。~~ 选择一个话题,其中只有4条对话,然后设置历史消息数为更大的数,例如10,这时由于话题中没有更多对话,右边的 token 计数器也不会改变。然后刷新,保持在这个话题,会发现历史消息数的“不限制”开关被自动开启。关闭“不限制”,刷新,会发现历史消息数被重置为1。 理论上“不限制”开关不该自动开启,历史消息数也不该自动修改成1。

抱歉,是我这边没更新,此问题已得到解决。