jeff31415

Results 4 comments of jeff31415

> 好滴 180B的模型也是基于BLOOM 176B继续训练的来的吗?那么性能应该还是不差的,不清楚继续训练是否导致了其他语言(包括代码)的遗忘?🤔

> # 量化的180b感觉能力很弱啊.是我的姿势不对吗? 上下文经常是混乱的: > prompt("exit" to end, "clear" to clear session) >>> 你好 > # ==================================================================================================== > prompt("exit" to end, "clear" to clear session) >>> 请提取出下面商品标题中的品牌词、产品词和型号词: OPPO Ace 2...

> 默认加载dataset_dir下所有以txt结尾的文件。从报错信息看,并没有找到这些文件 好的,感谢解答。如果需要使用.json格式的数据集,应该要修改代码吧🤔

Impressive model, and potentially a CPU friendly model(if you have >96GB memory)