Li Yudong (李煜东)

Results 50 comments of Li Yudong (李煜东)

后面会考虑建用户群 ________________________________ 发件人: Knihht ***@***.***> 发送时间: Friday, March 31, 2023 2:46:11 PM 收件人: ydli-ai/Chinese-ChatLLaMA ***@***.***> 抄送: Li Yudong ***@***.***>; Comment ***@***.***> 主题: Re: [ydli-ai/Chinese-ChatLLaMA] 训练时 gpu的耗时能透露一下吗 (Issue #7) 目前版本训练大概用了2天 大佬...

文档中已更新数据格式的详细介绍哈 ________________________________ 发件人: Chen Mao ***@***.***> 发送时间: Thursday, April 13, 2023 3:13:39 PM 收件人: ydli-ai/Chinese-ChatLLaMA ***@***.***> 抄送: Subscribed ***@***.***> 主题: Re: [ydli-ai/Chinese-ChatLLaMA] llama 自己数据增量预训练数据格式 (Issue #19) 请问预处理输入的数据格式是什么 这个自己解决了 谢谢 ―...

1. 对 2. 对效果没有影响,会增加token数量 ________________________________ 发件人: bahapku ***@***.***> 发送时间: Monday, April 10, 2023 8:42:31 PM 收件人: ydli-ai/Chinese-ChatLLaMA ***@***.***> 抄送: Subscribed ***@***.***> 主题: [ydli-ai/Chinese-ChatLLaMA] 词表扩充 (Issue #20) 大佬请教一下,1. 按照你的思路,相当于更新所有层参数对吗? 2. 中文词表没有扩充,这部分有影响吗?有的话...

你好,没有论文原文数据,只有元信息。 ________________________________ 发件人: Cheng Hiuyi ***@***.***> 发送时间: Friday, March 15, 2024 9:18:57 PM 收件人: ydli-ai/CSL ***@***.***> 抄送: Subscribed ***@***.***> 主题: [ydli-ai/CSL] 你好,数据集是每个论文处理后的吗?原始论文数据源存在吗?例如pdf,latex,html等 (Issue #16) ― Reply to this email directly,...

这个链接只是机构信息,不是数据源 ________________________________ 发件人: Cheng Hiuyi ***@***.***> 发送时间: Tuesday, April 23, 2024 5:32:50 PM 收件人: ydli-ai/CSL ***@***.***> 抄送: Li Yudong (李煜东) ***@***.***>; Comment ***@***.***> 主题: Re: [ydli-ai/CSL] 你好,数据集是每个论文处理后的吗?原始论文数据源存在吗?例如pdf,latex,html等 (Issue #16) 你公开的链接里面找不到论文呀。是哪个入口可以说一下吗?https://nstr.escience.net.cn...

本项目不提供全文 ________________________________ 发件人: Kouuh ***@***.***> 发送时间: Tuesday, July 4, 2023 11:05:35 PM 收件人: ydli-ai/CSL ***@***.***> 抄送: Subscribed ***@***.***> 主题: [ydli-ai/CSL] 数据集全文如何获取? (Issue #10) 想请问下,我点了README中的国家科技资源共享服务工程技术研究中心,在网站中没找到怎么查找数据的入口? ― Reply to this email directly,...

不包含 ________________________________ 发件人: chenhuawei2019 ***@***.***> 发送时间: Thursday, March 9, 2023 10:32:54 AM 收件人: ydli-ai/CSL ***@***.***> 抄送: Subscribed ***@***.***> 主题: [ydli-ai/CSL] 数据集内容问题 (Issue #8) 作者您好,我想问一下您,在这四十万数据中是否包含专利文本~ ― Reply to this email directly,...

没有prompt ________________________________ 发件人: mynewstart ***@***.***> 发送时间: Friday, August 18, 2023 11:42:19 AM 收件人: CVI-SZU/Linly ***@***.***> 抄送: Subscribed ***@***.***> 主题: Re: [CVI-SZU/Linly] 关于平行语料的预处理 (Issue #93) 同问,预训练的时候需要加prompt吗,比如please translate English to Chinese ―...

没有影响 ________________________________ 发件人: parkLGW ***@***.***> 发送时间: Friday, July 21, 2023 5:22:07 PM 收件人: CVI-SZU/Linly ***@***.***> 抄送: Subscribed ***@***.***> 主题: Re: [CVI-SZU/Linly] 关于33B模型预训练语料长度 (Issue #96) 请问您现在对这个问题有答案了吗 ― Reply to this email...