zouweidong

Results 3 comments of zouweidong

感谢作者的源码,今天用docker 重新部署了下,教程也已经写了,欢迎大家访问 http://www.zwdong.top/ 穷啊,只能用top域名了

> > 这个是自己按照LGPMA方案中所需要的标签去标注的,主要就是单元格的坐标信息以及单元格跨行跨列的信息。 请问表格标注用的什么工具。 标注了多少训练数据呢

> 一样 hf上下的的模型 decoder的时候报错 我看到tokenizer的vocob数量是64789 我这边生成的token是64881 报超出范围了 我又看了 chatglm-2的分类头大小是65024 感觉是tokenizer没对上? 你是对的,确实数字对不上,微调之后模型会预测出一些大于vocab_size的index。 不知道官方为什么vocab_size和分类头大小不一致。目前简单粗暴的方法就是,把他的SPTokenizer稍微改下,超出索引的直接返回空字符就可以了。 ``` def convert_id_to_token(self, index): """Converts an index (integer) in a token (str) using the vocab.""" # if index...