yaoxiaoyuan comments

Results 8 comments of


                                            yaoxiaoyuan

图像描述训练

你可以参考https://github.com/yaoxiaoyuan/mimix/blob/main/example_train_image_caption.py

原理可以参考如下论文： 1. Attention Is All You Need 2. Language Models are Unsupervised Multitask Learners 3. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 训练数据来自于一些开源数据以及自己爬取的数据，因为版权和隐私问题无法完全公布。你可以自行搜索一些相关论文开源的数据资源。

模型原理

什么格式都可以，只要是合理的输入输出，并且开发好解析数据的代码就可以。可以参考例子example_train_seq2seq.py，这个例子里所用的数据格式为每条数据对应一条json，输入为src字段，输出为trg字段。

关于文本摘要生成算法中，输入字数限制的问题

你好，你需要输入多长的文本？模型是有最长长度限制的，因此不能超过模型的最长长度，现在下载链接里的这个模型长度限制在512以内。

关于文本摘要生成算法中，输入字数限制的问题

你可能没有明白，这个没有办法修改，每个模型都有自己的最长长度限制，不是改一句代码可以解决的。这个模型的输入长度限制在512字以内。只有重新训练一个可以支持更长长度的才可以。

requirements.txt

简单添加了需要的库。应该基本上把torch相关的装好就可以了，如果想更好的交互测试需要装streamlit。

关于标签生成

这个模型训练的时候没有考虑数量，因此没有办法直接控制数量。

训练

参考最新的代码。增加了训练的简单示例。