PaddleMIX
PaddleMIX copied to clipboard
[wip] add mix schema
PaddleMIX统一多模数据格式
- [x] 纯文
- [x] 单图
- [x] 多图
- [x] interleaved
- [ ] 音频
- [ ] 视频
功能
- [x]
MIX格式定义和检查 - [x]
MM格式到MIX格式转换Op
特殊字段
- [x]
images <-> <image>id</image> - [ ]
audios <-> <audio>id</audio> - [ ]
videos <-> <video>id</video>
[
{
'id': '000002b66c9c498e',
'images': [
{
'id': 0,
'url': 'train/000002b66c9c498e.jpg',
'heigh': 100,
'width': 100,
},
{
'id': 1,
'url': 'train/000002b66c9c498e.jpg',
'heigh': 100,
'width': 100,
},
],
'conversations': [
{
'from': 'user',
'value': '<image>id</image><image>id</image> xxxx'
},
{
'from': 'assistant',
'value': 'xxx'
},
{
'from': 'user',
'value': 'xxxx <image>id</image>'
},
{
'from': 'assistant',
'value': 'xxx'
}
],
},
]
Thanks for your contribution!