MWPToolkit
MWPToolkit copied to clipboard
我尝试着将math23k数据集加一些ape200k数据,但是出现了问题,请问这该如何解决?谢谢您
因为ape200k的segmented_text是以字为粒度进行训练,我将ape200k测试集进行重新分词成math23k里的segmented_text格式,即以词为单位。如下图。然后将处理好格式的ape200k测试集数据加入到math23k测试集里。
但是这是错误提示:
数据格式与math23k一致,试了几个算法模型都存在问题,不知问题所在,故请教