yanguangqing comments

Results 25 comments of


                                            yanguangqing

关于主题抽取的数据集是哪个

这个数据集是百度数据抽取大赛的数据集，加我微信17710158550，我私下发给你

关于主题抽取的数据集是哪个

链接：https://pan.baidu.com/s/1YMkNQdDSd0q7vfuuu7T4-g 提取码：n929 复制这段内容后打开百度网盘手机App，操作更方便哦

关于主题抽取的数据集是哪个

另外的数据集是代码中对已有数据集进行预处理之后生成的，你可以看看代码里面哪里生成了文件从而获取到数据集

关于主题抽取中的代码

能把苏老师逼成这样子的你也是厉害，主要是因为数据传输的过程中会有一定的数据丢失，或者是数据转存中的方法不统一，所以造成读取文件的时候会报错，针对数据集做一些优化这个必不可少

` train_ds = load_dataset(reader, data_path=args.train_path, max_seq_len=args.max_seq_len, lazy=False) dev_ds = load_dataset(reader, data_path=args.dev_path, max_seq_len=args.max_seq_len, lazy=False)` 这段代码中的lazy建议开启为true。可能会一定程度上环节coredump的情况。

使用UIE时不稳定coredump,且没有任何提示

试了一下不能解决，目前看来只能将数据量降低来解决这个问题了。

使用UIE时不稳定coredump,且没有任何提示

是啊是啊连环报错我现在也在改可真是艰难我看起来是因为负样本构造比例问题但是调节了之后依旧报错

使用UIE时不稳定coredump,且没有任何提示

这是一个bug 我还没改明白

RuntimeError('cannot join current thread',) in <object repr() failed>

我也遇到了一样的问题，减小了batch size之后就好了或者是重新运行一次。很偶然