albert_zh icon indicating copy to clipboard operation
albert_zh copied to clipboard

6层albert模型的发布问题

Open KunWangR opened this issue 5 years ago • 13 comments

目前发布的albert_tiny模型仅有4层,虽然模型体量小,但模型效果与其他模型还是有差距。albert_base有12层,但模型整体规模比较大,预测效率还是与bert_base、roberta_base预测效率相近。所以希望作者可以发布6层的albert模型,以适应更多的任务需求。谢谢。

KunWangR avatar Oct 28 '19 12:10 KunWangR

如果有其他5到10个人也用同样问题,可以列入工作计划。

brightmart avatar Oct 28 '19 13:10 brightmart

希望能有6层模型,谢谢大哥!

algoflow19 avatar Oct 30 '19 05:10 algoflow19

同求!感谢

nwboss avatar Oct 30 '19 05:10 nwboss

同求,希望作者发布大点的albert模型,遇到一样的问题惹

Joyce-Ng avatar Oct 30 '19 12:10 Joyce-Ng

了解,还有其他同学也有类似的问题吗?

brightmart avatar Oct 30 '19 14:10 brightmart

同求..

semal avatar Nov 06 '19 01:11 semal

已经发布了,你们试一试。LCQMC数据集上,测试集比brert_base下降0.9个点;pytorch版本,测试了只下降了0.1个点。 见 albert_small_google_zh这个模型。 @KunWangR @semal @NongW @develpoerkk

brightmart avatar Nov 06 '19 01:11 brightmart

发现新发布的small版本的config文件有些问题,与发布的模型参数不一致,在调用的时候出错,希望作者查看一下。ValueError: Shape of variable bert/embeddings/LayerNorm/beta:0 ((384,)) doesn't match with shape of tensor bert/embeddings/LayerNorm/beta ([128]) from checkpoint reader

KunWangR avatar Nov 06 '19 05:11 KunWangR

调用small,需要用到google的代码具体你看看这个: image

brightmart avatar Nov 06 '19 06:11 brightmart

直接 pip install sentencepiece

brightmart avatar Nov 06 '19 06:11 brightmart

发现新发布的small版本的config文件有些问题,与发布的模型参数不一致,在调用的时候出错,希望作者查看一下。ValueError: Shape of variable bert/embeddings/LayerNorm/beta:0 ((384,)) doesn't match with shape of tensor bert/embeddings/LayerNorm/beta ([128]) from checkpoint reader

是的我也遇到这个问题,zip里albert_config_small_google.json并不是合适的参数文件,请问您解决了么 @KunWangR

nlp4whp avatar Dec 13 '19 13:12 nlp4whp

不是的啊。你参考一下「下游任务」的例子

brightmart avatar Dec 13 '19 15:12 brightmart

不是的啊。你参考一下「下游任务」的例子

抱歉是我用错了modeling.py,感谢回复

nlp4whp avatar Dec 14 '19 04:12 nlp4whp