AnyQ
AnyQ copied to clipboard
org.apache.lucene.analysis.baiducn.BaiduAnalyzer这个好像不能使用同义词和停用词
请问您有做区分不同语料吗
请问您有做区分不同语料吗
按照我对你这个问题的理解,AnyQ不具备区分语料的功能。
请问您有做区分不同语料吗
我没有做区分不用语料,因为我也没见到这个功能和配置
那这样的话,可能就是所有不同领域(医疗,教育,科技,知识等不同领域)的问答都混在一起,很容易出问题吧
那这样的话,可能就是所有不同领域(医疗,教育,科技,知识等不同领域)的问答都混在一起,很容易出问题吧
是的,所以现在我自己写了一个FAQ的框架,解决了这个问题,召回阶段使用了ES,相似度的计算使用BERT的句向量。框架的思路跟AnyQ一样。在我自己的数据集上效果还可以。正在往线上部署。
那这样的话,可能就是所有不同领域(医疗,教育,科技,知识等不同领域)的问答都混在一起,很容易出问题吧
改AnyQ的源码代价比较大,主要是我不熟悉C++,所以干脆用python写了一个。
方便加个联系方式聊吗?
------------------ 原始邮件 ------------------ 发件人: "notifications"<[email protected]>; 发送时间: 2020年6月23日(星期二) 上午10:37 收件人: "baidu/AnyQ"<[email protected]>; 抄送: "侯博文。"<[email protected]>;"Comment"<[email protected]>; 主题: Re: [baidu/AnyQ] org.apache.lucene.analysis.baiducn.BaiduAnalyzer这个好像不能使用同义词和停用词 (#230)
那这样的话,可能就是所有不同领域(医疗,教育,科技,知识等不同领域)的问答都混在一起,很容易出问题吧
改AnyQ的源码代价比较大,主要是我不熟悉C++,所以干脆用python写了一个。
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
方便加个联系方式聊吗? … ------------------ 原始邮件 ------------------ 发件人: "notifications"<[email protected]>; 发送时间: 2020年6月23日(星期二) 上午10:37 收件人: "baidu/AnyQ"<[email protected]>; 抄送: "侯博文。"<[email protected]>;"Comment"<[email protected]>; 主题: Re: [baidu/AnyQ] org.apache.lucene.analysis.baiducn.BaiduAnalyzer这个好像不能使用同义词和停用词 (#230) 那这样的话,可能就是所有不同领域(医疗,教育,科技,知识等不同领域)的问答都混在一起,很容易出问题吧 改AnyQ的源码代价比较大,主要是我不熟悉C++,所以干脆用python写了一个。 — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
微信:woaichilizi9693
请问你之前做的这个项目可以发出来做个参考吗?我也是想做一个FAQ的问答,但是一个小白--
请问你之前做的这个项目可以发出来做个参考吗?我也是想做一个FAQ的问答,但是一个小白--
这个项目https://github.com/hhzrd/BERT-Embedding-Frequently-Asked-Question 参考文献中也写了AnyQ项目。再次感谢百度的AnyQ项目。