THULAC
THULAC copied to clipboard
Hadoop streaming不能读取model
我在本地编译之后,可以执行成功,但是通过Hadoop streaming 的方式执行分词的话,会报错,说模型数据文件找不到,但是我已经设置了Hadoop对文件进行分发。
不知道这个问题您解决了没有,找不到的话您可以检查下模型文件是放在DFS上还是本地的文件系统上了
谢谢,已经解决了,是因为读取模型数据文件的代码中open函数的标志位是"r+b",需要写权限。在集群环境上权限限制造成的。我把代码中+去掉就OK了。