ngender
ngender copied to clipboard
兩個字的姓名
兩個字的姓名有很高的比例被判定為男性....
原因应该是
3个字的名字稀释了2个字名字 的比例
就是 P(三丰)<> P(三) * P(丰)
就是作者的这句话
当X条件独立时, P(X|Y) = P(X1|Y) * P(X2|Y)
举个极端例子
*如花 女->1.0
*花 女->1.0
套入上面公式 可以推断出来
*如 女->1.0
这是不对的
要把如花当一个字来处理才OK
这样也不会出现这种问题了
x条件独立时。对于名字来说,x条件独立,就有点困难了。