yuanhang0
yuanhang0
安定段位文档里提到的 $g(\hat{p}) = (A_1X_1+A_2X_2+A_3X_3)/X_4$ 是 $g(p) = (A_1p_1+A_2p_2+A_3p_3)/p_4$ 的MLE,但是是有偏估计,这是对的。安定段位的有偏性一节里,有小typo,在计算概率和期望的时候 $X_4$ 应该是 $p_4$。 但是目前的置信区间的计算方法是不准确的,文档里记录的现在的方法实际上在N小(10000)的时候都表现的不好。我尝试了两种理论上合理的计算置信区间的方法,用R生成并验证了他们在N不同的时候的10000次的模拟结果: N = 500, 模拟:287.3585,446.6667 当前:303.3648,345.8318 方法1:293.0006,456.3935 方法2:281.8827,367.3140 N = 1000, 模拟:296.1000, 402.2785 当前:291.9306, 350.6110 方法1:298.6237,404.7964 方法2:291.6129,350.9287 N...
关于把这个估计从有偏改成无偏的思路是计算 $E[g(\hat{p})] =E[ (A_1X_1+A_2X_2+A_3X_3)/X_4]$ 然后rescale到 $g(p) = (A_1p_1+A_2p_2+A_3p_3)/p_4$……不过计算有点繁琐,可能并不值得探索……有时间让wolfram alpha算一下好了。
> @yuanhang0 感谢您的建议,确实直接采样是最方便的方法了,我自己拟合公式也是和采样结果拟合,当时可能考虑不想每次得出不一样的结果才找了个差不多的公式随便用一下。。请问你这里模拟时的次数和方法1中的m都取了多少?我之后考虑段位计算时固定随机种子用采样的方法实现。 方法2的话,我不会rust所以看不太懂这段代码。。只不过用1就没什么问题了,我之后再慢慢研究吧,谢谢! 不客气!模拟的次数我都用了10000次,方法1里的m我用了1000,因为我发现1000的时候表现就已经不错了而且基本不占计算时间。 方法2是R的代码,我是用delta method去估计了这个东西的方差,样本小的时候表现不如1,在场次N=10000的时候才接近,实现1就可以了!