我正在运行一个线性回归,具有固定的效果和由某个组聚类的标准误差。
areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id)一行代码如下所示,输出如下:

现在,t-stats和P值看起来不一致。我们怎么可能有t-stat >5和pval >11%呢?类似地,95%的置信区间似乎比系数宽得多。+- 2标准错误。
我遗漏了什么?
发布于 2020-05-26 02:58:08
这里没有不一致的地方。你有一个很小的样本量和一个不太节俭的模型,并且几乎没有自由度。请注意,areg不会为模型发布F统计量或P值,这是一个强烈的危险信号。您的t统计数据与手工检查结果一致:
. display 2 * ttail(1, 5.54)
.11368912
. display 2 * ttail(1, 113.1)
.00562868简而言之,这里没有bug,也没有编程问题。这只是你的模型过度拟合你的数据及其副作用的问题。
类似地,95%置信区间的+/- 2SE在这里是经验法则。再说一次,手工计算很有启发性:
. display invt(1, 0.975)
12.706205
. display invt(60, 0.975)
2.0002978
. display invt(61, 0.975)
1.9996236
. display invnormal(0.975)
1.959964https://stackoverflow.com/questions/62008794
复制相似问题