第十章 卡方检验
卡方检验(Chi-Squared Test或 $\chi ^{2}$ Test)是一种统计量的分布在零假设成立时近似服从卡方分布( $\chi ^{2}$分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。
辛普森悖论
边际关联的结果和条件关联的结果方向矛盾的情况称为辛普森悖论(Simpson’s paradox)
杀人犯的种族是否会影响判处死刑的问题。
对 1976-1977年美国佛罗里达州20个地区杀人案件中的674个被告进行调查, 考虑的种族有白人 和黑人, 用 是 和 否 表示是否判处死刑。调查后把已有数据整理成表格形式
Table 1: 种族死刑数据
白人 | 黑人 | |
是 | 53 | 15 |
否 | 430 | 176 |
死刑百分比 | 11 | 7.9 |
试检验判处死刑是否与杀人犯的种族有关
|
|
Pearson’s Chi-squared test with Yates’ continuity correction
data: a
X-squared = 1.1447, df = 1, p-value = 0.2847
说明判处死刑与种族没有显著关系
死刑判决表的细节
受害人种族 | 被告人种族 | 死刑 | 死刑百分比 | |
白人 | 白人 | 53 | 414 | 11.3 |
黑人 | 11 | 37 | 22.9 | |
黑人 | 白人 | 0 | 16 | 0 |
黑人 | 4 | 139 | 2.8 | |
小计 | 白人 | 53 | 430 | 11 |
黑人 | 15 | 176 | 7.9 |
考虑条件列联表 受害人为白人
Table 2: 死刑判决分表之受害人为白人
受害人种族 | 被告人种族 | 死刑 | |
白人 | 白人 | 53 | 414 |
黑人 | 11 | 37 |
|
|
Pearson’s Chi-squared test with Yates’ continuity correction
data: a
X-squared = 4.3416, df = 1, p-value = 0.03719
考虑受害人为黑人
Table 3: 死刑判决分表之受害人为黑人
受害人种族 | 被告人种族 | 死刑 | |
黑人 | 白人 | 0 | 16 |
黑人 | 4 | 139 |
|
|
Pearson’s Chi-squared test with Yates’ continuity correction
data: a
X-squared = 0, df = 1, p-value = 1
警告信息:
In chisq.test(a) : Chi-squared近似算法有可能不准