【笔记】Regression, T-test, ANOVA, ANCOVA
【补充】SPSS协方差分析
https://spssau.com/helps/advancedmethods/covanova.html
——————————————————————————————————————————
回归(Regression): 基于一个或多个连续型变量来预测另一个连续型变量的统计模型。
T-test: 比较两个平均数的差异是否显著。用于只有一个分类变量且是二分类变量的情况。
方差分析(ANOVA): 基于一个或多个分类变量来预测另一个连续型变量的统计模型。
协方差分析(ANCOVA):基于至少一个分类变量和至少一个连续型变量来预测另一个连续型变量的统计模型。
*回归与方差的共性:两个模型都需要连续型的结果变量。
——————————————————————————————————————————
ANCOVA (Analysis of Covariance)目的:比较不同分类变量间回归线的不同。
可能产生的结果:
1. 斜率相同,截距也相同;
2. 斜率相同,截距不同;
3. 斜率不同,截距相同;
4. 斜率不同,截距也不同。
H0: 分类变量不影响自变量与因变量间的回归关系。
——————————
ANCOVA检定过程
Step 1. 先求一般线性模型,以观察因变量是如何被自变量影响的以及分类变量是如何影响自变量的。
影响显著标志:回归线的斜率有显著差异。
Step 2. 如果上一步的斜率没有显著差异,那么就要用一般线性模型求因变量是如何被分类变量影响(保持连续自变量恒定)。
——————————
ANCOVA假设
1. 变量y与x有线性关系并且有大致相等的方差;
2. 点之间彼此独立 (残差不相关-无时间序列);
3. 变量y对所有x是连续的;
4. y的分布对于所有的x符合正态分布;
5. 线性回归斜率对于所有组相同(仅针对full ANCOVA, 测试截距区别用)。
——————————
汇报ANCOVA分析结果
需要提供:
1. 表示数据的散点图(颜色编码的点以及最佳拟合回归线);
2. test name;
3. F statistic值;
4. 自由度;
5. p值。
根据测试内容决定仅仅描述斜率或者斜率+截距。需要描述不同组间的斜率(and/or 截距)差别。
——————————
ANCOVA in R
可以使用 aov() 或者 lm() function (因为模型针对的都是一般线性回归)
aov(dependent ~ independent*factor, data = data_frame)
*符号会检测连续自变量和分类变量的影响,以及两者间的截距。
如果结果是不显著,可以单独检测分类变量(不包括两者间互动):
aov(dependent~independent + factor, data = data_frame)
+号会检测连续自变量和分类变量的影响。
——————————
References:
[1] Richard_Zhou, ANOVA与ANCOVA的区别 https://www.jianshu.com/p/c95bc536ca35
[2] Matthew E. Clapham, 21: ANCOVA https://www.youtube.com/watch?v=LbALMywWiKc&t=194s
[3] Tom Sherratt, Analysis of Covariance in RStudio https://www.youtube.com/watch?v=9S4eMi8uW68&t=313s