心理学考研312 | 心理统计:推断统计的数学基础
第一部分——考试大纲

第二部分——考点分析

综合来看,心理统计这一部分在统考卷中所占分值为35分左右,主要有10道左右的单选题、一道多选题(在74或75题考查),一道简答题或者是一道综合题。从曲线图中可以看到有四年的分值较高,说明这四年的综合题83题考查的正是统计部分的知识。简答题或综合题多数情况下考查统计的计算过程,有时也会考查统计的相关概念。


在该考点中,考查次数最多的就是“概率分布”,需要对正态分布、t分布、F分布、卡方分布等有很好的理解。
第三部分——知识考点
考点一:推断统计的数学基础
1、概率14.65
(1)含义:表明随机事件出现可能性大小的客观指标就是概率,有后验概率和先验概率两种。
(2)性质:任何一个随机事件A的概率都是非负的;在一定条件下必然发生的必然事件的概率为1;在一定条件下必然不发生的事件,即不可能事件的概率为0。
(3)加法定理:是指两个互不相容事件A、B之和的概率,等于两个事件概率之和。
(4)乘法定理:是指两个独立事件同时出现的概率等于该两事件概率的乘积。
2、概率分布07.63、08.79、09.46、09.56、09.75、10.63、11.63、12.51、13.49、13.50、14.58、16.51、16.52、18.58、19.58、20.43、20.55、20.57、21.56
(1)含义:概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。
(2)类型:离散分布与连续分布;经验分布与理论分布;基本随机变量分布与抽样分布。
(3)正态分布

①含义:也称常态分布或常态分配,是连续随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。心理与教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏,人们的社会态度,行为表现以及身高、体重等身体状态都属于正态分布。
②特征:正态分布呈对称分布,在正态分布中,均值、中数、众数相等。
正态曲线的形状像一口钟,两头小,中间大,大部分的原始分数都集中分布在均值附近,极端值相对而言比较少。
正态分布曲线中央点最高,曲线先向内弯后向外弯,拐点在±1个标准差处。两端向靠近横轴处不断延伸,但始终不会与横轴相交。
正态分布是一族分布,即其形态会随随机变量的均值和标准差的变化而变化。所有正态分布都可以经由Z分数转换成标准正态分布,标准正态分布的μ=0,σ² =1,记作N(0,1)正态分布,具有固定的形态。
正态曲线下面积为 1,分布下包含了所有数据。
正态分布曲线下,标准差和面积有一定数量关系。±1个标准差包含总面积68.26%,±1.96 个标准差包含总面积的95%±2.58个标准差包含总面积的99%。
正态分布下各差异量数之间有固定比率。
③应用:化等级评定为测量数据;确定测验题目的难易度;按能力分组,确定人数;测验分数的正态化。
(4)二项分布
①含义:是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,所以又称贝努里分布,是指试验仅有两种不同性质结果的概率分布,可以说是两个对立事件的概率分布。
②条件:任何一次试验恰有两个结果;共有n次试验,n是预先给定的任一正整数;各次试验各自独立;某结果的概率在任一次试验中都是固定的。
③特点:
二项分布是离散型分布,p=q时图形对称,p≠q时成偏态。若n很大,则二项分布接近于正态分布。
若二项分布满足np且nq≥5,二项分布接近正态分布,μ=np,σ² = npq,n为独立试验的次数,p为成功事件的概率,q=1-p。
④应用:解决含有随机性质的问题,如10道判断题,判断答对多少道才能认为不是出于猜测。
(5)t分布
①含义:t分布是统计分析中应用较多的一种随机变量函数的分布,也叫学生氏分布,这种分布是一种左右对称、峰态比较高狭,分布形状随样本容量n-1的变化而变化的一族分布。
②特点:
t分布是以平均值0左右对称的分布,左侧t为负值,右侧t为正值;变量取值在-∞~+∞ 之间。
当样本容量趋于∞时,t分布为正态分布,方差为1;当n-1>30时,t分布接近正态分布, 方差大于1,随 n-1的增大而方差渐趋于1。当n-1<30时,t分布与正态分布相差较大,随 n-1减少,离散程度(方差)越大,分布图的中间变低但尾部变高。
(6)F分布
①含义:从两个正态分布总体中随机抽取容量为n1,n2两个样本,计算值,每个随机变量除以对应的自由度df1与df2之比,称为F比率,这无限多个F值的分布即为F分布。
②特点:
F分布形态是一个正偏态分布,它的分布曲线随分子、分母的自由度不同而不同,随df1与df2的增加而渐趋正态分布。
F值总为正值,因为F为两个方差之比率。当分子的自由度为1,分母的自由度为任意值时,F值与分母自由度相同概率的t值(双侧概率)的平方相等。
(7)卡方分布
①含义:从正态总体中随机抽取无限多个数量为n的随机变量,这些变量的平方和或者标准分数的平方和的分布即为卡方分布。
②特点:
卡方分布是一个正偏态分布。随每次所抽取的随机变量的个数不同,其分布曲线的形状不同,n或n-1 越小,分布越偏斜。df很大时,接近正态分布,当df→∞时,分布即为正态分布。
x²值都是正值。
卡方分布的和也是卡方分布,即分布具有可加性。
卡方分布是连续型分布,但有些离散型的分布也近似卡方分布。
3、样本平均数分布10.57、12.47、14.64、15.49、15.59
①抽样分布:又称取样分布、样本统计量的分布,指某种统计量的概率分布,它是根据样本(X1,X2,…,Xn)的所有可能的样本观察值计算出来的某个统计量的观察值的分布。常用的样本统计量分布有平均数及方差的分布。
②中心极限定律:对于任何均值为μ,标准差为σ的总体,样本容量为n的样本均值的分布, 随着n趋近无穷大时,会趋近均值为μ,标准差为σ/n½的正态分布。
③样本均值的分布:
当总体为正态,方差已知,样本均值的分布为正态分布;
当总体非正态,方差已知,但是样本足够大(n>30),样本均值的分布为渐近正态分布;
当总体为正态,方差未知,样本均值的分布为t分布;
当总体非正态,方差未知,但是样本足够大(n>30),样本均值的分布近似为t分布。
4、抽样原理与抽样方法08.59、11.57、14.75、15.51、20.44
(1)随机性原则:每个个体被选取的概率相等;进行返回取样,以保证每个个体每次被抽取的概率不变。
(2)抽样方法
①简单随机取样法:包括抽签法,随机数字法,适合总体数目较小,个体差异较小时用。最能体现随机化原则,但在大规模抽样时费时费力。
②等距取样法:又称系统抽样,适合总体数目庞大时用。抽样方法简单,样本代表性较强;但当总体具有某一种周期性变化时可能忽略已有信息。
③分层随机取样法:要求层内尽量同质,层间尽量异质,个体差异较大时用,按各层人数比例分配。
第四部分——必背大题
1、简述正态分布与标准正态分布的区别与联系08.79