Coursera|Quantitative Methods第 2 周课程笔记
2.01 Empirical Cycle
实证周期(Empirical Cycle)是指 提出事物运作原理的假说 并使用经验数据来系统地、严格地检验这些假说的过程
1)观察阶段 observation
这个阶段很神奇 在这一步中 观察激发了灵感 并由此提出一项新的研究假说 我们可能观察到了有趣的规律 一个令人感到意外的事件 或者是任何一件我们感兴趣 并试图解释的事情
这些观察通常来自之前的研究发现 这些发现是系统地获得的 但是理论上来讲 万物皆可
2)归纳阶段 induction
在归纳阶段 我们把在具体事例中观察到的这种关系 归纳为一条通用法则 通过一个在特例中成立的命题 推测此命题在所有情况下都成立 这就是归纳的含义
3)演绎阶段 deduction
在演绎阶段中我们推导出 在新的具体个例中 这条通用法则也应该成立 通过我们的假说 我们推导出一个明确的预测 也就是关于新观测的预测
4)测试阶段 testing
在测试阶段 我们通过收集新的数据 并将它们与预测相对比 来实际检测假说 现在 这通常需要用描述性统计学的统计手段 来为我们归纳观察结果 并用推论性统计学 来帮助我们判断预测是否准确
5)评估阶段 evaluation
在评估阶段 我们用假说来解释实验结果 如果与预测一致 那么它就暂时 为假说提供了支持 这并不意味着我们已经最终证实假说了 因为 总有可能在将来 会有人说 他们就是很爱自己的婆婆/岳母 在我们的例子中 预测实际上被驳倒了
在测试阶段收集到的观测数据 会被当作下一轮观测阶段的新具体观测数据 这就是为什么这个过程被称为周期 测试阶段中 新的实证数据 给人们以新的灵感 启发他们进行新一轮的研究 这就是实证科学的本质所在 我们试图打造出最好的假说 并在周期循环往复中建立起我们对这个世界的认识

2.02 (Dis)confirmation
关键要确认预测永远不是决定性的 我们唯一能说的是我们的假说暂时被支持了 有越多不同的研究支持假说 这一假说就越可信 但我们永远不能证实它
有时研究结果确实会导致对假说的修改
对假说完全的驳回或根本上的调整 在社会科学领域其实是很少见的 进步并非一蹴而就 而是积跬步 成千里
2.03 Criteria
我们应该如何判断该研究是否可信呢?
有两个主要标准 可靠性 (reliability) 和效度 (validity) 可靠性与可重复性紧密相联 如果独立研究员大体上可以重复该研究 那么它就是可重复的 当研究可重复 且得到的结果也一致的时候 我们就认为它是可信的 效度则更为复杂 如果关于特性间假设关系的结论能准确反映现实 这个研究就是有效的 简而言之 如果根据结果得出的结论是真实的 那么这个研究就是有效的
三种效度:建构效度construct 内部效度internal 和外部效度external
建构效度是内部和外部效度的重要先决条件 如果假说中的特性和建构被准确地测量和控制 我们就说这项研究具有较高的建构效度 换而言之 如果它能实际测量和操控我们想要研究的特性 我们的研究方法就具有较高的建构效度
如果该结果可以适用于不同个人、群体、环境和时间 那么我们就说此研究外部有效
如果观测到的结果确实是由假设中的原因引起的 那么这项研究是内部有效的
2.04 Causality
(如果观测到的结果确实是由假设中的原因引起的 那么这项研究是内部有效的)➡️ 如何识别因果关系呢?
我们该如何确定因果关系呢 大卫•休谟在约翰•斯图尔特•穆勒的帮助下 首次列出了判断准则 我们至今仍在使用
第一条 原因和结果是相联系的
必须可以由果溯因 如果病人没有接触过某种病毒 我们就不能认为是这种病毒导致了病人的死亡
第二条 因先行于果
第三条 因果总是如影随形 这意味着因和果会一起改变 或称为共变
第四条准则 替代解释可被排除
相关性并不意味着因果性
2.05 Internal Validity Threats: Participants
为了评价一项特定研究的内部效度 必须熟悉可能出现的几种影响因素
1)成熟maturation
结果由被试自然变化引起的,而非自变量(比如抑郁可能随着时间的变化而消失)
可通过设置对照组避免
2)选择selection
选择是指存在于组间受试者特征中的任何系统性差异
可通过随机分组(randomization)来减少选择带来的影响
3)选择-成熟协同作用selection by maturation
它发生于组间成熟速率存在系统性差异的情况下 比方说 假定在两组间考察养猫疗法的有效性 实验组的志愿者对新事物持开放态度 相反 对照组由更加保守、不喜欢变化的人组成 相反 对照组由更加保守、不喜欢变化的人组成 参与者被选入两组中 使两组在研究之初抑郁度相似
也可通过随机分组(randomization)来减少选择-成熟协同作用带来的影响
2.06 Internal Validity Threats: Instruments
造成低建构效度的影响因素中 仪器使用 (instrumentation) 和测验 (testing) 属于这一类
如果我们的测量仪器或操作方法质量较差 我们就不能推论出任何有关假设建构之间关系的结论
第二个与测量方法有关的影响因素是仪器使用 如果测量工具在研究过程中发生了改变 仪器使用的这个影响因素就随之出现了
最后一个影响因素是测验 也被称为敏感效应 (sensitization) 执行一项测验或测量程序可能会影响人的行为 如果测量产生的敏感效应为结果提供了一个替代解释 测验这个影响因素就表现出来了 比如在研究开始时进行的抑郁程度的前期测验 有可能使人们对自己的抑郁感变得警觉 这可能会使他们更积极地改进自己的情绪状态 👉 一个解决办法是 增加一对没有进行前期测验的实验组和对照组
2.07 Internal Validity Threats: Artificiality
实验者预期 (experimenter expectancy) :罗森塔尔效应
解决办法:研究者单盲实验
需求特征 (demand characteristics):需求特征是指被试对象由于对实验的预期的猜测而改变自己行为的现象
解决办法:双盲研究设计
2.08 Internal Validity Threats: Research setup
模糊的先后顺序:ambiguous temporal precedence
解决方法:manipulating, or introducing the hypothesised cause.
历史:history
A history effect is an unforeseen event that happens during the study that provides an alternative explanation.
亡失:mortality
Mortality refers to participant dropout from the study. If groups are compared and drop out is different in these groups, then this could provide an alternative explanation.
2.09 Variables of Interest
概念 :construct
我可以假设孤独和抑郁相关 "孤独"和"抑郁"在这里就是两个概念 当然 孤独与抑郁有多种不同的表达方式 变量这个术语是指概念的可操作版本 变量是概念具体明确的表现 变量是可测量、可改变的
变量 :variable
常数 :constant
自变量和因变量:independent variable,dependent variable
自变量是原因 先于结果发生
2.10 Variables of Disinterest
混杂变量Confounders/lurking variable
解决办法:重复这个研究 控制混杂变量 使其对所有参与者影响一致 ; 另一种方法是把混杂变量转换成控制变量 控制变量就像混杂变量 是可能和自变量与因变量都有关的属性 但与混杂变量不同的是 控制变量可测量 因此其影响能被评估和控制
控制变量control variables
背景变量background variables
背景变量 这类变量与目标变量没有直接联系 这类变量与目标变量没有直接联系 但它说明了参与者是否可以代表一个更大的群体 甚至是否可以代表世界各地的老年人群体 甚至各个年龄段群体 出于这种原因 要了解参与者的性别 平均年龄、宗教或文化背景、社会经济状况 教育程度等任何和研究相关的背景
热门话题 · · · · · · ( 去话题广场 )
- 我从明星那学到的保养思路23篇内容 · 72.7万次浏览
- 每到周一我就烦110篇内容 · 1.9万次浏览
- 已经完全失去囤东西的欲望了1.0万+篇内容 · 1.9万次浏览
- 活动|大家是因为什么原因把对象pass的14篇内容 · 10.1万次浏览
- 你是如何在一段关系里维护主体性的?1.0万+篇内容 · 8.0万次浏览
- 一代人有一代人的邪修省钱法1.0万+篇内容 · 14.2万次浏览
- 辞家千里,不必争气争气再争气11篇内容 · 1495次浏览
- J人给P人的亿点小震撼180篇内容 · 138.3万次浏览