《社会调查与研究方法》课堂笔记(3)
调查误差的来源
覆盖性误差,目标总体与抽样框不一致。
抽样性误差,样本特征值与抽样方法匹配造成的误差,每个变量都有自己的抽样误差,抽样误差通常用均值的标准误来代表,也可用相对误差来表示,如均值变异系数。
应答性误差,单元、样本无应答或选项无应答。
测量性误差,因测量工具和测量过程所造成的误差。
降低误差
所有误差来源最后都会反应在样本与总体之间的差距上,对这些差距的测量,有基本的统计量,如偏差;均方误差; 样本均值,样本方差,样本标准差;总体均值,总体方差。
偏差与误差
偏差,按照某一抽样方案反复进行抽样,其估计值的数学期望与待估参数之间的离差
均方误差,所有可能的估计值与待估参数之间离差平方的均值,等于估计量方差加偏差的平方。
抽样误差,由样本随机性造成的样本统计量与总体统计量之间的差异,可用样本估计量方差或标准误表示。
非抽样误差,不是由抽样随机性产生的,而是由其他因素引起的估计值与总体参数之间的差异,如抽样框误差、计量误差、无回答误差等。
基本统计量
参数值,是关于总体某一变量的数量描述,如总体均值;总体方差。
估计值,关于样本某一变量的数量描述,也称为统计量、统计值、估计值,其价值在于提供有关总体参数值的推断,如样本均值;样本方差。
均值,分布的集中趋势。
方差、标准差,分布的的离散趋势;观察值与其平均值之差(离差)的平方和除以全部观察总数,方差的平方根就是标准差。
样本估计量的方差称为估计量方差,也称为统计量方差;估计量方差的平方根就是标准误。
非概率抽样
不涉及等概率原理选择样本方法的总称。对结果的可推论性要求不高,总体边界不十分清楚,或总体结构十分复杂。
配额抽样
条件,对总体的研究特征比较清楚,对总体要素的构成比较清楚。
方法,按照总体要素所具有的研究特征,进行分组,建立一个特征矩阵,将矩阵中每一个单元格占总体要素量的比例作为配额的依据,根据给定的样本量,对每一个单元格按照其比例进行配额。
就近抽样
按照与访员之间的物理距离定义。
条件,获得的样本,在研究特征上符合研究的需要。
目标抽样
针对具体对象的抽样。如学生干部家庭背景调查。
条件,对总体中研究特征所指涉的人群非常清楚。
滚雪球抽样
用捕获法获得初始样本,逐轮扩展,直至所需样本量,改进为同伴推进抽样。如男男同伴调查。
条件,样本在总体要素中属于稀有要素,样本不易识别,或识别成本极高。
知情人抽样
由知情人直接提供样本清单。如长寿老人调查。
条件,知情人对研究特征涉及的对象非常熟悉。
如果对推论没有严格要求,或仅限于在被研究对象范围内做出结论,则非概率抽样是常用的方法。有的非概率抽样方法,可以转化为概率抽样方法。
抽样方案
是研究设计的一部分,将研究设计中搜集数据部分操作化的产出。对于综合性研究而言,抽样方案就是数据搜集的设计部分。
抽样方案的选择,
取决于三个基本因素的状态,同质性、对象规模、变量多少
对象规模大+异质性强+变量多-多阶段分层PPS抽样
对象规模大+异质性强+变量少-多阶段抽样(整群、配额)
对象规模大+同质性强+变量多(少)-多种,简单、就近、判
断,也可以采用概率抽样方法
对象规模小+异质性强+变量多(少)-滚雪球,RDS,知情人
主要内容
一个对研究具有支持意义的抽样方案,要包括
总体,总体、研究总体、框总体、抽样框。
研究(调查)对象,最终的数据搜集对象(受访者)。
样本量,末端抽样单位的数量。
抽样的基本方法(原则),在复杂设计中,可以用多阶段混合抽样。如果是多阶段抽样,则每一阶段的抽样单位、抽样框、抽样方法、样本量配置(计算)、以及末端抽样方法(案)以及每阶段权重。如果没有可用的抽样框,则还需说明抽样框的制作方法。
任何抽样方案,都会受资源与可及性等因素的影响,最终的抽样方案是在资源、可及性与完美之间的取舍,可以操作的方案,总是有瑕疵的方案。尽量界定清楚研究对象,总体,研究总体,抽样框,框总体,避免覆盖性误差。
抽样实施
按照抽样方案(设计),获取样本的过程,也是抽样误差控制的重要环节,是一个与各方妥协的过程。避免理解类错误与操作类错误。沟通是解决问题的根本之道。
实施方案
研究活动诸操作方案的总称,从立项到成果应用每一个环节活动的计划与组织、技术流程,以及应急处理预案。通常由研究计划书中的研究方案及其设计的具体技术方案,组织管理方案构成。
实施环节
搜集数据,文献,说明来源、可及性、工作量、组织安排、产出;调查,说明参数、调查对象可及性、工作量,组织安排、产出形态。
分析数据,采用什么方法,是否有相关工具;谁来组织分析,相关资源可否满足。
研究应用,产出形态,一种还是多种,每一种形态如何展示,用什么方式传播。
基本内容
行动(组织、技术、管理、应急)的目标;需要的资源+可用的资源+短缺资源的处理;操作(行动)方案( 资源布局+技术要求);管理 + 督导(监督);预期产出。
技术方案
技术策略,表现为技术性设计蓝图;技术指南,表现为技术文档。
技术文档
给研究成员的,一般为涉及研究要求的指导书;给操作人员的,一般为步骤性的操作指南;每一项研究的技术文档都不相同。
编写原则,根据项目的类型和大小,确定编写的体例。包括操作程序,工作规程;技术原则,质量标准,产出预期;责任关系,衔接关系。
凡涉及操作的,都需要有技术文档,从设计原则、术语定义、技术流程、到操作指南,技术文档的细致程度与操作的确定性程度呈正相关。哪怕是一项最简单的研究,技术文档,也是必不可少的。
组织方案
在给定资源的条件下,研究工作运行机制的设计与实施,形成工作运行机制,时间、人力、经费、设备等的组织,是重要内容。通常以工作时间表、预算、设备表等技术性文档的方式呈现。
所需的资源
时间,分为实施前的准备-实施-实施后的收尾,实施前,给出足够的时间;实施中,严格按照时间节奏进行,尤其是时间性强的工作,如赶时间或“过时不候”的实施内容;实施后,留出一定的时间,进行核查和收尾。
人力,研究团队,独立性强、协调性差;支持团队,依附性强、自主性差;研究对象,特征依研究的类型,差异极大。
经费,来源,研究基金、专项;预算,经费需求总额;支出列项,支出依据与分项总额。
设备,可靠性,而不是先进性是第一考量;适用性,设备组织中的决策难点,受多种因素的影响,尤其是对长期的大型项目;可支持性,对支持性比较敏感的设备,是重要的考量。
管理方案
针对组织方案和技术方案所策划的管理策略和管理要求。针对研究人员,大多采用任务管理方式;对支持人员,大多采用岗位管理方式。针对通用性的工作,大多采用制度管理的模式;针对个性化的工作,大多采用协商式的管理。
管理规则,制度性管理规则,任务管理规则、工时管理规则、计酬管理规则、进程管理规则、(设计)技术管理规则、质量管理规则;协商性管理规则,(实施)技术管理规则、不确定工作。
涉及到人和信息的组织与管理时,安全是第一问题
应急管理
针对非常见状态的处置方案,属于管理性质方案,采用协商性管理,哪怕是一项最简单的研究,也需要有应急预案。
研究计划书
一项研究的总设计,是设计人员与其他人员之间的媒介。是行动计划,是合约,主要是研究方案。
作用。沟通,让设计人员之外的人员判断研究的意义;计划,执行与完成研究的行动指南;合约,资助方与执行方(设计方)之间的工作合约。
基本内容,研究的问题或主题,研究的主要内容或子问题,研究方案、技术路线,研究的产出或预期成果。
步骤,确认研究的问题-确认探讨问题的方式-形成草稿讨论、修订-形成提交稿,审阅或答辩。
研究问题
引言、导言,计划书的开篇,说明研究问题的学术背景和社会背景。一般有四个段落,第一段说明研究问题社会背景;第二段说明研究问题的学术背景;第三、四段说明在社会背景下研究此问题的意义。
研究现状,与拟研究问题直接相关的现状,研究问题的直接属性问题和研究问题的维度相关问题。
文献综述,陈述研究的进展,为读者理解研究的重要性提供参考框架。优先使用经典书籍,一定要使用期刊文章,不从哲学概念开始回溯。
步骤,搜索关键词-找到相关的文献-确定既有文献与拟解决问题之间的关系-凸现拟解决问题的意义或重要性。
研究意义,新的实例,理论应用范围的扩大;新的方法,解决没有解决的问题;新的理论,深化人们对现象的认识;解决实际的社会经济问题。
研究内容
研究问题(课题)操作化之后子问题(相关问题),子问题能够合起来回答自己所提出的研究问题。如建立社会公平保障体系与维护社会正义研究的子问题,社会公平保障体系的理论与实践;基本公共服务与公平正义;社会保障与公平正义;中外社会公平保障体系的比较研究。
逻辑清楚,每个内容指称的子问题要清楚,内容之间的逻辑关系与内容衔接,结构要明确。
层次明确,可先给出图示,再逐阶段、逐层次,针对子问题的内容说明。
研究目标
希望达成的目标,有哪些科学上的创新。
研究方案
研究计划书的技术性核心部分,论证研究问题的可操作性以及操作方法,说明每个具体研究内容如何为研究目标服务,说明研究的创新与发展。
是研究内容的操作化,将研究内容转化为变量间的关系,给出变量的测量,数据的搜集、分析方法,和做出结论的策略、手段。每一个内容,都需要具体的研究方案,是操作化、测量方案、实施方案的集合体。包含研究思路、研究方法、创新之处。
研究方法,完成每一个研究内容的具体方法,局部着眼于各个具体目标的可现实性。具体到可操作程度,可行、创新、简洁,信度和效度是重要指标。
技术路线,完成整个研究的流程结构,全局着眼于各个具体目标之间的衔接与整体性。
创新之处,完成研究目标的理论假设、研究方法、技术路线中,这项研究独创的、可应用的、可复制的。
预期成果
研究结果的产出形态,研究报告、期刊文章、专业著作、展示性作品、数据、专利、工艺、产品。研究方案与预期 成果之间的匹配,涉及到是否能够获得资助。产出的类型要与研究类型、规模、深度相适宜。
摘要,出现在研究计划书的最前面,包括研究问题的立足点,研究的学术背景和社会背景;方法;技术路线;关键技术(创新);产出。400字左右。是对研究设计的最初印象,影响对项目可行性的判断。
预算,采用收支分列的方式,为表格形式。预算依据计算简单、明确,列支项之间的比例要与研究工作的工作量相匹配。
团队,主持和参与研究工作的主要人员及其工作分配,包括主持人和参与人的详细信息,要让参与人员知道并从一开始就参与,合理估算工作量。
问卷的要素
标题组,包括问卷主题,组织机构,执行机构,组织和执行过程的相关内容。
申明组,目的说明,保密说明
指导语组,每一类问题前的指导性说明,说明问题目的和填答方式
访题组,问卷主体,包括访题和选项。
说明组,对访题以及选项中需要澄清的问题、术语、界限等进行界定说明。
问卷结构的设计
多种问卷的分工与衔接、让每一种问卷充分发挥自己的作用。多种问卷有相同的内容,采用模块结构,让多种问卷共享同一个内容模块,在分析时便于比较。
问卷结构,
内容的运筹与布局,不仅影响访问的效率,也影响调查质量。
模块式,由研究问题所确定的问卷内容依据相关性,划分为不同的模块。可以将问卷预备调查的内容区分为若干模块或内容组,如基本信息、个人经历、受教育经历、职业经历等。
关联式,由研究问题所确定的变量,依据关联性,顺序展开。
步骤,根据操作化的结果,将变量进行分类---针对每个变量,依据访问形式,设计访题或访题组---整体谋划访题的关系结构---设计问卷辅助内容。
设计技巧
访题顺序,先易后难、先一般后敏感、逻辑优先、先问影响到一系列访题安排的访题,跳转尽量简单,密集思考的问题分开放。
难度,需要记忆力配合、需要智力配合、需要心理配合。
敏感,隐私类,如交友圈,疾病;私人信息类,如身份信息;态度敏感类信息,如政治倾向、宗教信仰。应水到渠成,如先问健康,再问疾病,或采用量表方式。
快速进入,使用受访者不用思考就可以回答,且不会产生警惕性的访题,打消顾虑和畏难情绪,在访员和受访者之间建立互信。
跳转安排,有跳转条件访题或嵌套访题,先导性访题或过滤性访题要先问。可能会造成漏跳或误跳。
问卷主体
由访题组成,有直接访题,封闭式-开放式,单选-多选;间接访题,指标-量表。
访题的内容,存在类,行为类,观点态度类,能力类。
访题的格式,选项排列,矩阵题。
封闭访题的应答便于数据处理,不过会限制应答的多样性;开放访题便于解决应答的多样性,不过应答不易数据化。
单选访题便于测量的确定性,不过会限制访题的经济性;多选访题具有经济性,不过应答的应用会变成挑战。
间接测量,是不得已的选择,尽量使用成熟的工具,尽量使用访题形式的优点,是选择形式的原则。
访题的结构,
建构形式,直接测量,间接测量。
结构形式,平面结构,直接问题、矩阵问题;嵌套结构;模块结构;复杂结构。
封闭访题,针对要测量的变量直接提问,且给定应答选项。
半封闭访题,针对要测量的变量直接提问,给定应答选项,并留出“其他”选项。
开放访题,针对要测量的变量,直接提问并忠实记录应答内容。
单选题,直接提问,选择一个选项作为应答。
多选题,直接提问,选择多个选项作为应答。
指标题,使用多个访题测量一个变量,各自测量一个维度的访题组。
量表题,使用多个访题测量一个变量,访题的测量嵌套递进的访题组。
访题内容
存在类,自然变量,社会事实,找到变量的研究属性,找到可直接应答的问法。
行为类,社会行动者的行为,或直接询问行为或放在场景中询问。如时间相关行为,群体相关行为,个体相关行为。敏感行为,隐私性或者社会禁止性行为。
态度类,反映个体的观点和态度的,不可直接测量的变量,尽量采用成熟的工具,如果一定要自己制作,要说明信度和效度。态度敏感性,社会、政治、宗教、族群。
能力类,心智能力,身体能力,采用统一的标准,使用已有的工具,如IQ,残疾。
访题格式
排列一目了然,避免混乱排列;跳转路径清晰可及,避免来回跳转;矩阵题,尽量为一类题,避免东扯西拉。
提问的技巧
简洁,直接,不要让受访者过多思考。正面提问,简单提问,中性提问,封闭提问,短句提问。避免多重题意、一题多问;选项不完备;题意不明确;过于深奥。
常用变量的问法
年龄,直接询问出生年、月、日,视精确度需要而定,为老年人准备生肖-出生年对照表。
性别,直接记录。
婚姻状况,“未婚、同居、已婚、离婚、丧偶”等选项中组合。
受教育程度,根据相关的设计变量设计,受教育年数还是学历,是否有在职教育。
收入与支出,采用逼近法,再询问类别收入
职业,三段式问法,部门、内容、工种名称。
问卷辅助内容
封面,调查项目标题,样本信息,访问过程信息,督导过程信息。
申明,权责说明,保密说明,无害说明。
指导语,访题访问与应答的说明;说明语,对访题中术语的解释与说明。
地址抽样表,抽样说明和抽样工具。
访员记录,访员对访问过程的记录。
选项卡。
问卷的类型
依据访问方式划分
面访,分为问答与自填。
纸版问卷,一目了然,便于翻阅与记录应答;如果遇到复杂结构,大量跳转或矩阵访题,容易造成人为误差。避免复杂跳转,避免选项记录的边界不清。
CAPI问卷,让界面简洁、说明清楚,不会产生因跳转或矩阵题等所造成的人为误差,符合应答逻辑,让应答自然,水到渠成,尤其是敏感问题;缺少阅读体验,5000份问卷以下的调查,不采用CAPI。
非面访,没有专门的访员,有详细的应答指导或指引。
纸版邮寄自填,类似面访问卷,在邮件中,附上回邮的信封,并在信封上填写好回邮的地址与收件人,贴上邮资。匿名问卷做好匿名化处理。
语音自填,事先邀请,受访者拨入电话,激活语音问卷,用电话键盘作为应答记录工具。
网络自填,受访者接受邀请,使用电子格式的问卷,自填作答。
混合访问,综合了面访、语音、电访、自填等形式的访问,涉及个人隐私的内容,采用语音访问,受访者自填或应答;涉及快速的产出的调查,采用电访+语音的方式。
单份问卷的访问时长,不宜超过40 分钟;多份问卷的访问时长,不宜超过2小时;纸版自填问卷,不宜超过30分钟;语音自填问卷,不宜超过10分钟;电访问卷,不宜超过5-8分钟;街头拦截调查用问卷,不宜超过5分钟; 在线问卷不宜超过10分钟。
依据调查目的划分,学术性调查,市场调查,政策评估调查。
访问方式,面访(问答,自填,纸板,CAPI),非面访(纸板邮寄,语音,网络自填,电访问答),
调查目的,学术性调查,市场调查,政策评估调查
访问的技巧,访问的时间
调查的实施
试调查,问卷进入正式调查的必须环节,是测试使用问卷方式搜集数据的测试环节,测试问卷的有效性以及可执行程度,包括研究变量是否覆盖,内容之间的衔接、跳转是否流畅,是否容易理解,信度和效度如何,访问时长与时机是否与资源的配置吻合。
执行计划,任何问卷调查都需要有执行计划,包括访员招募、培训,调查的指导与督导,质量核查。
访员招募,尽量招募样本地的访员;如非交通成本高,需要足够社会经验的,可以考虑学生访员。
访员基本素质,普通话或样本本地的方言,必备的受教育程度和技能,为人和善,有必要沟通能力。
访员培训,理解问卷调查的目的、对象、管理、质量;熟悉访问技巧、问卷结构、内容;熟悉设备使用的方法与技巧;熟悉工作环节;建立信心和勇气。设计者和督导讲解问卷;访员之间,进行相互练习。
调查执行
从接触样本对象开始,到问卷访问完成。包括封面的填写,知情同意的说明,主体的访问,访问观察的填写。
访员指导,教访员面对难题,让受访者接受、愿意、如实回答问题;教访员主动,不说让受访者可以拒绝的话,不给受访者拒绝的理由。
访问督导,导访员有效地利用访问技巧,帮助访员顺利完成访问。核查应答完整性,所有样本都访问到,应该访问访题都访问并有应答,所有需填写的信息都填写好。
面访督导,与访员保持沟通,解决技术性问题和情绪性问题;对每份问卷核查;注意相关参数变化;保证访问进度。
电访督导,同上,随时关注督导平台上质量参数的变化,全程督导访问过程。
无访员调查,耐心回答任何受访者的任何问题,不说“不知道”;注意回收率和有效问卷率。
问卷调查管理
进程管理,在面访中,指导访员取得受访者的支持,选择合适的时间进行访问;在电访中,让督导合理安排访问时机,保证应答率。督导让访员迅速熟悉访问流程与技巧,及时检测到访问进度,有效调配访员工作量,以保证整体进度。
访员管理,第一次访问的指导,访问行为的督导与检测,调查质量的督导,回收问卷的核查,工作量的调解,支付的指导与说明。
督导管理,类似访员管理。
质量管理,问卷应答的质量,根据受访对象接触率、访问完成率、问卷回收率、有效问卷率,还包括潜在质量标准,访员作弊的比率。
涉及到访题的可实施性问题时,保持良好的沟通,定期让设计者了解调查进展和调查质量状况,以便设计者或改进设计,或调整对调查产出的预期。
处理意外事件,应急方案的一部分,及时与稳妥是处理意外事件的第一原则,对人身伤害事件,及时与当地警方取得联系。