该如何敲定回答下一个研究问题所需的数据类型?
这个问题非常关键,你需要考虑下列几项因素:
- 你的假设是什么?
- 你该如何让编辑、同行评议审稿人和读者都相信你的假设是正确的?
- 你想要收集何种数据?
- 你该花费多长时间?- 多少数据足以支撑你的假设?
明确地说,数据收集是一种基于既定的、系统的方式进行收集和衡量相关变量信息的过程。数据收集可以帮助你回答提出的研究问题,检验研究假设并评议研究结果。数据收集环节常出现于物理、社会科学、人文科学和商业等所有研究领域。换言之,无论你专攻何种学科领域,数据收集是必不可少的。
尽管研究方法因学科而异,但保证数据精确且真实始终是数据收集不渝的原则。
以下为可供思考的几点内容:
确保数据收集准确恰当的重要性;无论在何种研究领域,无论是否喜欢给数据下定义(定性数据、定量数据),准确的数据收集都是保持研究完整性的基本要求。选择恰当的数据收集工具(现有的、改良的或新开发的)和准确介绍正确用法的说明书均可以减少出现错误的可能性。
请明确数据收集的重要性,数据收集不当会带来以下后果:
- 无法准确回答研究问题;
- 无法重复和验证研究;
- 结果失真导致资源浪费;
- 误导其他调查人员进行无效调查;
- 损害公共政策的决策;
- 对人类受试者和动物受试者造成伤害。
尽管错误的数据收集造成的影响会因学科和调查性质而异,但当研究结果被用作公共政策的建议时,将有可能造成巨大损失。
关于保障数据完整性的问题:保持数据完整性的基本原理是支持数据收集过程中的错误检测,明确错误是否为有意造成(故意篡改或系统错误和随机错误)。
Most、Craddick、Crawford、Redican、Rhodes、Rukenbrod和Laws于2003年将“质量保证”和“质量控制”阐述为两种保持数据完整性和确保研究结果科学有效性的两种方法。这两种方法分别被用于研究时间表中的不同时间点(Whitney, Lind, Wahl, 1998):
质量保证
在数据收集开始之前进行的活动;
质量控制
在数据收集期间和之后进行的活动。
质量保证
由于质量保证先于数据收集,因此其主要侧重于“预防”(即预防数据收集中出现的问题)。预防是确保数据收集完整性最具成本效益的活动。全面详细的数据收集程序手册中制定的标准化方案可以最好的诠释这一积极措施的意义。手册编写不当会增加在研究过程中未能及早发现问题和错误的风险。这可能会导致如下问题:
- 时间、方法和确定数据审查人员的不确定性;
- 需收集项目列表的不完整;
- 数据收集工具的模糊描述(缺少用于管理测试的详细步骤说明);
- 无法确定培训或再培训数据收集工作人员的具体内容和方法;
- 混淆使用、调整和校准数据收集工具的说明书(若适用);
- 无确定机制用于记录可能在调查研究过程中出现的变化。
质量保证中的一个重要环节就是制定严格且详细的招聘和培训计划。在培训过程中,需要向受训者有效传达准确数据收集的价值(Knatterud, Rockhold, George, Barton, Davis, Fairweather, Honohan, Mowery, O'Neill, 1998)。培训环节对于解决无意间偏离原始方案的员工这一潜在问题尤为重要。上述现象被称作“漂移”,受训者需要接受额外培训加以改正。同时,程序手册中也应对这点作出相应规定。
基于定性研究方法的范围(非参与/参与观察、个人访谈、归档、现场观察、人种志、内容分析、口述历史、传记、无干扰研究),很难对于为保证质量如何建立研究方案作出统一的陈述。因此,对于那些进行非参与/参与观察的研究人员来说,可能只有最广义的研究问题可为其初始研究工作提供指导。研究人员是研究中的主要衡量工具,很多时候几乎很难找到其他数据收集工具。同时,数据收集工具可能需要现场开发以适用于意外的发现。
质量控制
尽管质量控制(检测/观察和操作)在数据收集期间和之后进行,但也应在程序手册中记录详细的信息。一个明确定义的交流结构是建立观察系统的必要先决条件。在发现数据收集中的错误后,主要调查人员与工作人员之间的信息流应该不存在任何不确定性。交流结构不完善会导致观察松懈,限制错误检测。
检测/观察可以采取现场访问,电话会议等直接检查员工的形式,或者采取对数据报告定期且频繁评审以识别不一致,极值或无效代码的形式。尽管现场访问可能不适用于所有学科,但无法定期审核记录不论对于定性还是定量的数据收集来说,都不利于调查人员验证现行的程序与手册中的既定程序是否一致。此外,如果在程序手册中未明确规定交流结构,程序中出现任何变化都不利于转达给工作人员。
质量控制还可以确认必要响应或行动,用于纠正错误的数据收集方法并在最大程度上减少未来发生错误的几率。如果数据收集程序手册编写不清晰,且未在反馈和教学内容中提到减少错误复发的必要步骤,则无法起到上述作用(Knatterud, etal, 1998)。
需要立即采取行动的数据收集问题示例包括:
- 个体数据项目中出现错误;
- 系统错误;
- 违反协议;
- 单个员工或现场表现存在问题;
- 欺诈或学术不端行为。
在社会和行为科学中,一旦数据收集涉及人类受试者,研究人员则会被培训以一种或多种次要措施用于验证从人类受试者中收集信息的质量。例如,进行调查的研究人员可能想对年轻人中危险行为的发生以及增加这些危险行为发生可能性和频率的社会条件有更深入的见解。
为了验证数据质量,受访者可能会在调查中的不同时间点以不同的方式被询问相同的信息。“社交满意度”的衡量标准也可以用于衡量回答的真实度。在这里有两点内容需要说明:
数据收集过程中的交叉检查;
数据质量既是一个观察阶段问题,又是一个完整的数据集问题。因此,数据质量应通过个体衡量、个体观察和完整数据集而获得。
每个研究领域都有其首选的数据收集工具集。实验室科学的标志是实验室笔记的详细记录,而社会科学(例如社会学和文化人类学)可能更倾向于使用详细的现场笔记。无论何种学科,在数据收集之前、期间和之后,全面记录收集过程都是保障数据完整性的基本要求。