乔晓春:规范科学的社会科学研究,如何用数据说话

来源:中国妇女报

作者:陈业强

8月14日,北京大学乔晓春教授在山东女子学院举行题为“如何做规范、科学的社会科学研究——以性别研究为例”的网络视频讲座。乔晓春教授认为:社会科学研究者要知道如何用数据说话,学会和用好研究方法。“用数据说话”有一定规矩,需要遵循一定的程序,包括发现问题、提出假设、收集数据、分析数据、检验假设和得出结论。

确定研究问题、开展文献综述与研究设计

确定研究问题、开展文献综述、做好研究设计是社会科学研究的前提和基础工作。

——提出好的研究问题。好的研究问题有两种视角,一是理论视角,二是经验视角。理论视角就是已有理论已经指明了研究方向,你要做的就是沿着这个方向往前走。理论提供了对社会现象的解释,再把这种解释转换为研究假设,这样的研究从描述理论说起。以性别研究为例,西方妇女研究的理论学派给出了研究方向,我们可以从中找出研究问题,比如,为什么越来越多高学历女性不想结婚?为什么越来越多年轻女性不想生孩子?生孩子是否真的导致了失业、工资减少、阻碍晋升……?经验视角就是选择老百姓关注的、社会上谣传的、自己感兴趣的问题,这样的研究从讲故事说起。

——文献综述。文献综述首先要识别有效研究,剔除无效研究。文献综述不是要“述”,而是要“评”。文献综述要处理好“别人已经做”和“你将要做”的关系,“你将要做”是目的。另外,文献综述不是回顾和罗列别人做了什么,而是要发现别人哪里做的不对,找出别人没做过的地方。

——研究设计。社会科学设计取决于研究目的或要回答的问题。不同问题有不同的理论框架,涉及不同的关系、不同的变量,不同收集数据的方式、使用不同的模型等。研究设计相当于写开题报告,好的研究计划相当于已经完成了研究的90%。做研究设计的主要问题:一是核心变量的概念界定和操作化界定模糊或者错误;二是数据只涵盖研究对象,而忽略对照组;三是用截面数据,将“数量关系”当做“因果关系”来研究。

对真实世界的抽象描述与操作化

确定研究问题、做好研究设计之后,要将学过的理论转化为数据分析计划,进一步将研究问题操作化。

——对真实世界的抽象(模型和数据)描述。科学研究一般要从真实世界到理论模型,从理论模型到精细模型,从精细模型到操作模型。由于学习理论和学习方法的分离,不会把学过的理论转化为数据分析计划是常见的科学研究问题。过渡模型(精细模型)被称为基于理论的数据分析。模型的最优和理论的最优,有时是两回事,甚至会有矛盾。我们应坚持理论优先原则,避免理论脉络的不清晰导致操作模型关系混乱、重要变量缺失或被忽略。

——做一个好的测量。做一个好的测量的目的是将事实转换成数据。数据是事实的抽象,方便分析和处理。存在能否测准的问题。第一是测量工具是否存在问题,从而影响测量的信度和效度;第二是被测量对象的抵触性反应,导致测不准的问题。测量对象包括两类事实:一类是直观事实,如性别、年龄、受教育程度等;二类是抽象事实,如幸福、痛苦、孝顺、抑郁等。一个好的测量应该采用社会公认的测量尺度和工具,尽量避免使用自己开发和创造的测量工具。

抽样与统计推论

很多研究是通过以样本推论总体的方式实现的,这其中涉及界定研究总体、抽样方法选择、统计推论等步骤。

——明确研究对象和总体。任何一项研究都必须有一个明确的研究对象,可以是全国、或一个省、一个市、一个县、一个街道,甚至可以是一个学校。研究一定是针对研究的整体,结论是针对样本所代表总体下的,不存在针对样本的研究。研究者必须在论文中明确表述研究总体,以及样本是否对总体有代表性。

——样本必须对总体有代表性。样本和总体的差异是随机带来的,不是人为带来的选择性偏差。必须保证数据来自概率抽样:随机+总体已知(保证总体的每个单位都有被抽中的可能性且可能性是已知的)。概率抽样有很多种方法,如简单随机抽样、分层抽样、整群抽样、等距抽样、多阶段抽样等。不同的抽样方法解决的主要是三个问题:无偏差性、精确性和方便性。由于复杂抽样绝大多数都不是等比例抽样(不是自加权抽样),通常都要做事后加权处理。研究者必须在论文中明确表述:数据是否是概率抽样,是哪一种抽样,是否做过加权处理,是否能够代表总体。

——对总体的推断问题。研究通常要反映“是什么”(描述)和“为什么”(解释)两个问题。这都是针对总体而言的。我们必须回答:样本结果在多大程度上可以反映总体?样本两个变量存在差异,到总体是否仍然存在差异?样本事实是否在总体上也是事实——对总体进行推断。

——合理选择样本规模,保证结论有效。一项研究在开始研究以前就要判断需要的样本规模。样本太少不行,估计不准;太多也不行,经费有限。样本规模的确定要有科学依据——总体有差异且能够证明有差异的可能性。方差越大,需要的样本规模越大。

——多变量研究与模型的选择和使用。很多研究都不关心模型假设,直接套用软件计算结果,并依次下结论。实际上,数据只有在满足模型假设时,模型才可以使用。不同目的,不同数据类型和结构,使用不同模型。

总体而言,科学研究的目的就是揭示客观事实及其规律,反映一般性和普遍性规律。科学研究的方法就是如何反映客观事实、如何揭示客观规律。科学理论就是哪些规律已经被揭示出来了,哪些还需要后人继续揭示。一个好的研究者需要不断加强研究方法和理论的学习和训练。妇女/性别属于跨学科的社会科学研究,同样离不开科学方法和理论的指导。

(作者为山东女子学院妇女研究与发展中心教授)