宋林飞:我国社会研究的数量化趋势及其评估

来源: 发布时间:2018-06-07 浏览量:20

来源:江海学刊

近20年来,我国社会科学工作者使用现代社会研究方法的文献不断增加,出现了显著的数量化趋势。这是我国社会研究方法科学性增强、研究成果质量提高的重要标志。1979年,邓小平同志指出:“我们已经承认自然科学比外国落后了,现在也应承认社会科学的研究(就可比的方面说)比外国落后了。”“政治学、法学、社会学以及国际政治的研究,我们过去多年忽视,现在也需要赶快补课。”[1]我国社会科学工作者没有辜负小平同志的嘱托,社会研究定量方法的使用水平同欧美国家相比,差距已大大缩小。这一趋势是令人鼓舞的。同时也应看到,定量方法使用的规范性、前沿性、深度与效度等方面,均存在一些不足之处。

现代社会研究方法应用的基本状况

我们对《中国社会科学》(1980~1998年)、《社会学研究》(1986~1998年)刊载的社会调查研究报告进行了统计分析与评估,试图考察20年来现代社会研究方法在中国的应用及其进展。

1.研究对象选择方法的使用情况

我在《社会调查研究方法》(1990年)一书中,把研究对象的选择方法,分为抽样、典型、个案与普遍调查四种方法。1980~1998年间,刊于《中国社会科学》与《社会学研究》杂志上的社会调查研究报告,较多地使用了抽样方法,占54.8%;使用个案、典型等方法的占45.2%,比重相对较小(详见表1)。

 

2.资料搜集方法的使用情况

资料搜集方法可分为实地调查、问卷调查、文献研究等方法。我国学者在社会研究中越来越多地使用问卷调查。《中国社会科学》杂志上使用问卷调查的社会研究报告,20世纪80年代占25.8%,20世纪90年代上升为42.9%,增加幅度十分显著;《社会学研究》杂志上使用问卷调查的社会研究报告,20世纪90年代也比80年代增加较多,从37.0%上升为51.3%。这表明社会学者较早较快地接受与使用西方发展起来的问卷调查方法。

从两种杂志所发表的全部社会调查研究报告来看,使用问卷调查的较多,占42.6%;使用实地调查与文献研究方法的大体相当,分别占25.9%与24.3%。

 

3.资料分析方法的使用情况

20世纪80年代以前,我国社会研究较流行的方法是社会人类学方法与例示法。社会人类学方法较多地表现在对微观社会结构与社区的描述,例示法较多地表现为用事例与数据论证某一观点或描述某一研究对象。20世纪80年代以来,社会人类学方法在小城镇、城乡社区、社会群体等方面继续得到使用与发展,例示法使用数据所占比重明显增加。

20世纪80年代以来,我国社会研究的数量化主要表现为统计分析方法的逐步普及与深化。首先,是描述统计日益普遍地被用来分析资料、概括社会现象。1980~1998年,刊载在《中国社会科学》与《社会学研究》杂志上的社会调查研究报告中,以使用描述统计方法为主的占61.6%,使用推论统计与模型建构方法的比重较小,分别占9.5%与7.6%,但出现了明显的上升趋势。20世纪80年代,推论统计与模型建构分别占4.9%与5.7%,90年代上升为13.6%与9.3%。(详见表3)。

 

社会调查报告的初始方法分析

近20年来,我国社会调查报告使用量化方法的比重逐步上升,量化技术也出现了从简单到复杂的显著转变。我把调查研究方法分为初始方法、中间方法与终程方法。我国社会调查报告中量化方法的进展,首先表现为初始方法使用的增多与水平的提高。我尝试建立一种系统分析框架,对一些较有代表性的社会调查报告进行系统分析。

初始方法的系统分析框架包括以下六个要素:资料搜集方式、分析单位、变量、抽样方式、样本容量及样本评估。这一分析框架虽然有一定的局限性,却是比较有效的。

例1:《农村劳动力的剩余及其出路》(宋林飞,1982年)[2]

A.资料收集方式:统计调查。

B.分析单位:个人。

C.变量:农村劳动力剩余、农田耕作需要的劳动力、每个农业劳动力全年所能耕作的土地面积、农作物复种指数、每亩耕地全年需要的劳动日、每个农业劳动力全年所能完成的劳动日数、农村剩余劳动力转移(社队工业、建筑业、副业)等。

D.抽样方式:分类抽样(按人均耕地把全县61个公社分成8类;然后在每一类中各随机抽出一个公社,共抽出8个公社;然后再在8个公社内随机抽一、二个大队;然后进行饱和调查。)

E.样本容量:9174人。

F.样本评估:样本与总体比较。样本“农业劳动力”比例为71.9%,总体(南通县)“农业劳动力”比例为71.1%,二者相近。另外,该县县委书记黄冰近期调查的通海区“农业劳动力”比例为71.45%。

例2:《试析我国独生子女家庭生活方式的基本特征》(边燕杰,1986年)[3]

A. 资料搜集方式:典型调查、抽样问卷调查。

B.分析单位:户。

C.变量:家庭结构、家庭经济水平、家庭抚育孩子费用、父母余暇时间、家庭观、生育观等。

D.抽样方式:分类抽样(998户,另典型调查100户)。

E.样本容量:1088户。

F.样本评估:样本中独生子女家庭458户,非独生子女家庭630户,总体(天津市)中独生子女家庭占24%(其中市区占36%,郊区、县占15%)。

例3:《生活质量的结构与指标》(林南、王玲、潘允康、袁国华,1987年)[4]

A.资料搜集方式:访谈。

B.分析单位:个人(天津市居民)。

C.变量:生活质量、工作、家庭及环境。用因素分析和结构方程的方法把群众对具体生活的22个方面感受概括为由低到高的3个结构层次。

D.抽样方式:分类随机抽样。分类标准为职业。

E.样本容量:1000人,一半为户主,一半为户主配偶。

F.样本评估:样本与总体比较。作者认为:“样本的各项主要指标基本上与天津市人口普查各项主要相应的指标接近,说明样本颇具代表性。”

例4:《当代中国人的择偶标准》(李银河,1989年)[5]

A.资料搜集方法:文献法。资料来源是全国各地报刊杂志上的征婚广告。

B.分析单位:个人。

C.变量:性别、教育程度、户口(自变量)、年龄、容貌、收入、婚姻状况与经历、健康、事业心、理家能力、住房、家庭、性格及身高(因变量)。

D.抽样方法:简单随机抽样。样本是用随机数码表从一本全国范围的征婚名册中随机抽取的。

E.样本容量:300人(男150人、女150人)。

F.样本评估:定性说明。作者认为:“这个样本虽然还不能在严格的统计学意义上推论全国,但大致反映了我国征婚广告的现状。”

例5:《中国农村“职业—身份”声望研究》(折晓叶、陈婴婴,1995年)[6]

A.资料筹集方式:问卷调查。

B.分析单位:个人。

C.变量:职业、声望、身份、年龄、性别、民族、教育、收入、户籍、单位所有制、行业、社区。

D.抽样方式:多阶段抽样(在10个县(市)进行)。

E.样本容量:3012人。

F.样本评估:无。

例6:《改革以来我国大城市居民家庭收入格局的变化》(杨善华、沈崇麟,1996年)[7]

A.资料搜集方法:问卷调查。

B.分析单位:家庭(城市居民)。

C.变量:城市、性别、年龄、文化程度、职业、所有制(自变量)及家庭收入(因变量)。

D.样本容量:5664户(夫妻配对问卷,夫5664、妻5664)。

E.抽样方式:以非概率抽样抽出北京、上海、南京及成都等7城市;在每一城市内采用分层多段概率抽样法。

F.样本评估:无。

例7:《非农化与农民家庭观念的变迁———浙江省芝村乡调查》(王金玲,1996年)[8]

A.资料搜集方式:问卷调查。

B.分析单位:个人(浙江桐乡市芝村乡农户)。

C.变量:农民家庭权力和权利观念、生育观念、消费观念、交往和支持观念、隐私观念。

D.抽样方式:分类随机抽样。按农户收入分平均水平以上、平均水平、平均水平以下三个类型,再随机抽取样本。

E.样本容量:144人(男122人、女22人)。

F.样本评估:无。

从我们建立的初始方法分析框架来看,我国社会调查报告比较普遍地存在要素短缺的问题。近20年来,严格进行随机抽样并作样本代表性评估的社会调查报告不多,往往缺乏样本评估。使用样本与总体比较法评估样本的代表性,有一定的价值,也是可行的,但精确性无法界定。样本误差的计量对于推论总体具有重要的意义,但困难较大,这方面的工作很少有人做。

一项实际的社会调查,抽取多少样本为适当,是一个十分重要的问题。样本单位过多会造成浪费;样本过少,又会使调查结果发生较大的误差。应取一个规模有限、可以精确地反映总体的必要的样本数目。由于社会调查报告很少定量地反映总体各单位之间的差异程度,又不确定允许误差,也不重视抽样方式的影响,因而,必要的样本数目也不能定量确定。有一些社会调查抽取的样本数目较少,又不明确样本允许误差,使样本推论总体的价值甚小。

我们还看到一些社会调查报告,把非随机抽取、数量又少的样本的调查资料作单变量显示,摆出一连串的百分比等数据,作者往往具有推论总体的潜在要求,而实际上并没有推论的统计学意义,因而科学价值无法确定。

社会调查报告的终程方法分析

社会调查研究的终程方法主要是资料的分析方法。一篇社会调查报告的核心部分是资料的分析。在对资料总体进行审核、选择一定标志将资料总体分类整理与汇总之后,资料分析手段的定量方法主要有三种:描述统计、推论统计及模型建构。

1.描述统计

描述统计是终程方法中的基础方法,也是定量分析的基本环节。描述统计是目前我国社会学与经济学者使用最多的一种手段。在对部分社会调查报告的分析中发现,描述统计比较多地停留在资料的简单汇总上。有些调查报告没有选择一定标志将资料总体分类整理,粗糙地将资料列入统计表。例如有的调查报告只将问卷中所有问题列入表格,缺乏分析价值;指标交叉混乱,统计数据缺乏解释度;在对数据的处理上,使用百分比、比率及频次的较多,使用方差等描述方法的较少,对标志的显著性检验则更少。

比较好的描述统计体现在对指标的简单处理(例如归类),以及对标志的显著性检验上。例如石秀印的《对十二所大学学生需要动机的研究》[9]一文中,使用多变量统计表,并对每一标志进行差异显著性检验,另外使用人次分布曲线图,清晰直观地对资料进行描述。卢淑华在《城市生态环境问题的社会学研究———本溪市的环境污染与居民的区位分析》[10]一文中,使用量表进行描述,也对标志差异进行了显著性检验。

2.推论统计

推论统计主要用于对假设的检验,方法有双变量回归分析、多元回归分析、相关系数矩阵以及判别检验等。规范的使用推论统计的调查报告,应该首先有理论假设,然后进行检验。近20年我国的社会调查报告,较少提出理论假设,即使有假设,检验手段往往比较单一与简单。使用推论统计方法时较多地使用简单的相关系数计算或相关系数矩阵来确定变量之间关系,另外对相关关系的检验也比较缺乏。

近年来也有一些社会调查研究报告使用多元回归分析与判别检验等方法。例如,潘绥铭在《对于性交易的分析与预警》[11]文中,作者从假设中具体化为41项指标,对41项指标先进行双因素分析,后进行全局分析;对假设进行检验,确立与性交易相关的因素,其中使用了卡方检验、判别检验等方法。

3.模型建构

模型建构一般归入推论统计方法,由于近年来对模型建构的使用率上升,我将它另列分析。我国社会研究者在模型建构中,使用较多的是多元回归分析,或者使用已有模型或公式对现状的分析,另外比较突出的有因素分析和路径分析。

(1)回归模型分析。例如,彭玉生在《中国农村农业和非农业增长与区域差距》[12]一文中,利用县级调查资料,使用巴罗和马丁的基本增长模型对农村人均农业和非农业产值(对数)年均增长率进行回归分析,然后根据勒尔曼和逸晴提供的方法,对中国县级人均产值的基尼系数进行分解,形成模型。又如,彭希哲、任远在《从“知青一代”的职业流动看社会变迁》[13]一文中,计算了教育和初始职业地位的相关系数、教育和目前职业地位的相关系数、教育和职业地位上升下降程度的相关系数,并利用回归方程来说明教育和职业地位变迁的关系。

(2)路径分析。例如,马戎、潘乃谷在《居住形式、社会交往与蒙汉民族关系———从赤峰调查看影响民族关系的因素》[14]一文中,首先建立了一个蒙汉居住与交友情况因果分析模型,这个模型有两个因变量(邻居与交友状况)和十个自变量;然后通过路径系数计算检验模型,反映自变量与因变量之间、自变量内部相互之间的作用关系,反映这些关系的作用方向和影响程度;而后确定模型对变量的解决能力与统计学意义。

(3)因素分析。例如,张贵良等在《婚姻幸福及其相关因素的研究》[15]一文中,首先对婚姻幸福量表进行初步因素分析和信度分析,确定婚姻幸福因素,接着对婚姻幸福的相关因素进行分析,最后进行回归分析,其中最主要使用了因素负荷量和因素解释量的分析。丘海雄在《工人转工意愿的分析———广州重型机械厂的研究》[16]一文中,使用了相关矩阵、回归分析、单因方差分析及已旋因子矩阵等方法,对调查资料的处理比较深入。

使用模型建构的调查报告都较规范,从理论假设、变项测量、抽取样本到实际调查以及检验假设所采用的手段都比较科学。当前我国社会研究中模型建构的不足之处,是很少利用模型进行预测,也缺乏对模型解释力、预测力的计量与说明,从而模型的应用性较弱。

除了以上定量资料分析方法,经常使用的还有一种含有某种量化倾向的例示法。例示法中经常出现的问题是简单的举例说明或引用数据,解释力不强。也有一些使用例示法较好的社会调查报告。例如,罗涵先在《温州农村乡镇经济的面面观———浙南农村小城镇调查》[17]一文中,使用许多温州专业市场的具体描述,运用一些数据说明了温州模式。定性描述也是一种分析方法。使用定性描述方法,需要对研究对象有全面了解,进行深入描述。例如时宪民在《北京市个体户的发展历程及类别分化》[18]一文中,对北京市个体户进行了细致分类,较好地使用了类型描述方法。

田野考察方法是社会人类学者使用较多的方法。例如,费孝通在《重访云南三村》[19]一文中,在20世纪30年代调查的基础上跨越半个世纪进行追踪调查,描述了禄村、易村、玉村改革开放以来社会经济状况的变化。再如景军在《知识、组织与象征资本》[20]一文中,反映了他对中国北方两座孔庙的实地调查印象。郑晓云在《社会变迁中的傣族文化》[21]一文中,对曼飞龙村的文化变迁作了记叙与描述。

社会指标的量化方法

我国从20世纪80年代初开始了对社会指标的研究。发端于20世纪60年代美国的社会指标运动,来自于用社会统计方法认识社会发展水平的传统。社会指标体系的建立、投入运行与评价,对于客观地认识、科学地把握与合理地规范社会发展的实际进程,有着十分重要的价值。

我国社会学者在借鉴国外社会学者指标体系研究的基础上,结合我国社会的实际情况,运用了较为科学合理的方法进行社会指标体系建构,在社会描述、解释、评估、监测及预测等方面发挥了一定的作用。

1.指标选择方法

社会指标是衡量和监测社会发展数量关系的“指示器”,是研究社会发展各要素的现状、发展趋势和发现社会问题的一种量化手段。因此,指标的选择对于指标体系的科学化建构具有重要的意义。

(1)首先对指标选择方法进行界定。

指标的选择应遵循四项原则,即可测性、可靠性、充分性及最小性,然后通过两个步骤评分选择指标。第一步初选(粗过滤),主要选择标准在于可靠性与可测性;第二步精选(最终选定),主要选择标准在于充分性与最小性。备选指标在四项选择原则中的权数,如下表所示。再配以研究小组内部与外部专家的两方面评分法,最终选定指标。[22]

 

(2)参照已有的社会指标体系,确定预选指标集。

通过对指标值分布的离散程度分析得出指标鉴别力,并将预选指标集制成咨询问卷征询专家意见,综合得到各指标隶属度。然后,再根据各指标的鉴别力和隶属度系数,进行指标分析与筛选。[23]

(3)通过经验预选和专家咨询两个步骤进行指标筛选确定。

首先,凭借实践经验,参考国内外社会指标理论框架与应用的成果,从现有的统计资料中预选出符合建构原则和层次要求的一定数量的指标,一般比确定的入选指标多50%至一倍组成预选指标集。其次,将预选指标集制成咨询问卷,征求熟悉社会指标的专家的意见,请他们对预选指标集中的指标进行限量的选择,通过差额筛选,汇总分析,确定入选指标。[24]

(4)以理论推演确定指标。

如郑杭生等在论述“以人为中心”的社会发展指标体系时,根据一定的社会理论,结合一定的社会目标进行系统性的理论推演,确定相关的定量指标。[25]

(5)以调查分析为基础确定指标。

李培林等人曾以山东陵县县情调查为背景,进行指标的选择。他们认为,对农民生活水平的分析不应只凭经验的估计和统计数字的直观结论,而要在调查分析的基础上,建立一个较为完备的衡量指标体系。[26]

(1)社会发展指标体系

A.社会发展综合指标体系(朱庆芳,1987年)[27]

包括社会结构、人口素质、生活质量三大类28项指标。

B.社会发展评价指标体系(王地宁、唐钧,1991年)[28]

包括人口结构与素质、基本生活需求、精神文化需求、社会安全需求、经济效益与劳动效率五大类42项指标。

C.社会发展水平评估指标体系(宋林飞,1998年)[29]

包括人力资源、劳动就业、收入分配、生活质量、城市化、社会稳定六大类30项指标。

D.人的全面发展指标体系(郑杭生、李路路、李强,1988年)[30]

包括人口与家庭、社会劳动、社会分层与流动、社会参与、社会秩序与安全五大类22项指标。

(2)生活质量指标体系

A.生活总体满意度指标(卢淑华,1992年)[31]

包括家庭收入、吃的方面、健康、家庭生活四个指标。

B.生活质量指标体系(林南,1987年)[32]

包括以下五大类22项指标:工作的社会特征(工作、劳动形式和强度、工作环境和条件、职业的社会声望、工作的社会贡献、工作技术的复杂性、工作单位地点远近、工作给予您的权力),工作的经济特征(工资收入、工作的福利待遇、工作晋级和提升的机会、身体状况、家庭经济状况),家庭以外的关系(同事关系、和领导的关系、朋友交往),家庭(家庭生活、家庭成员间的关系),环境和业余生活(住房情况、居住环境、业余生活、邻里关系)。

C.生活质量指标体系(李强,1986年)[33]

包括四大类12项指标:经济生活(工作与职业、居民收入与消费、住房交通与生活服务),政治生活(社会风气、社会秩序、社会参与),社会与家庭生活(社会保障与社会福利、教育、卫生与健康、家庭生活),精神生活(文化生活、思想道德)。

(3)小康指标体系(小康县综合评价课题组,1994年)[34]

包括五大类28项指标:社会结构、经济效益、人口素质、生活质量与经济实力。

(4)现代化指标体系

胡福明等提出的现代化指标体系包括五大类20项指标:经济发展(人均国内生产总值、科技进步在经济增长中的贡献、进出口贸易总额与GDP之比、农业劳动者人均农业产值),社会结构(第三产业增加值占国内生产总值比重、非农业劳动者占社会劳动者比重、城市化水平),人民生活与人口素质(人均年纯收入、人均预期寿命、恩格尔系数、人均居住面积、每千人拥有医生数、每万人拥有大专以上文化程度人数),社会公平与社会稳定(社会保障覆盖率、失业率、贫富差距),社会环境质量(人口自然增长率、城市人均拥有道路、“三废”处理率、每万人刑事案件发案率)。[35]

(5)社会风险预警综合指标体系(宋林飞,1995年)[36]

包括五大类50项指标:经济(失业率、抢购风、集体**等)、政治(干部贪污、牢骚、行政诉讼等)、社会(犯罪率、小道消息、恶性侵犯事故等)、自然环境(严重灾害、农业食品短缺、生命损失等)、国际环境(世界经济衰退、经济摩擦、经济制裁等)。

3.指标体系评价方法

指标值与指标关系的确定方法,对于社会指标体系能否科学合理地发挥其社会功能具有关键性的意义。指标值与指标关系的数量化操作,是突破社会学领域某些模糊状态的重要途径。

(1)指标值确定方法

A.宋林飞在《社会风险指标体系与社会波动机制》[37]一文中,使用的方法是:简单综合评分法;加权综合评分法;简单分类评分法;综合评分与评级法。

B.朱庆芳在《小康社会指标体系及2000年目标的综合评价》[38]一文中使用的方法是:综合指数法;综合评分法。

C.社会发展指标及评价方法课题组在《首都社会发展指标及评价方法》[39]一文中使用的方法是:综合指数法。

各种方法均有各自的优缺点。例如,综合指数法适用于综合社会发展水平的历年动态比较,但常因某些指标增减速度过高或过低而影响综合指数的准确性。一般认为,综合评分法操作简便,计算结果也比较符合实际,适用范围更为广泛。

(2)指标关系计量方法

A.林南等在《生活质量的结构与指标》[40]一文中,使用因子分析与结构分析的方法,测定了三层次结构各变量关系的系数。

B.卢淑华、韦鲁英在《生活质量主客观指标作用机制研究》[41]一文中,使用参照标准对指标相关关系计量分析后,进行指标简化,确定最有效的指标。

注释

[1]《邓小平文选》(1975~1982年),人民出版社1983年版,第167页。

[2]《中国社会科学》1982年第5期。

[3]《中国社会科学》1986年第1期。

[4]《社会学研究》1987年第6期。

[5]《中国社会科学》1989年第4期。

[6]《中国社会科学》1995年第6期。

[7]《中国社会科学》1996年第3期。

[8]《社会学研究》1996年第4期。

[9]《社会学研究》1988年第4期。

[10]《社会学研究》1994年第6期。

[11]《社会学研究》1995年第2期。

[12]《社会学研究》1998年第6期。

[13]《社会学研究》1998年第1期。

[14]《中国社会科学》1989年第3期。

[15]《社会学研究》1996年第4期。

[16]《社会学研究》1992年第3期。

[17]《社会学研究》1986年第6期。

[18]《中国社会科学》1992年第5期。

[19]《中国社会科学》1991年第1期。

[20]《社会学研究》1998年第1期。

[21]《中国社会科学》1997年第5期。

[22][36]宋林飞:《社会风险指标体系与社会波动机制》,《社会学研究》1995年第6期。

[23]王地宁、唐钧:《社会发展指标体系的建构与应用》,《中国社会科学》1991年第1期。

[24]朱庆芳:《社会指标的应用》,中国统计出版社1992年版,第7~8页。

[25]郑杭生、李路路、李强等:《试论“以人为中心”的社会发展指标体系》,《社会学研究》1988年第5期。

[26]李培林、丁少敏:《评价农民生活水平的综合指标体系及其应用》,《社会学研究》1990年第2期。

[27]《中国社会科学》1987年第4期。

[28]《中国社会科学》1991年第1期。

[29]《南京社会科学》1998年第4期。

[30]《社会学研究》1988年第5期。

[31]《中国社会科学》1992年第1期。

[32]《社会学研究》1987年第6期。

[33]《社会学研究》1986年第6期。

[34]小康县(市)综合评价课题组:“小康县(市)的综合评价方法和已基本实现小康目标的县(市)情况”,《社会学研究》1994年第6期。

[35]胡福明、贾轸、严英龙:《苏南现代化》,江苏人民出版社1996年版,第228~229页。

[37]《社会学研究》1995年第6期。

[38]《中国社会科学》1992年第1期。

[39]《社会学研究》1987年第4期。

[40]《社会学研究》1987年第6期。

[41]《中国社会科学》1992年第1期。