陆铭：后工业化时代的城市:城市规模影响服务业人力资本外部性的微观证据（上）

来源：发布时间：2018-03-07 浏览量：14

来源：经济研究

一、引言

当今世界，作为推动经济发展的最重要的因素，人才、创新和思想在全球的分布并不均衡，他们日趋集中在少数大城市中(World Bank，2008)。这背后的原因之一在于高技能劳动力聚集在同一个城市时，不仅会提高个人自身的生产率，也会促进整个城市生产率的提高，这就是知识、技术、信息在城市居民的相互交流中产生和传播的“人力资本外部性”(Duranton＆Puga，2004；Lucas，1988；Moretti，2004a；Moretti，2011；Rosenthan＆Strange，2004)。

中国经济在经历了30多年的高速增长之后，已经成功地从一个农业国家转型为工业国家，2011年，服务业的就业份额达到35.7%，首次超过了农业的就业份额(34.8%)。①与此同时，中国城镇化率也从1978年的17.9%提升到了2014年的54.77%。②相比于农业和工业，服务业是“密度经济”，更需要人与人之间的交流，而城市中高密度的人群所在地正是服务业发展的聚集地。中国经济在未来实现转型升级必然会进一步提高服务业的份额，这同时也有利于转变中国经济增长过于依赖投资和出口的路径，而这又必然会伴随着进一步的城市化，尤其是大城市的发展。但是，社会各界对于城市规模与现代经济(尤其是服务业)发展的关系理解不充分，造成在经济政策上偏向于强调大城市中存在的拥挤和污染问题。其结果就是，在城市发展政策上，仍然将控制特大城市的人口规模作为目标，背离了城市规模推进经济发展的客观规律。

相比于肉眼可见的城市病，城市发展中的人力资本外部性是无形的。那么，人力资本外部性是否存在?人力资本外部性是否与城市规模相关?对于企业而言，人力资本外部性是来自行业内，还是行业间?哪种外部性占主导作用?行业内、行业间的人力资本外部性与城市规模的关系如何?对这些问题的研究有助于我们理解城市发展的规律，科学地制定城市发展政策。本文利用2008年经济普查中服务业企业层面微观数据考察服务业内人力资本外部性大小，并尝试给出人力资本外部性的作用机制，发现服务业内的人力资本正外部性主要体现在大企业中。在用20世纪50年代初“高校搬迁”运动中各个城市迁入的系的数量作为城市人均教育水平的工具变量进行两阶段回归之后，结论依然成立，而且这一结论对生产函数的不同形式和高技能的不同定义都是稳健的。然后，将城市人力资本外部性的来源细分为行业内企业间、服务业行业间、制造业三个部分，结果发现来自行业内企业间、服务业行业间的人力资本外部性会随城市规模的增大而加强，而来自制造业的人力资本外部性则随着城市规模增大而减弱。最后，考察分析人力资本外部性的作用机制，结果发现行业内企业间和服务业其他行业间高技能者交流产生的人力资本外部性随城市规模增大而加强，而与制造业高技能者交流产生的外部性随城市规模增大而减弱。本文的含义是，进入后工业化阶段后，大城市对于服务经济的发展越来越重要。

本文的结构安排如下:第二部分进行相应的文献回顾，第三部分详细介绍回归模型和数据，第四部分给出实证的基本结果和稳健性检验，第五部分尝试给出人力资本外部性的作用机制，最后是结论总结。

二、文献回顾

人力资本外部性作为经济集聚发展的微观机制，在最近30年里引起了国际学术界极大的关注(Duranton＆Puga，2004；Moretti，2004a；Moretti，2011；Rosenthan＆Strange，2004)。人力资本高的城市往往具有更高的工资，一方面在于这些城市具有高人力资本带来的更高的生产率，另一方面是同城内高人力资本者带来的人力资本外部性。如此一来，用宏观数据考察人力资本外部性的研究即使可得到人力资本高的城市具有更好的生产率和工资(Riceetal．，2006)，也还无法证明人力资本外部性的存在，因此，考察人力资本外部性的研究大多是利用微观数据，并且从工资和企业生产率两个角度来进行研究的。③

用工资作为被解释变量的大部分研究都证实了人力资本正外部性的存在，④并且发现人力资本外部性主要是高技能劳动力带来的(Lange＆Topel，2006；Moretti，2004a)，对低技能劳动力的影响更大(Moretti，2004b)，也发现了人力资本外部性会随地理距离的增加而减弱(Fu，2007；Rosenthal＆Strange，2008)。需要注意的是两篇用中国数据考察人力资本外部性的文章:Liu(2007)和Glaeser＆Lu(2014)。Liu(2007)利用1988年和1995年CHIP数据，并利用义务教育教育法执行情况作为城市平均受教育水平的工具变量，发现城市平均受教育水平每增加1年，会使得个人年收入增加11%—13%。⑤Glaeser＆Lu(2014)利用2002、2007年的CHIPS数据考察人力资本外部性并用中国20世纪50年代初高校院系搬迁中城市迁入和迁出的系的数量作为城市人力资本的工具变量，发现城市平均受教育水平每增加1年，会导致个人小时工资增加28%，月工资增加22%。

上述文献主要是利用劳动力个人层面的数据来检验城市教育水平对于个人工资的影响。对企业而言，在控制其他变量的情况下，如果投入相同，在高人力资本水平城市中的企业具有更高的产量，或者在产出相同的情况下，在高人力资本水平城市中的企业具有更低的投入，亦可被认为存在人力资本外部性。Moretti(2004c)利用美国1982和1992年制造业企业层面的面板数据估计生产函数以考察人力资本的外部性，发现城市内除了本企业外的员工中的大学生比例每增加1%会使得本企业的产量增加0.5%—0.6%，而且高技术行业的人力资本对其他高技术行业企业的影响比对低技术行业企业更大，同样，低技术行业的人力资本对低技术行业的影响比对高技术行业企业更大。另外，相对于整个制造业的人力资本，高技术行业的人力资本对所有企业的影响更大。不过Moretti(2004c)所使用的企业数据中没有员工教育程度的数据，而只有员工总工作时间的数据，因此利用1980和1990年人口普查数据中每个城市每个三位码行业中不同学历者工作时间比例来推算每个企业不同学历员工的工作时间。这样的做法中，未控制每个企业的人力资本变量，而这个变量又与模型的核心变量(即城市内其他行业的人力资本)是正相关的，因此，这一遗漏变量问题可能会造成估计结果的高估。此外，文中所用的数据是人口普查数据和企业数据进行匹配而成的，造成了关键变量———城市内除了本企业外的员工中的大学生比例———的变异程度不够大，因此在回归中无法控制“城市×时间”虚拟变量的影响，这往往也会造成估计结果的有偏。更重要的是，由于数据所限，在模型估计中，无法控制行业内企业间的人力资本外部性，这不仅会高估城市人力资本外部性的估计结果，也会使得之前的结论———高技术行业的人力资本对高技术行业企业的影响比对低技术行业企业来得更大；低技术行业的人力资本对低技术行业的人力资本的影响比对高技术行业企业更大，可能只是遗漏了行业内其他企业人力资本情况的结果。

Liu(2014)利用1995—1999年的中国工业企业数据考察人力资本外部性，其中城市层面的平均受教育水平是利用1994—1999年期间包含6个省市的城镇家庭调查数据来构建的。城市不同年份的平均受教育年限变化，一方面是来自新进入劳动力市场的年轻劳动力，他们往往具有更高的教育年限；另一方面是来自已经拿到城市户籍的农村移民，这些人往往比本地原居民具有更高的教育程度，尤其是在大城市。因此利用调查数据构建的平均受教育水平是内生的，可能造成估计结果的偏误。工业企业数据中没有企业层面高技能劳动力的数据，Liu(2014)利用企业实际工资与行业平均实际工资的比值来度量企业的人力资本。由于Liu(2014)考察期间是在1995—1999年，刚好是国企改革阶段，因此企业实际工资与行业平均实际工资的比值更可能会反映不同行业的改革进度，也有可能是其他影响企业工资水平的因素(比如企业垄断程度)的反映，因而不能准确度量企业的人力资本水平。

总而言之，大多数文献已经发现人力资本外部性是存在的，只是因为使用的数据和估计方法的不同，导致人力资本外部性的大小程度有所不同。在企业研究中，文献主要是利用制造业的数据，而对于服务业的人力资本外部性还是未知的。正如Lucas(1988)所说，城市是检验人力资本外部性的理想场所，而随着经济发展水平的提高，服务业在城市(尤其是大城市)经济中的比重是逐步提高的，因此运用服务业数据估计人力资本外部性也具有更强的政策含义。本文使用2008年经济普查中整个服务业企业层面的微观数据，这使得我们的工作能够对已有文献在两方面进行改进:

第一，本文首次使用来自服务业的数据来估计人力资本外部性。首先，服务业的生产和消费更可能是同步的，而且会更大程度地受限于地理范围，更容易本地化，更难进行跨地区贸易(江小娟，2011)；其次，服务业是劳动密集型的，更需要人与人面对面的交流，与此同时，人力资本外部性主要是借助于面对面的交流产生的(Fujita＆Ogawa，1982；Glaeser，1999；Lucas，1988；Lucas＆Rossi-Hansberg，2002)。因此，利用服务业数据的实证结果能更好地反映了人力资本外部性的作用机理。

第二，对于单个个体(个人或者企业)而言，它面临的人力资本是个加总的概念，对企业而言，人力资本外部性对它的影响是由来自城市本行业内其他企业还是其他行业，这是已有文献还没回答的问题。这个问题的答案有助于我们理解产业的协同集聚(Co-agglomeration)现象。产业间的协同集聚现象说明任何城市都是专业化和多样化并存的(Duranton＆Puga，2000；Ellison＆Glaeser，1997)，这与城市理论模型得到的城市要么全部专业化，要么全面多样化的结论不符合。当理论模型同时考虑产业内企业间和产业间的外部性时，才能够解释城市专业化和多样化并存的现象(Duranton＆Puga，2000)，以及产业的协同集聚现象(Helsley＆Strange，2014)。而企业间的外部性，无论是产业内的还是产业间的，都是基于员工交流带来的(Ellisonetal．，2010)。已有文献受数据所限，只能从产业层面来考虑产业间的外部性，而本文使用2008年全国第二次经济普查中整个服务业的企业层面微观数据，其中包含了每个企业各种学历的员工数量。利用企业内员工教育程度的数据，本文不仅能够在回归中控制企业自身的人力资本，也可将城市层面的人力资本细分为行业间和行业内企业间两个部分，这样就能够更好地区分人力资本外部性主要是出现在行业间还是行业内，而这是已有文献未能做到的(Liu，2014；Moretti，2004c)。

三、模型设定与数据

(一)模型设定

如果人力资本外部性存在的话，在高人力资本城市中的企业会具有更高的企业生产率，或给定相同投入，在高人力资本水平城市中的企业具有更高的产量。为此，本文借鉴Moretti(2004c)的做法，通过估计生产函数来考察人力资本外部性的大小。我们假设是生产函数是柯布道格拉斯形式，具体表达如下:

/ueditor/php/upload/image/20180307/1520401704387694/aa89ada8514b1123a40a4484100496db.jpg

其中，Yijc是城市c行业j企业i的产量，Hijc和Lijc分别是指企业的高、低技能劳动力数量，Kijc是相应的资本量，Aijc是企业的技术水平。假设企业技术水平取决于所在城市c的人力资本水平，本文用高技能劳动力比例来度量它。具体表达如下:

/ueditor/php/upload/image/20180307/1520401744885928/40c4e8b97089205678f8a90f2bd58081.jpg

其中，skillc是城市c内除了企业i之外的其他所有企业高技能劳动力比例⑥，λj是行业j的固定效应，Xc是城市c的特征，εijc是城市c行业j企业i受到的随机性因素。对(1)式进行对数化，并将(2)式代入，可得

/ueditor/php/upload/image/20180307/1520401781833612/9af749079d6cb495a1367c25e1d2ba01.jpg

在(3)式中，我们关注的是skillc的系数，βA，它衡量了城市人力资本外部性的大小。已有文献主要是关注引起βA估计有偏的原因，具体体现在三个方面:一是需求方面的因素，生产率高的企业对高技能劳动力需求较高，往往会选择到高技能劳动力比例高的城市，造成反向因果；二是供给方面的因素，比如气候或者城市文化，可能会吸引高技能劳动力，进而提高企业生产率，导致出现遗漏变量问题；三是高技能劳动力比例高的城市往往具有更好的基础设施和制度，这也会提高企业的生产率。上述三方面会引起城市人力资本的系数被高估，但同时，也会存在一个使这一系数被低估的效应，即人才竞争效应，高技能者聚集在一起，也会相互竞争，从而不利于提高彼此的收入(或者企业的产量)。因此，在实证模型中通过加入城市层面的控制变量可部分缓解βA估计有偏的程度，回归中控制的城市特征变量包括:人口、人均GDP、人均汽车电动车数量、每百人拥有的病床数和师生比。在控制城市变量的基础上，我们也控制了城市所在省份的固定效应。虽然我们在回归中控制了城市层面的变量及所属省份的固定效应，但终究无法控制所有引起βA估计有偏的因素。为此，本文尝试用工具变量来缓解OLS回归中可能还存在的内生性问题。我们主要采用Glaeser＆Lu(2014)中的工具变量，即20世纪50年代高校院系调整运动中每个城市迁入院系的数量，作为城市教育水平的外生冲击。

对于回归方程(3)中，即使我们能够得到βA的一致估计，也无法回答人力资本外部性的来源。原因在于，对于企业i而言，skillc是个加总的变量，不仅包含城市c行业j的人力资本、城市c除了行业j外其他服务业的人力资本，也包含了城市c制造业的人力资本。对于城市发展而言，多样化和专业化的选择是个重要的难题。如果企业所在行业的高技能劳动力比例有助于提高本企业的效率，则可以增加本行业的规模，加深城市的专业化；反之，如果其他行业的高技能劳动力比例会提高本企业的效率，则说明有利于城市跨行业的多样化发展。可见，对skillc进行细分考察很有必要。考虑到使用的是来自服务业的数据，本文将其他行业的人力资本又细分为来自制造业的和服务业其他行业两个部分。最终，分解成三部分，具体如下:

/ueditor/php/upload/image/20180307/1520401836521700/18cf7f84f1aba6711b82d879bc3857a6.jpg

其中，Intraskilljc是城市c企业i所在行业j其他企业的高技能劳动力比例，Interskill－jc是城市c服务业内除了企业i所在行业j外的其他行业的高技能劳动力比例，Manuskillc是城市c制造业的高技能劳动力比例。

Moretti(2004c)考察制造业内三位码行业之间的人力资本外部性，而遗漏了本行业内其他企业的人力资本外部性。当同一城市内不同行业间的人力资本正相关时，遗漏了本行业内其他企业的人力资本变量会高估行业间的人力资本外部性。Liu(2014)则是利用城市平均受教育水平来度量企业外的其他人力资本水平，相当于式(3)中的skillc，没有具体考察人力资本外部性是来自哪个部分的人力资本。当三个部分的人力资本外部性有所不同，尤其是随着城市规模而变化的趋势不相同时，对城市人力资本分为三个部分进行考察就显得很必要。在之后的回归中，本文首先考察城市人力资本外部性大小，然后对人力资本分为三部分，分别考察各自人力资本外部性的大小。

最后需要的注意是，本文使用的经济普查数据虽然能够控制企业内的人力资本水平和细分城市人力资本以考察人力资本的具体来源，但遗憾的是，数据是截面数据，一方面无法控制企业层面的固定效应，另一方面，当将城市层面的人力资本细分时，用工具变量方法估计就几乎不可能。为此，我们在本文的实证分析中估计回归方程(3)时，使用了Glaeser＆Lu(2014)所用的工具变量进行回归，并与OLS的回归结果进行对比，发现OLS的估计结果只是系数略小于IV估计的结果，而系数的符号和显著性大都是相同的。也就是说，在本文的回归中，内生性问题仅仅略微地影响了系数的大小。即使存在估计的内生性偏误，人力资本外部性OLS估计的系数也只是低估的。因此，在考察城市人力资本外部性来源时，本文只采用OLS进行估计。

(二)数据

本文实证所使用的数据主要是2008年全国第二次经济普查的企业微观数据。第二次全国经济普查的对象是从事第三产业活动的全部法人单位、产业活动单位和个体经营户，具体范围涉及19个国民经济行业门类、90个行业大类、378个中类、875个行业小类。经济普查数据中，包括行业类别、登记注册类型、机构类型、隶属关系、企业控股情况等反映单位主要属性的指标；包括开业(成立)时间、企业营业状态、以及企业经营形式等反映单位基本状态的指标；包括资产负债指标、损益指标、平均人数等反映单位财务状况的指标。

全国经济普查数据对企业、行政事业单位和其他服务业企业采取全面调查，相比于其他数据更具有代表性。另外，普查数据中不仅具有年末从业人员总数，也还含有不同教育程度的从业人员数。这个数量可以用来估计企业不同技能劳动力之间的关系。在本文的实证分析中，只考虑企业行为，因此数据中，机构类型为事业单位、机关、社会团体、民办非企业单位、基金会、居委会、村委会和其他组织机构的样本都不进入分析。在细分城市人力资本时，制造业高技能比例的数据是利用2004年全国第一次经济普查的企业微观数据加总而来。

经济普查数据中，有研究生及以上学历、大学本科、大专、高中、初中及以下5种不同学历的员工数量。下文的主要实证分析结果中，我们将研究生及以上学历、大学本科和专科学历的劳动者定义为高技能劳动力，其余的劳动力则定义为低技能。为了避免员工分类不同而带来结果的不同，我们在稳健性检验中将报告不同技能分类方法的结果，从而保证结果的稳健性。

数据处理有三点需要说明。第一，数据中如果所有学历的数量都是缺失值，我们将该样本直接删除，否则，我们将缺失值赋值为零，这样做的原因是企业不太会刻意只报告某些教育类型的员工数量。在经过这样处理后，我们根据技能定义加总，得到每个企业高、低技能劳动力的数量。第二，本文剔除了年末从业人员数量小于8的样本，原因在于这些企业可能缺少可靠的会计系统(聂辉华等，2012；谢千里等，2008)。最后，删除了企业中收入、资本、年末从业人员总数缺失、小于等于零、员工总数小于某类教育程度员工数量的所有数据，并根据企业全年营业收入、资本删除最高和最低的1‰，将员工总数最高的1‰样本删除。最终得到的样本量是1190697家企业，具体变量的统计性描述如下。

/ueditor/php/upload/image/20180307/1520401900545932/e1a42e56b6be9c3df8d79552c9e96cb5.jpg

四、实证结果分析

(一)基准回归

在基准回归中，本文考察城市人力资本外部性的大小，结果见表2。表中第1列利用全样本进行回归，城市高技能劳动力比例的系数为－2.928，在1%的置信水平下显著。人力资本外部性为负的原因，一方面可能是由城市层面人力资本变量所存在的内生性造成的，另一方面可能是由于服务业企业的异质性很大，尤其是在企业规模上。高技能劳动力比例高的城市往往也是人口数量多的城市(数据显示，城市高技能劳动力比例和2008年城市人口对数的相关系数为0.6197)，这对小企业来说意味着竞争程度更高，即别的企业人力资本水平越高，本企业受到的竞争越激烈，这样城市人力资本系数可能是负的。而对于大企业来说，它可以进行各种创新活动，可以和其他高技能劳动力进行交流，这对于其收入有促进作用。为此，我们将企业分为小企业和大企业两组，小于等于企业员工数样本均值的企业定义为小企业，大于企业员工数样本均值的企业定义为大企业。回归结果见表中的第2和3列。在小企业样本中，城市高技能比例的系数为－3.193，在1%的置信水平下显著，而在大企业中，相对应的系数在1%的置信水平下显著，大小为－1.532，比小企业样本的回归系数更小。

/ueditor/php/upload/image/20180307/1520402027994025/55f6dbf0edf6f8afca150e034a55f434.jpg

表2中的结果虽然控制了城市层面变量和省份固定效应，可部分控制遗漏变量产生的估计偏误。同时，增加控制变量还是无法完全解决由于反向因果关系带来的影响。因此，本文尝试用工具变量方法来缓解估计偏误。1950年代的“院系调整”运动对于城市来说是一场外生冲击，这场运动发生得快(主要集中在1952年)，事先无法预期，涉及面非常广。由于当时大量大学教师、学生、科研设备、图书资料等都发生了跨城市的搬迁，经过了半个多世纪，对今天城市的人力资本水平仍然产生了深远的影响(Glaeser＆Lu，2014)。在表3第1到3列中，我们利用20世纪50年初“院系调整”运动中每个城市迁入系数量作为城市高技能比例的工具变量，并使用两阶段最小二乘法估计模型。从第一阶段F值可以知道不存在弱工具变量问题。在表中，城市高技能比例的系数都不显著，大小分别为－3.040、－3.417和－0.446。⑦

/ueditor/php/upload/image/20180307/1520402047629634/69f47a656ca70f912e7693eeacebec01.jpg

从表2和表3结果对比来看，OLS的回归结果虽然会造成城市人力资本外部性估计的有偏，但程度不大。这也说明在控制了城市变量、省份固定效应和三位码行业固定效应之后，可在很大程度上缓解内生性对估计结果的影响。另外，在后面的回归中，将城市的人力资本分解为来自制造业、服务业行业间和行业内企业间三部分，为它们各自找到对应的工具变量，几乎不可能。因此，在后续的回归中，本文只使用OLS进行回归分析。

对于回归方程(3)中，即使能够得到βA的一致估计，也无法回答人力资本外部性的来源。原因在于，对于单个服务业企业而言，城市层面的人力资本是个加总的变量，不仅包含同城市本行业的和其他服务行业的人力资本，也包含了城市内制造业的人力资本。而三个不同部分的人力资本外部性是否都存在，是否不同，将是我们在表4中要回答的。

/ueditor/php/upload/image/20180307/1520402068728403/6ea4d49711c50dd79408af6fcfaee341.jpg

在第1列中，可知来自行业内其他企业高技能比例、服务业其他行业高技能比例和制造业高技能比例的系数都为负，但只有服务业其他行业高技能比例显著。将样本分为大小企业两组之后，我们发现在小企业中，三个系数也都为负，同样也只有服务业其他行业高技能比例显著；而在大企业中，行业内其他企业高技能比例的系数为0.39，在1%的置信水平下显著；服务业其他行业高技能比例系数为－1.492，在1%置信水平显著；而制造业高技能比例的系数依然为负且不显著。

导航

专家视点

陆铭：后工业化时代的城市:城市规模影响服务业人力资本外部性的微观证据（上）