内容摘要:党的十八届三中全会《决定》作出的启动实施单独二孩的生育政策,是促进人口长期均衡发展的重大生育政策调整决策。而生育政策调整的影响取决于生育水平有多低和生育政策是否仍然可以有效调节生育行为。本研究利用普查数据、教育数据和公安数据,对我国2000年以来的生育水平及变化趋势进行了评估。综合各种评估进行判断,前期的生育率低至1.5,而近年来的生育率有所回升,接近1.7。考虑到本研究的假设,这可能是较高的估计。结合我国目前的生育意愿为1.9个孩子,可以认为,我国的生育水平尚处于较为适度的低水平,生育政策仍然在调控生育水平中发挥着重要作用。
关键词:生育水平;总和生育率;普查数据;教育数据;公安数据
作者简介:
【作者简介】陈卫,weichen@ruc.edu.cn,博士,中国人民大学人口与发展研究中心教授、博士生导师,北京 100872
【内容提要】党的十八届三中全会《决定》作出的启动实施单独二孩的生育政策,是促进人口长期均衡发展的重大生育政策调整决策。而生育政策调整的影响取决于生育水平有多低和生育政策是否仍然可以有效调节生育行为。本研究利用普查数据、教育数据和公安数据,对我国2000年以来的生育水平及变化趋势进行了评估。综合各种评估进行判断,前期的生育率低至1.5,而近年来的生育率有所回升,接近1.7。考虑到本研究的假设,这可能是较高的估计。结合我国目前的生育意愿为1.9个孩子,可以认为,我国的生育水平尚处于较为适度的低水平,生育政策仍然在调控生育水平中发挥着重要作用。
【关 键 词】生育水平;总和生育率;普查数据;教育数据;公安数据
引言
中国处于低生育水平已有二十年时间。在这二十年里,各种人口调查和普查揭示生育率持续低迷,而学者们的大量研究对于生育水平的观点则是莫衷一是,甚至存在巨大差异。关于我国生育水平的研究好像出现了一种困境:一方面,官方组织了频繁和多样的调查,提供了大量的数据;而另一方面,受数据漏报、重报等质量问题的影响,人们普遍质疑官方公布的数据的可信度,如此丰富的数据资料也仍然不能提供令人信服的关于生育水平的答案。人们期待人口普查来解开谜团。但是2000年和2010年两次人口普查不仅没有明确回答生育水平有多低的问题,反而因数据质量问题而给我国的生育水平之谜蒙上了更重的迷雾。长期以来有关生育水平的争论也引发了对于生育政策调整的持续争论。
生育水平究竟有多低,这一争论并不妨碍我们对人口形势和趋势的判断和把握,因为我们确定的结论是生育率已经长期、明显低于更替水平。党的十八届三中全会作出的《中共中央关于全面深化改革若干重大问题的决定》提出,启动实施一方是独生子女的夫妇可生育两个孩子的政策,正是基于长期低生育率带来的挑战,为促进人口均衡发展而作出的重大的生育政策调整决策。毋庸置疑,生育政策调整的影响取决于生育水平有多低和生育政策是否仍然可以有效调节生育行为两方面。
本研究将试图进一步回答我国目前生育水平有多低的问题。尽管我们拥有了最新的人口普查数据和其他来源的更丰富的数据,但是对我国生育水平的估计仍然充满了挑战。本文将利用各种不同来源的数据,对比、综合、评估和判断我国2000年以来的生育水平。
文献回顾
类似于利用2000年人口普查数据对1990年代生育率进行的评估和争论,利用2010年人口普查数据对过去10年生育率的评估和争论也很热烈。学者们使用不同的数据和方法,结论也不尽一致,甚至存在很大分歧。基于2010年人口普查数据可信、准确的假设,一些学者直接利用普查数据、小普查数据和人口变动抽样调查数据对2000年以来的生育水平进行了评估。
郭志刚(2011)利用各次人口普查数据,通过“打靶”对1990-2010年我国的生育水平进行了评估。他首先根据2000年普查和2010年普查数据对1990年普查的漏报人口进行调整,并以调整后的人口作为基期人口。然后对各项人口变动参数进行设定,“预测”之后各年的目标人数。并且在假定2010年普查人口数量和结构准确的前提下,以2010年普查的数据为“靶标”,不断进行参数调整和校正,并且调整相应结果。研究表明,中国生育率在1990年代初有急剧下降,1996-2003年的总和生育率仅为1.4,近年来略有回升,也仅为1.5左右。而郝娟、邱长溶(2011)根据历年统计年鉴,直接采用普查和抽样调查数据进行计算,得出2000-2010年我国的总和生育率一直没有超过政策生育率1.47,在1.22-1.47之间波动,处于1.5以下的很低生育率水平。
朱勤(2012)在假定2010年普查数据准确的前提下,利用年龄移算方程及存活倒推法,以2010年10-59岁分年龄性别人口为基期人口,推算2000-2010年历年15-49岁的分年龄性别人口。并以2010年0-9岁人口数作为靶标,反复模拟推算,重建我国2000-2010年的生育水平。推算得到2001-2010年历年总和生育率在1.3-1.5之间,平均的总和生育率为1.48,与由国家统计局公布的数据计算得出的总和生育率平均值1.39差异很小。并认为基于2000年普查漏报而导致的对我国生育水平低估的情况并不存在,并且我国处于1.5以下的低生育水平的情况已经存在了至少10年。
在利用普查数据评估生育水平时,一些学者对普查数据质量提出质疑,并进行调整评估。崔红艳、徐岚、李睿(2013)对2010年普查的数据质量进行了全面评估,也对2000-2010年的生育水平进行了评估。他们首先通过长表中登记的0岁人口而非直接登记的出生人口,来推算2010年的出生人口,并据此推算2010年我国的总和生育率为1.3;接着他们又通过比较长短表出生人数和总人口的抽样比,得到登记的出生人口偏低的结论,由此推算的2010年总和生育率应为1.42;又根据历年人口变动抽样调查公布的出生人数和2010年人口普查的出生数据,测算漏报人数,得到调整后的2010年总和生育率为1.5;而直接根据历年人口变动抽样调查推算得到我国2000-2010年的生育水平应该在1.50-1.64之间。我国已经处于比较稳定的低生育水平发展阶段,当前总和生育率在1.5左右。
王金营、戈艳霞(2013)基于各次人口普查数据的对比,通过对2010年普查少年儿童人口进行漏报回填,并且考虑育龄妇女重报和抽样偏误等问题,对数据进行调整,得到2001-2010年的总和生育率的估计值为1.5-1.6左右。如果考虑到2010年普查更高的漏报影响,2001-2010年期间我国妇女总和生育率最高值可能会达到1.75,而低值应该在1.45左右。
李汉东、李流(2012)以2000年人口普查分城乡、分性别、分年龄的人口数据作为基期数据,以Leslie矩阵的离散动态人口预测模型作为基本模型,分别调整其中各项参数以对2000-2010年间的生育水平进行估算。结果发现,如果假定公布的2000年普查与2010年普查的数据是准确的,按照2000年普查的总人口和人口结构,10年间的平均总和生育率需达到1.82左右才能模拟出2010年普查的总人口;如果假定2010年普查数据准确,而2000年普查的数据存在漏报,同时使用教育数据对2000年的0-9岁人口进行调整,那么10年的平均总和生育率需要达到1.57才能使得2010年的模拟结果基本与所公布的2010年普查总人口基本持平;如果假定官方公布的2010年普查总人口数与历年总和生育率是准确的,那么按照这些数据回推得到的2000年总人口明显高于官方公布的总人口数,这也说明官方公布的数据存在内部不一致,自相矛盾的问题。文章的结论认为,21世纪头十年我国的平均总和生育率为1.57左右。
针对人口普查和抽样调查数据存在的问题,还有一些学者利用教育数据、公安数据等其他系统收集统计的数据,校对、调整普查数据,进而估计生育水平。杨凡和赵梦晗的研究(2013)对普查数据、教育数据和公安数据的特点进行了分析。她们认为可以从“五普”数据的问题中预见到“六普”数据问题的端倪,因为10年以来,导致瞒报、漏报的原因都没有出现任何缓解的迹象。2010年第六次人口普查的低年龄组也很可能面临漏报问题。对教育数据的分析发现,教育数据质量具有稳定性、准确性等特点,数据质量总体较高,但是要用以评估当前生育率可能在时效性方面存在一些局限。而公安数据虽然在个别年龄组上的质量存在着差别,但总体来说近些年的数据质量较好。于是她们使用教育数据和公安数据的结合、根据公安数据直接计算和根据公安数据登记率计算三种方法,估算得到2000年以来我国的总和生育率的下限大概处于1.5-1.63。她们根据公安数据中不完整的5岁组登记人口数所计算的2007年生育水平就已经达到了1.55,生育水平不可能更低了。2000年以来我国生育水平处于1.6-1.7左右。
张为民、崔红艳(2003)对2000年普查数据进行评估,利用全国小学生入学人数回推出生人数,来估计2000年普查低年龄人口的漏报程度。认为我国2000年的生育水平不低于1.63,应该在1.8左右。陈卫(2009)通过2004-2007年的教育数据,对2000年的生育水平进行估算,估算值为1.7-1.8。
由于利用别的来源的数据对普查数据的调整和对生育水平的评估往往明显高于基于普查数据的结果,有的学者也提出了怀疑的观点。张广宇、原新(2004)认为没有足够证据证明中国的普查和抽样调查存在大规模的出生漏报,他们认为出生漏报情况有可能被高估,而计算出的低生育率可能是因为实际生育水平确实已大大降低所致。郭志刚(2010a)也指出,我国的出生漏报以及低生育率被严重高估;研究者们应该更多地相信普查等由实地调查得到的数据,不要过分依赖主观判断。他认为以往人口估计和预测严重失误,高估了生育水平、人口增长等而低估了人口老龄化程度(郭志刚,2011)。蔡泳(2009)、郭志刚(2010b)对教育数据的质量也提出了质疑,主要是教育数据同样可能存在虚报。基于“两免一补”政策,利益相关者为了多获得资金而虚报、多报人数。教育统计本身也不是完全纯净,不能作为评估生育水平的“黄金”标准。
本研究不把任何一种来源的数据作为“黄金”标准,而是利用各种不同来源的数据分别估算生育率,进行对比,作出综合判断。对于各种来源的数据及它们的特征、优势和缺陷,现有的研究已经进行了详细的考察和说明(翟振武、陈卫,2007;杨凡、赵梦晗,2013),这里不再进行评述。







