用户名: 密码: 验证码:
1%人口调查大数据下河北省育龄妇女生育行为特征分析——基于随机森林误判集的深度挖掘
详细信息    查看官网全文
摘要
随着全国、全省老龄化程度不断加重、生育率水平低位运行,人口增长遇到瓶颈期,而全面二孩政策则为人口发展注入了一针"强心剂",但是政策实施的实际影响尚不可知。利用2015年河北省1%人口抽样调查的77.24万条人记录的"大数据",运用随机森林、关联规则、局部变量重要性、知觉图和类比分析等多种算法,深入挖掘影响育龄妇女生育水平的内在关系。分析结果显示生育行为会受到行业、家庭条件、年龄等因素的影响,且不同生育水平的影响因素之间存在明显差别。在此基础上,对育龄妇女的生育个数进行了进一步的分类预测,模型具有较高的正确率,沿此方向可以对人口增长和发展情况进行展望和预测。
With the low fertility rate and high degree of aging,population growth slows,government issued universal two-child policy,but the effect is unknown.This paper analyzed Hebei 1% census data as "big data",using association rules,random forests,local variables importance,perceptual mapping and analogy analysis etc.Results showed reproductive behavior will be affected by industry,family conditions,age and other factors,and these factors are different.Then,this paper use random forest classifier to forecast the number of children.The model has a high accuracy rate.
引文
[1]陈卫等.中国妇女生育率影响因素再研究[C].中国人口科学.2002,02.
    [2]孙文生等.社会经济发展的生育率效应研究[C].人口研究.1994,06.
    [3]Breiman L,2001a.Randomforests.Mach.Learn.,45:5-32.
    [4]B.Lariviere,D.V.D.Poel.Predicting customer retention and profitability by using random forests and regression forests techniques[J].Expert Systems with Applications,2005,29(2):472‐484.
    [5]杨沐晞.基于随机森林模型的二手房价格评估研究[D],硕士学位论文.中南大学.2012.
    [6]李丽.基于随机森林算法的企业信用风险评价研究-以我国电子生产行业上市公司为例[D].硕士学位论文.西南财经大学.2012.
    [7]邱一卉等.基于随机森林和单类支持向量机的电信行业客户流失预测[J].厦门大学学报.2013.
    [8]张杨.人口老龄化对消费结构的影响研究--基于四川省第六次人口普查数据[D].硕士学位论文.西南财经大学.2013.
    [9]孟晟.数据挖掘技术在人口普查数据中的应用[D].硕士学位论文.厦门大学.2013.
    [10]李苗.重庆市人口老龄化的危害、趋势及对策[J].城乡建设与发展.2016,10.
    [11]彭霄.基于人口普查数据的居民住房状况影响因素实证研究--以郑州市二七区为例[D].硕士学位论文.河南工业大学.2016.
    [12]庄亚儿.当前我国城乡居民的生育意愿--基于2013年全国生育意愿调查[J].人口研究.2014,03.
    [13]吴喜之.应用回归及分类--基于R.2016.
    [14]张佑印等.基于知觉图的旅华英国游客酒店属性感知分析[J].旅游论坛.2015,05.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700