摘要
反应市场需求的变化,并最终体现在商品市场价格的变化上,商品房房价的变化亦是如此。本文基于这一思想,利用目前我国国内使用范围最广的百度搜索数据对北京市商品房价格进行拟合和预测,选取与商品房价格搜索相关的83个关键词的百度指数,并用Python对百度指数网页进行关键词数据抓取。数据清洗时首先看其是否录入百度指数,确定下63个关键词,再依次利用简单手动筛选、相关系数筛选等步骤选出9个关键词作为最终自变量的关键词,分别是:AJR(按揭贷款利率)、BDR(银行贷款利率)、BJFP(北京房价)、CPI、FDBR(房贷基准利率)、GDPR(GDP平减指数)、PCFD(公积金贷款)、PCFDED(公积金贷款额度)、PPI。建立随机森林模型,并检测模型的拟合和预测效果。结果显示:随机森林模型拟合效果、预测效果较好,本文所用方法可预测商品房房价领先官方发布数据10~15d。本文最后根据实证结果提出相关建议。
引文
[1]BreimanL,Random forests[J].Machine Learing,2001(45).
[2]董倩,孙娜娜,李伟.基于网络搜索数据的房地产价格预测[J].统计研究,2014(10):81~88.
[3]杨树新.基于网络关键词搜索的房地产价格影响因素研究[J].新疆财经大学学报,2013(03):5~12.
[4]白丽娟,闫相斌,金家华.基于搜索关键词关注度的商品房价格指数预测[J].预测,2015(04):65~70.
[5]张令令,孙金金,黄世祥.大数据背景下基于网络搜索数据的商品房价格预测——以武汉市为例[J].2015年第四届全国大学生统计建模大赛.
[6]张崇,吕本富,彭赓,刘颖.网络搜索数据与CPI的相关性研究[J].管理科学学报,2012(07):50~59.
[7]唐一丁.网络搜索数据在预测房地产价格指数中的应用研究——以北京地区为例[J].吉林大学,2016(04).
[8]武秀丽,张锋.时间序列分析法在房价预测中的应用[J].科学技术与工程,2007(11).
[9]肖轩.灰色神经网络与支持向量机预测模型研究[D].武汉理工大学,2009(05).
[10]龚小乐.房地产政策调控效果实证研究——基于网络搜索视角[J].南京大学,2016(05).
[11]王希晶.基于网络搜索的中国区域房价预测模型及应用研究[J].南京大学,2016(04).
[12]郭晓菲,李清军,潘子颖.基于投资者情绪指数的上证综指预测研究[J].2015年第四届全国大学生统计建模大赛.