第三届“登峰杯”全国中学数据挖掘竞赛初赛赛题
2017-10-25 10:44:11 来源: 您是第位浏览者
城市房价预测
近年来,城市房价节节攀升,影响着每个人的生活,也让年轻一代们倍感压力。房价的涨跌情况不仅仅成为政府关注的重大民生问题,也是普通人茶余饭后的关注点之一。因此,对于房价与其走势成为了社会的热点问题。不同的人可能会有不同的预测结果,如何让预测结果更加准确,这就是数据挖掘所关注的。请你利用自己所学的知识,通过实践研究,就地区房价走势预测问题,从以下角度做出探讨:
问题 1:纵向讨论,讨论如何利用近期(几个月或几年)房价历史金额与目前的价格情况之间的关联性做出预测。
问题 2:横向讨论,房价除开历史走势的影响之外,还和当前城区的人口数目有关,讨论城区的流入流出人口对城市房价预测的影响。
问题 3:在问题 1 和 2 解答的基础上,思考除了历史价格与城区人口因素,其它可能的影响因素。
问题 4:结合以上讨论内容,对城区近三个月的房价走势进行预测,并阐述结论与理由。
问题 5: 习总书记在十九大报告中指出,房子是用来住的,不是用来炒的。如何在准确预测房价的基础上,量化各种因素对房价贡献。
2017-2018登峰杯参考数据说明
1. 波士顿房价数据:
https://pan.baidu.com/s/1jHZzVX8
或者https://nowosad.github.io/spData/reference/boston.html
2. 链家地产国内部分数据(禁止数据分享和用于比赛以外的其他目的):
https://pan.baidu.com/s/1pLysnTx
数据介绍可以参考文章:
Hengshu Zhu, Hui Xiong, Fangshuang Tang, Qi Liu, Yong Ge, Enhong Chen, Yanjie Fu, Days on Market: Measuring the Liquidity of Real Estate Markets, The 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD-2016) , San Francisco, CA, USA, 2016.
该数据集提供了上述文章中的部分数据;使用数据请引用上述文章。
3. 其他数据来源建议:
链家地产等站点收集;
其他外部数据,例如,地理位置周边数据,网络数据,房地产市场政策、媒体数据等
4. 备注
本竞赛赛题的解释权归竞赛承办方所有。
2017年10月