stata计量经济学论文精选范文6篇之第六篇:STATA软件在房价统计上的应
摘要:房价作为一个与民生息息相关的问题, 始终是政府、百姓所关心的重点, 也一直是学者研究的主要方向。近年来对房价宏观上的研究已非常丰富, 所以从微观层面、运用Stata软件进行房价影响因素的分析就很有必要。研究表明, 房屋所处区域的犯罪率越高, 该区域的房屋的平均价格越低;区域的空气质量越好, 房屋的价格也就越高;区域平均每套住房所拥有的房间数越多, 房价也就越高;房屋到商业中心的距离越大, 房价越低;区域学校的平均学生-教师比越大, 房价就越低。
关键词:STATA软件; 房价; 影响因素;
作者简介: 李璐琼 (1994-) , 女, 浙江杭州人, 硕士研究生, 从事财务、金融、会计研究。;
引言
吃喝住行是一个人在社会上生存的最根本的保障, 任何一个方面存在困难, 人就无法在社会上立足、生存。其中“住”就涉及到房价的问题, 房价过高, 投资炒房, 导致真正需要住房的人却无法获得住房, 而已经满足居住需求的人却为了投资增值, 占据了房产资源, 这又会导致房价的上升, 这是一个恶性的循环。房价过高, 老百姓的住房需求无法得到保障, 社会就会动荡, 因此房价问题, 是与老百姓、政府甚至整个国家都切身相关的问题, 并在很多层面上已经得到了很多人的重视, 各个学科的学者都竞相研究房价问题。
本文并不想从宏观上剖析房价问题, 一来宏观上对房价问题的研究已经非常深入, 可研究范围小, 二来笔者并非经济、金融专业, 在宏观方面的知识相对缺乏, 所以本文将主要采用微观层面的数据进行房价影响因素的探讨和证明。鉴于本文作为统计学软件课程的课程论文, 将研究及本论文汇报的重点放在STATA软件的应用上, 以期通过本文的研究, 熟练统计学软件的应用, 为今后的研究打下基础。
一、文献综述及研究假设
正如前文所提到的, 国内外各个领域的学者都对房价问题进行了不同层面、不同领域的各种研究, 但主要还是在宏观层面, 比如通货膨胀对房价的影响, 紧缩的财政政策、货币政策对房价的影响, 宽松的财政政策、货币政策对房价的影响, 住房公积金对房价的影响等等。总而言之, 绝大多数涉及房价的研究主要是探讨“看不见的手”---市场对房价的影响, “看得见的手”---政府的宏观政策对房价的影响以及政府应该如何应用宏观调控的手段去应对市场对房价的影响。
由于笔者所从事的为会计专业, 在宏观国民经济方面的只是相对缺乏, 所以, 本文重新寻找立足点, 将影响房价的因素归结到与我们老百姓生活最为相关的、最本质的、微观层面的房价的影响因素。另外, 本文作为统计软件方面课程的结课论文, 将把重点放在如何运用STATA软件剖析房价微观层面的影响因素。
本文归纳总结了所得到的数据, 找出几个认知层面与房价相关的因素:房屋所处区域的犯罪率、该区域的空气质量、房屋到商业中心的距离、该区域平均每套住房所拥有的房间数以及该区域学校的平均学生-教师比。由于本文选用的是不涉及时间的横截面数据, 所以尽量多取一些影响因素进行验证。因此, 本文提出如下五个假设:
H1:房屋所处区域的犯罪率越高, 该区域的房屋的平均价格越低。这是比较明显的一个假设, 毕竟没有人会希望在一个犯罪率极高、治安混乱的社区生活。因此, 这些区域的房价就比较低。
H2:该区域的空气质量越好, 房屋的价格也就越高。这也是显而易见的, 就像杭州之所以被评为最适合居住、养老的城市, 其很大一方面就是杭州拥有西湖、湘湖、西溪湿地等景区, 使得杭州的空气质量相对中国其他几个大城市来说是比较好的。因此, 在人们健康意识日渐增强的今天, 杭州的房价也是节节攀升。
H3:该区域平均每套住房所拥有的房间数越多, 房价也就越高。这是显而易见的, 富人们居住的别墅区的房价一般来说要比普通区域要高。所以, 房屋所拥有房间数量越多, 在一定程度上意味着房屋面积越大, 通常情况下房价也就越高。
H4:房屋到商业中心的距离越大, 房价越低。显然, 房屋距离商业中心越远, 说明房屋处在相对较为偏远的地区, 这些地区的交通相对是比较不方便的, 因此房价也会较低;另一个层面, 距离商业中心较远的房屋, 也从另一个侧面说明这些房屋的配套设施可能并不完善, 居民休闲、娱乐甚至是纯粹的生活购物可能都会有影响, 所以这些地区的房价相对就比较低。
H5:该区域学校的平均学生-教师比越大, 房价就越低。这个可以从学区房的例子中获得认知上的认同 (当然下文会用STATA软件进行数据上的证明) , 我国实行九年制义务教育, 无论是在哪个区域的小学、初中生都能够就近入学, 这本该是公平的, 也就不应该产生学区房的问题。但是, 学区房高昂的房价问题却在我国非常明显, 这其中的原因就是这些执行义务教育的小学、初中其教育质量不同, 家长为了使自己的孩子不输在起跑线上, 都希望孩子能够进入教育质量好的学校进行学习, 因此纷纷在这些学校附近购房, 也就产生了学区房价格高涨的现象, 而学校教育质量的好坏无疑受很多方面因素的影响, 在这方面教育学领域的学者也做过很多的研究。其中, 最为显着的影响因素是“小班化教育”, 一个教师所负责的学生越少, 往往教学质量越好, 这是有道理的。毕竟一个人的精力都是有限的, 有限的教师的精力分散给五六十个学生的教育质量, 肯定不如分散给十几、二十几个学生的教育质量高。所以, 一个区域平均学生-教师比越大, 说明一个教师所要负责的学生也就越多, 在很大程度上会造成教育质量的下降。因此, 这附近的房价也就会是相对较低的, 这个后面将会用STATA软件对数据进行分析, 会更有说服力。
二、数据、变量、模型的选择
首先, 在数据方面, 本文将随机选取杭州506个社区的平均房价以及相关区域的犯罪率、空气质量、到商业中心的距离、平均每套住房所拥有的房间数以及学生-教师比的数据, 进行本文的实证分析和检验。其中, 空气质量在本文中的衡量标准是以数据比较容易得到的空气中二氧化氮的含量来衡量, 二氧化氮是一种影响空气质量、造成空气污染的重要污染物, 其主要来自机动车尾气的排放、锅炉废气的排放等, 二氧化氮还是酸雨的成因之一, 因此用二氧化氮来衡量空气的质量是合理、可行的。
其次, 变量的选择, 本文将假设中提到的这五个可能影响房价的因素都作为变量归结到模型中。那么本文的因变量Y很显然就是房价 (price) , 而本文的自变量显然就是:X1为社区的犯罪率 (crime) , X2为该区域空气中二氧化氮的含量 (nox) , X3为平均每套住房所拥有的房间数 (rooms) , X4为该社区到最近的大型商业中心的距离 (dist) , X5为社区的学生-教师比 (stratio) .
最后, 本文的模型, 根据前文的假设以及变量的选择, 最终确定的模型是:
其中, 价格、距离等变量取了对数, 取对数意味着原被解释变量对解释变量的弹性, 即百分比的变化而不是数值的变化, 对数形式可以减少多重共线性, 并能在一定程度上消除量纲和异方差的影响, 而一般情况下比例类的数据是不取对数的。所以, 本文的区域犯罪率、学生-教师比并没有取对数, 而平均的房间个数, 由于结果比较明显, 也数值不大, 参照一些类似的文献, 在这里就不取对数了。最后的u是误差项, 也称为干扰项。所以, 最后得到的模型, 就如上所列示的。
三、实证结果及分析
在搜集好数据、选择好变量和模型以后, 就是将这些数据录入STATA中进行处理, 得到最后的实证结果, 以印证前文的假设。由于本文是统计学软件类课程的结课论文, 所以本文会将每一步都进行描述, 除了放上验证结果的关键性图标之外, 也会将关键步骤所执行的命令进行说明。
第一步, 在将数据从Excel导入STATA后, 执行命令“summarize”, 就能考察所有变量的统计特征, 也就是数据的描述性统计结果 (见表1) .
第二步, 由于一些变量取了对数, 所以要对新的变量进行说明, 以生成新的变量。具体的命令为“g lnprice=log (price) ”、“g lnox=log (nox) ”、“g lndist=log (dist) ”.
表1 描述性统计结果
第三步, 用最小二乘法进行回归分析, 其命令是“regress lnprice crime lnox rooms lndist stratio” (见下页表2) .
表2 回归结果
从这个结果来看, 检验整个方程显着性的F统计量之p值 (Prob>F) 为0.0000, 显示这个回归方程是高度显着的, 且每个变量的p值 (P>|t|) 均为0.000, 也可以看出这些变量都是影响房价的因素。
第四步, 用怀特检验, 检验其是否存在异方差, 命令“estat imtest, white” (见表3) .
表3 怀特检验的结果
检验结果显示, p值等于0.0000, 故强烈拒绝同方差的原假设, 认为存在异方差。所以, 为了消除异方差, 需要用加权最小二乘法进行回归。
第五步, 为了消除异方差, 用加权最小二乘法重新进行回归。命令为“predict e1, res”, “g e2=e1^2”, “g lne2=log (e2) ”, “reg lne2 crime lnox rooms lndist stratio”, “predict lne2f”, “g e2f=exp (lne2f) ”, “reg lnprice crime lnox rooms lndist stratio[aw=1/e2f]”, 最终得到如下结果 (见表4) .
表4 加权最小二乘法的结果
从加权最小二乘法的结果来看, 检验整个方程显着性的F统计量之p值 (Prob>F) 仍为0.0000, 显示这个回归方程是高度显着的, 且每个变量的p值 (P>|t|) 均仍为0.000, 也可以看出这些变量都是影响房价的因素。并且, 从变量的系数 (Coef.) 来看, crime系数为负, 说明区域的犯罪率与房价呈负相关, 也就证实了H1假设, 房屋所处区域的犯罪率越高, 该区域的房屋的平均价格越低;lnox的系数也为负, 说明区域的空气质量与房价也为负相关, 证实了假设H2, 区域的空气质量越好, 房屋的价格也就越高;rooms的系数为正, 说明房屋所拥有的平均房间的数量与房价呈正相关, 证实了H3假设, 区域平均每套住房所拥有的房间数越多, 房价也就越高;Lndist的系数为负, 说明该社区的房屋到商业中心的距离与房价呈反相关, 也证实了假设H4, 房屋到商业中心的距离越大, 房价越低;stratio的系数为负, 说明该区域学校学生-教师比与房价成反相关, 证实了假设H5, 区域学校的平均学生-教师比越大, 房价就越低。至此, 通过STATA软件, 用加权最小二乘法得到的结果使得五个假设都得到了应证。
结语
本文通过选择最基础、最微观的五个指标 (房屋所处区域的犯罪率、该区域的空气质量、房屋到商业中心的距离、该区域平均每套住房所拥有的房间数以及该区域学校的平均学生-教师比) 来说明房价的影响因素, 并用STATA软件证实了这五个影响因素与房价的紧密关系, 最终证明了关于这五个影响因素的假设:房屋所处区域的犯罪率越高, 该区域的房屋的平均价格越低;区域的空气质量越好, 房屋的价格也就越高;区域平均每套住房所拥有的房间数越多, 房价也就越高;房屋到商业中心的距离越大, 房价越低;区域学校的平均学生-教师比越大, 房价就越低。
参考文献
[1]伍德里奇.计量经济学导论:第4版[M].北京:中国人民大学出版社, 2010.
[2]陈强.高级计量经济学及Stata应用:第2版[M].北京:高等教育出版社, 2014.
[3]赵进文, 高辉.资产价格波动对中国货币政策的影响[J].中国社会科学, 2009, (2) :95.
[4]董沾健, 赵耐青, 林燧恒.REML法和Bayesian法对小样本不平衡单因素随机效应模型方差成分估计的模拟比较分析[J].中国卫生统计, 2009, (1) :35-37.
[5]白仲林.面板数据模型的设定、统计检验和新进展[J].统计与信息论坛, 2010, (10) :3-12.
[6]叶小青.非线性交互效应面板数据模型的估计[J].统计研究, 2014, (2) :96-101.