三、模型、数据与变量
( 一) 模型构建
以农户参与小型农田水利建设投资,这一类典型的村庄集体行动为例,可将农户参与村庄集体行动的决策行为分为两个过程: 第一个过程是农户选择参与或不参与村庄集体行动,即参与村庄集体行动的意愿; 第二个过程是选择参与的农户进一步决定投入多少资金,即参与村庄集体行动的程度。可见,只有在观测到农户选择参与村庄集体行动时,才能进一步观测到这部分农户参与村庄集体行动的投资金额,因此,样本选择偏误问题在本文研究中是存在的。
基于本文的样本选择机制,依据Heckman[32]和Greene[33]的研究,以y1i代表农户参与村庄集体行动的程度,以y2i代表农户参与村庄集体行动的意愿,以X1i代表包括关系网络变量以及个人特征、家庭特征与村庄特征等一系列自变量,以Z2i代表包括X1i和识别变量在内的一系列自变量,进而构建如下模型:
式(1) 代表决策程度方程,式(2) 代表决策意愿方程,其决策机制为,当且仅当y2i= 1( 样 本农户i选择参与村庄集体行动) 时,y1i才能被观测到。式(1) 与式(2) 中,y*1i、y*2i是两个潜变量,yi1、y2i是两个可以观测的因变量,X'1i、Z'2i是两组自变量向量,α、β是两组对应的待估参数,μ1i、μ2i代表残差项,服从均值都为0,方差分别为σ和1,相关系数为ρ的二元正态分布。基于式(1) 和式(2) ,可建立对数似然函数如下:
式(3) 中,ln L表示似然函数的对数值,Φ(·) 和?(·) 分别表示标准正态分布的累积分布函数和概率密度函数,其他符号含义同前所述。根据式(3) ,利用极大似然估计法,可求得本文实证研究所需的相关参数。
( 二) 数据说明
本文研究数据源自项目组成员2014年7-8月,利用分层抽样与简单随机抽样相结合的抽样方式,对宁夏、陕西、河南3个省份9个县( 区)180个村庄1456户农户进行的实地调研访谈,在删除无效样本后,最后得到180个村庄的1440份农户有效问卷。宁夏地处黄河灌区的上游,而陕西和河南则地处黄河灌区的中下游,3个省份在农田水利条件、农村社会资本存量和经济发展水平等方面都有较大差异,样本调研地区选择具有一定的代表性。此次调查问卷主要内容包括: 样本农户家庭及其所在村庄的基本信息、当前小型农田水利投资与建设状况、样本农户家庭及其所在村庄的社会资本以及基本的农业生产经营状况等四个方面。
( 三) 变量选择
本文被解释变量①有两个,即农户参与村庄集体行动的意愿与农户参与村庄集体行动的程度,前者是二元虚拟变量,后者是连续型变量。对核心自变量关系网络的测度,本文依据Knight和Yueh[36]的研究结论,采用 样本农 户 家 庭拥有 的亲 友 数 来 表 征,进 而 根 据Granovetter[28]和Liu[37]的研究,采用样本农户家庭拥有的亲戚数来表征强连接网络,而采用样本农户家庭拥有的朋友数来表征弱连接网络。对于控制变量的选择,本文选取以下三类: 第一,农户个体特征变量,即受访农户的实际年龄、受教育程度、务农状况、健康情况。第二,农户家庭特征变量,即农户家庭可灌溉耕地占比、收入水平、地块数、劳动力状况。第三,村庄特征变量,即村组数、土地调整、贫困村、资金使用。对于识别变量②的选择,依据已有文献[6,20],本文选取是否自有小型农田水利这一变量。现有文献[38]认定,第一阶段决策意愿方程的识别变量与第二阶段决策程度方程的因变量之间是否存在相关性,是“程度”问题,而非“有无”问题,这是选取识别变量的依据。从理论及数理上来看,本文识别变量对农户参与意愿确有较强的直接影响,而对农户参与程度也确有一定影响,但这一影响可能更多的是间接影响③,因此,本文识别变量是恰当的。本文研究所用主要变量的具体含义及基本分布情况见表1.
由表1可知,70%的样本农户没有选择参与村庄集体行动,而在选择参与村庄集体行动的样本农户中,农户参与村庄集体行动程度的均值为964.02元,这说明,大多数样本农户参与村庄集体行动的积极性不高,但样本农户参与村庄集体行动的程度处于一个较高水平。样本农户整体关系网络水平较高,但弱连接网络水平相比强连接网络水平低一些,这表明样本区域的农村社会资本存量仍然很大。样本农户年龄大多数处于51岁以上,受教育程度较低,但健康情况良好,且绝大多数样本农户从事农业生产。样本农户家庭可灌溉耕地比例较高,年总收入均值为44800元左右,地块数平均在5块左右,家庭劳动力较为充裕,表明样本农户从事农业生产的专业化程度较高。样本农户所在村庄村组数多在8个以上,大多数村庄没有进行过土地调整,且大多数村庄属于非贫困村,其小型农田水利供给资金使用情况也较为透明,这说明,样本村庄生产经营及农田水利条件相对较好。目前,大多数样本农户没有小型农田水利,这直接影响着农户参与小型农田水利建设投资这一村庄集体行动的意愿。
( 四) 样本描述
1 .村庄基本情况。由表2可知,样本村庄有大约74 %属于非贫困村 ,样本村庄间经济发展水平有一定的差异,有利于探究农户参与村庄集体行动的异质性。样本村庄到县城的距离大多数在8 ~ 16公里这个区间段,表明样本村庄受市场化的冲击可能较高,这可能制约农户从事农业生产的积极性。超过一半的样本村庄的耕地面积集中于2000 ~ 6000亩这一区间段,而样本村庄的村组数也大多处于7 ~ 14个,这说明,样本村庄大多数属于中等规模的村庄,其生产经营条件及人口密集程度较好。
2 .农户基本情况。表2显示出,样本农户以男性居多 ,大约占样本量的57 %,年龄分布多集中于40 ~ 60岁这个年龄阶段,且受教育水平以小学及以下居多,大约占到样本量的44%,这说明现阶段,从事农业生产的农户年龄偏高,农村人力资本存量偏低。农户家庭耕地的地块数多在5块以下,大约占到样本量的57%,表明样本农户家庭耕地细碎化程度不高,这影响着农户参与村庄集体行动的决策行为。