- 相關推薦
農村貧困人口的聚類與減貧對策分析
作者:王瑜汪三貴
中國農業大學學報:社會科學版 2015年08期
2011年,《中國農村扶貧開發綱要(2011-2020年)》的頒發,標志著我國有計劃的扶貧開發進入了新的階段,其中,“提高扶貧標準,加大投入力度,把連片特困地區作為主戰場,把穩定解決扶貧對象溫飽、盡快實現脫貧致富作為首要任務”表明了新階段十年扶貧工作的重點和戰略核心。連片特困地區①、特殊類型貧困地區②無疑成為了我國扶貧攻堅的主戰場,因此,認識各連片特困地區和特殊類型貧困地區的基本貧困特征和內部貧困結構則是有效實施扶貧開發政策的基礎。
盡管貧困地區的貧困人口人群特點各有不同,但貧困人群內部仍然具有一些類似的貧困特征:一些人口因資源稟賦的欠缺和區位因素的制約而陷于貧困,例如人均耕地不足、居住在偏遠山區;另一些人口可能是由于文化和社會環境的制約而無法擺脫貧困,比如少數民族地區特殊的生計模式、語言和文化的制約使得他們在市場經濟中受益相當有限;還有一些人口可能是由于他們家庭人口特征的制約,比如缺乏勞動力或有無法工作的成員、人力資本水平比較低、缺乏工作的技能等。
傳統的基于一維的貧困地區分類方式在實踐和應用中顯得力不從心,因此需要一種能夠反映貧困地區內在的多種特性的細分和聚類方法,來綜合反映不同貧困地區多方面的特征,這便需要運用可解決多變量的、大數據量的細分的數據挖掘技術。鑒于K-Means[1]聚類算法在處理大數據量和多變量數據分析方面有相對優勢,本文將采取K-means聚類方法對我國特殊類型貧困地區貧困人口進行進一步分類,或可彌補傳統地域劃分(貧困縣與非貧困縣、東中西部劃分等)的缺陷,從而有利于找出各個區域中限制發展與致貧的關鍵制約因素,并可以進一步深入分析這些因素相互作用的方式和路徑,研究緩解這些制約因素的可能方式和先后順序。在政策的規劃和實施上,同一類地區的政策可以相互地借鑒。對農村貧困人口進行分類,可以研究形成中國農村不同類型貧困人口的深層次原因。具體來說,貧困人口可以按照不同的特點分成不同的類型,并據此識別不同地區中貧困人口類型的構成。常規的貧困分析通常在貧困與非貧困人口之間進行比較,而把貧困人口劃分為不同類別,則可以為不同地區制定具有針對性的扶貧政策提供基本依據。
二、數據和方法
(一)數據來源
本文使用的數據來源于國家統計局2006年和2010年的農村貧困監測調查。該調查的地域范圍是分布于中西部21個省(自治區、直轄市)的592個國家扶貧開發工作重點縣(簡稱扶貧重點縣)。涉及調查的省(自治區、直轄市)有:河北、山西、內蒙古、吉林、黑龍江、安徽、江西、河南、湖北、湖南、廣西、海南、重慶、四川、貴州、云南、陜西、甘肅、青海、寧夏和新疆。調查對象為全國592個扶貧重點縣中的5000多個行政村,以及5萬多個農村常住戶③。數據包括農村貧困監測調查縣級統計數據、社區調查數據、住戶基本情況調查數據和個人調查數據。這里主要使用其中的住戶基本情況調查數據和個人調查數據。調查抽樣方式是自加權隨機抽樣,在全部592個重點縣,以縣為總體,與人口規模成比例的兩階段抽樣,先抽村再抽戶。
(二)貧困標準的選擇
本文的分析同時使用了兩個標準的貧困線。第一種是原有的低收入標準,即官方公布的根據歷年物價指數調整的低收入標準,2006年為958元,2010年為1274元,為了行文便利,簡稱舊貧困線;第二種是2011年《中國農村扶貧開發綱要(2011-2020年)》中提出的將農民人均純收入2300元(2010年不變價)作為新的國家扶貧標準,由于本文涉及該標準在2006年的應用分析,所以還需將此標準倒推至2006年;而由于2009年的農村CPI指數雖比上年下降(是上年的99.7%),但所公布的當年舊貧困線仍然定為與2008年保持不變(1196元),因此,為了保持兩個標準在前后分析和比較中的一致性,本文對新標準的倒推是根據舊貧困線的歷年變化指數倒推而非直接用農村CPI指數倒推。根據此原則,新標準的貧困線在2006年為1729元。
(三)數據分析方法
數據分析技術可以廣義分為兩種類型[3]:①探索性和描述性的,即研究者沒有預定義的模型或者假設,但想要推斷高維數據的總體特征或者結構;②驗證性和推論性的,即研究者想要使用可用數據來驗證一個或一組假設(模型)的有效性。數據聚類主要屬于第一種數據分析技術,即探索性和描述性的分析技術,而作為一種探索性分析工具,聚類分析結果有助于進一步提出可驗證的假設和模型。聚類分析是數據挖掘中的一個重要研究領域,是一種數據劃分或分組處理的重要手段和方法。聚類是無監督的分類,也就是它沒有先驗知識可用,其聚類技術有很多類,目前聚類算法大體上分為基于劃分的方法、基于層次的方法、基于密度的方法、基于網格的方法、基于模型的方法等[5-6]。聚類算法不僅可以作為發現數據庫中數據分布的深層次信息的工具,還可以作為數據挖掘中的一個預處理步驟。
K-means算法[1]就是基于劃分的聚類算法中的一個典型算法,劃分式聚類算法還包括K-modes算法[7-10]、K-means-CP算法[11]、FCM算法[12]、基于圖論的聚類算法[5]等。而K-means算法與K-means-CP算法使用不同數值型數據集進行的比較實驗結果表明,K-means-CP算法絲毫也不優于K-means算法[13]。數據聚類在諸多領域具有長久的歷史,K-means聚類方法可以說是其中最流行最簡單的算法之一,它于1955年被首次提出,盡管在此之后有幾千種其他聚類算法被提出,但是K-means仍然被廣泛使用[6]。
1967年,MacQueen所提出的K-means算法,其聚類目標就是根據輸入參數k把數據對象分為k個簇,屬于動態聚類算法,也稱為逐步聚類法,不斷迭代調整中心直到完成。其基本思想和步驟[6,14]是:(1)首先輸入初始數據集并指定劃分的簇的個數k;(2)任意選擇k個數據對象點作為初始聚類中心;(3)根據簇中對象的平均值將數據對象賦給最類似的簇;(4)更新簇的平均值;(5)計算聚類準則函數E;(6)重復步驟(3)~(5)直到準則函數E值不再變化;(7)輸出滿足平方誤差準則函數收斂的k個簇。關于K-means算法的具體步驟和算法展示可以參見Hartigan[15-16]的論述。
K-Means算法的一個最大的優點就是操作簡單、采用誤差平方和的準則函數、對大數據集的處理上有較高的可伸縮性和高效性。本文選擇K-means算法作為聚類方法,主要是基于該算法的操作簡便性、應用廣泛性以及聚類結果比較穩健的特點。此外,本文選擇用截面數據做聚類分析,而不是面板數據的聚類分析,主要是由于截面數據的聚類分析技術成熟并被廣泛使用,而面板數據的聚類分析在文獻方面比較缺乏,在技術上更沒有形成比較一致的業內認同④。
指定表示聚類個數的K值,是該算法的一個重要步驟,也是可能存在挑戰的方面,因為我們很難事先確定合適的K值。但仍然有一些方法幫助我們找到合適的K值,一方面,從先驗知識、理論常識和實踐經驗的角度,我們預設的K值一般是在一定可選范圍內的,比如,從研究和實踐的角度,我們愿意將人群分為幾類,而不是幾十類,我們會提出一些重要的聚類所用的變量,并且希望聚類的結果是這些特征的一些組合,因此聚類分析時一般也不會選擇大于變量數的K值;而另一方面,從統計的角度講,可以按照一些統計標準對不同K值產生的聚類結果進行選擇,例如,根據Calinski和Harabasz提出的基于方差比的尋找最理想聚類數的指標[17],通過每一個K-means聚類結果的Calinski-Harabasz指數的比較來選取出最理想⑤的統計區分來體現這些類別。
三、農村貧困人口的聚類
聚類分析方法非常適用于分析那些自然形成的群體,例如自然形成的貧困家庭。對貧困群體進行聚類分析可以更清楚地了解貧困形成的原因和貧困的分布。貧困家庭被分為不同的類別,每一個類別內部的家庭都有著相似的特點。
(一)貧困人口家庭特征分類
根據調查數據的基本特性、調查人口的實際特征,并結合對世行研究報告[18]中的參考,本文將貧困家庭⑥的特征分為4大類11種。表2描述了這些類型特征的具體定義。山區和遠離縣城從地理區位和公共資源的可獲得性兩方面描述了貧困家庭的劣勢。土地是農村家庭重要的經濟資源,勞動力的教育和家庭成員的健康是農村家庭重要的人力資本。位于少數民族地區、邊境地區、革命老區的家庭可能面臨更差的自然環境和社會政治環境,由此致貧。高撫養比意味著家庭中老人和兒童的數量較多,老人和兒童基本沒有生產能力,并且老人容易罹患疾病,兒童需要教育投資,這會導致家庭的貧困。如果缺失經濟資源和人力資本,農村家庭就很容易陷入貧困。外出務工和鄉鎮企業就業是農村中最主要的兩種非農就業,非農就業是提高農民收入的重要途徑。
表3是2006年和2010年不同貧困特征在農村人口和相應貧困標準下貧困人口中所占的比例。可以發現,相對于農村地區整體而言,農村貧困人口居住于山區的比例更高,居住地遠離縣城的比例更高,土地更加有限;更有可能居住在少數民族地區、邊境地區;家庭的撫養比更高,更低的勞動教育水平以及更高的有不健康成員的比例;打工或在鄉鎮企業工作的機會更少。
除了革命老區和2010年的少數民族地區特征外,幾乎所有其他特征中,貧困人口都具有比農村人口總體更高比例的貧困特征。舉例來說,2006年,63.3%的農村人口居住在山區,68.1%居住地離縣城15公里以上,45.6%人口所擁有的土地面積是所有人口土地面積平均水平的二分之一以下,43%的農村人口生活在少數民族地區,7.5%的人口生活在邊境地區,18%的人口生活在革命老區,33.2%的農村人口生活在撫養比超過0.4的家庭中,79.1%的農村人口生活在平均受教育水平低于總體平均二分之一水平以下的家庭中,10.5%的農村人口生活在有殘疾、重病和慢性病成員的家庭中,58.5%的農村人口生活在沒有外出打工人員的家庭中,97.8%的農村人口生活在無鄉鎮企業就職成員的家庭中,而除了革命老區這個特征之外,2006年無論哪種貧困標準下的貧困人口都具有更高的特征比例。
在貧困特征中,無論對貧困地區總體而言,還是對貧困地區的貧困人口而言,有幾項貧困特征比例很高,其中在人口中占比超過40%的特征有山區、遠離縣城、土地有限、少數民族地區、低勞動教育水平、無打工人員、無鄉企人員。這些特征方面,對于扶貧開發政策制定以及貧困人口自身的脫貧來說,都可能是巨大的挑戰。
在貧困人口中,那些更貧困的人口往往具有更高比例的貧困特征。以2006年為例,除了山區和革命老區這兩種特征之外,其他各種貧困特征中,958元貧困標準下的貧困人口的特征比例,比1729元貧困標準下貧困人口中的特征比例都要高,這意味著,更貧困的人口具有更加突出的貧困特征。比如,2006年,66.1%的新標準貧困線下的貧困人口生活在沒有外出打工成員的家庭中,而在舊標準貧困線以下的貧困人口中這個比例是73.4%。
在貧困人口與貧困地區人口總體的貧困特征差異方面,貧困人口在低勞動教育水平、無打工人員這兩個特征方面差別尤其突出,并且有差別擴大的趨勢。2006年,在貧困地區人口總體中,低勞動教育水平的比例為79.1%,舊貧困標準和新貧困標準的貧困人口中這個特征占的比例分別為84.5%和83.1%,2010年,在貧困地區總體人口中,低勞動教育水平的比例降低為74.2%,而在舊貧困標準和新貧困標準的貧困人口中這個特征占的比例分別為81.0%和79.2%,盡管這種貧困特征的總體比例在下降,但是貧困人口這一特征的比例下降得更慢。作為貧困地區家庭脫貧重要渠道的外出務工,可能也因務工比例的減少而降低了貧困家庭的減貧與脫貧的機會。
比較2010年與2006年的特征分類比例可以發現,貧困人口的特征占有比例沒有太大變化,這說明這些貧困人口的貧困特征是相對穩定的;但另一方面,也有一些特征的比例在趨勢上有所變動,比如山區、遠離縣城、少數民族地區、革命老區這幾個特征,2010年在貧困人口中的特征比例都要比總體農村人口中的特征比例低,并且比2006年有所下降,而這些類型往往是相互關聯的,比如少數民族地區和革命老區往往也是山區和遠離縣城的地區,這有可能與該期間內政府對老少邊區特殊類型貧困地區更多的關注和扶貧政策傾斜有關。
(二)農村貧困人口聚類
上述貧困特征是我們對農村貧困人口進行聚類的依據。聚類是一種無監督的分類,即事先并不能先驗性地知道分為幾類(簇)以及哪些類(簇),而在K-means算法中,需要預先設定類別數K,然后由K-means將數據對象劃分為K類。我們沒有先驗的知識,但是卻可以根據已有的貧困特征以及實際意義賦予幾個不同的K值,分別進行聚類。根據表格描述的貧困狀況以及聚類的實際操作需要,太少類的劃分可能針對性不足,而太多太細的聚類則沒有太大區分度。從可操作性和實踐需要的角度,首先將貧困人口分為典型的5個、7個和10個類別,然后根據Calinski-Harabasz指數[17]對每一個K-means聚類分析的比較選取出統計上最理想的類別數。
由于不同年份的聚類結果會形成不可比較的類,所以這里選擇用較新的數據(2010年)呈現聚類結果,并且選擇人均純收入2300元⑧(2010年不變價)作為貧困標準。將2010年的數據對象按照2300元的貧困標準對人均純收入在該標準以下的貧困人口進行聚類,其中5個類型分類的結果最理想。
首先,對于所有類型來說存在共同的特征,也就是,對所有貧困類型的家庭而言,勞動力的受教育水平較低,家庭中沒有外出務工人員或沒有鄉鎮企業工人,這些是比例較高的共同特征。也就是這些貧困特征幾乎是貧困家庭共同面對的限制性特征,但是導致這些特征的深層次的原因需要進一步分析。
第二,除了這些共同特征之外,不同類型存在兩兩之間有重要差異的屬性。類型1與類型3都有突出的少數民族地區特征,但是類型1位于山區、土地有限,類型3位于非山區、土地資源約束相對小,我們不妨將類型1稱為“山區少數民族”類,類型3為“非山區少數民族地區”類;而類型2的典型特征是位于革命老區,伴有位于山區和土地資源有限的特征,不妨將它簡稱為“革命老區”類;類型4的突出特征是土地資源有限,不妨簡稱為“有限土地”類;而類型5的突出特征是位于山區,不妨簡稱為“山區”類。從表中可以看到,這5個類型的貧困家庭一方面具有突出特征,另一方面又具有交叉性的共同點。比如,類型1和類型2同時伴有類型4和類型5的特征,這表明少數民族地區和革命老區往往也是位于山區因而土地資源也相當有限的地區,但是類型3則表明那些不位于山區、土地資源受限較少的少數民族地區家庭也是比例較高的貧困群體。
第三,從整體分類來看,5種類型的貧困人口中,類型1、2、3的貧困家庭比例較高,占了總貧困家庭比例的75%以上,尤其是“山區少數民族”類和“非山區少數民族”類共占了總貧困家庭的將近60%。因此少數民族地區的貧困人口在農村貧困人口占了絕大多數,更值得關注,也需要在扶貧資源分配中重點考慮這些地區存在的特有的深層次限制條件,使得扶貧政策在這些地區符合少數民族地區人們的文化習俗、生計策略。
(三)特殊類型貧困地區的特征結構
表5呈現了2006年與2010年少數民族地區、革命老區和邊境縣地區這三類地區的人口特征分布情況,可以清晰地看到老少邊區貧困特征具有高度地相似性,以及幾種明顯的差別。首先,老少邊區貧困特征的高度相似性在于除了地區類型本身之外,其他特征的占有比例在地區類別之間是相近的,也就是他們具有類似的劣勢;第二,老少邊區存在重疊,主要是少數民族地區和革命老區的重疊、少數民族地區和邊境縣地區的重疊⑨,比如以2010年為例,革命老區的被抽樣調查人口有21.5%也是生活在少數民族地區的,邊境地區的被抽樣調查人口則有85.0%也是生活在少數民族地區,而這種地區特征的重疊不僅解釋了三類貧困地區貧困特征的相似性,也會顯示他們的差異和對聚類結果的影響;第三,與革命老區相比,少數民族地區和邊境地區家庭中沒有打工人員的比例更高,尤其是2010年,差異更加明顯,邊境地區和少數民族地區的高度重疊性可能表明了對于少數民族地區的家庭而言,語言、文化、生計策略和習俗的差異等會限制他們外出打工的意愿和機會。
在2010年的貧困地區貧困人口聚類結果的基礎上,給出了少數民族地區、革命老區、邊境縣地區三類特殊類型貧困地區對應的貧困人口聚類結構。可以看出,由于地區類型的重疊,老少邊三類地區的聚類結構的特征更加突出。
在少數民族地區,1類和3類貧困類別(“山區少數民族地區”類和“非山區少數民族地區”類)貧困人口共占了少數民族地區貧困人口的81.0%;在革命老區,2類(“革命老區”類)貧困人口占了少數民族地區貧困人口的85.4%;在邊境縣地區1類和3類貧困類別(“山區少數民族地區”類和“非山區少數民族地區”類)貧困人口共占了少數民族地區貧困人口的84.3%。尤其是,在少數民族地區和邊境縣地區,“山區少數民族地區”類貧困人口都占了對應所在地區貧困人口的60%左右,并且往往與有限的土地、低教育水平聯系在一起。
(四)不同類型貧困人口的區域分布
考慮到國內扶貧過程中往往根據地域來劃分扶貧范圍,而扶貧政策的開展總是需要落實到地方,所以按照區域劃分來呈現區域內不同類型貧困人口的結構,可以使扶貧政策在宏觀設計時便更具有區域針對性。表7是不同類型農村貧困人口在不同區域的絕對分布比重,圖1展示了不同區域內農村貧困人口不同類型的結構。兩圖共同表明了在不同區域不同類型貧困人口的量以及區域內的貧困類型結構特征。
首先,從表7可以看出,華北、西南和西北地區的貧困人口數量各占總量20%以上,三個地區的貧困人口總計占農村貧困人口的70%以上。這表明了從受益面來看,緩解貧困、減少貧困人口的主戰場是這些地區。在區域間的扶貧資源分配可能需要考慮貧困人口比重的分布。
第二,從圖1可以看出,不同區域農村貧困人口類型的結構具有明顯差別。從區域內貧困人口貧困類型的結構看,華北地區以革命老區、非山區的少數民族、山區這幾類貧困類型為主,東北地區以革命老區、山區為主,華東地區以山區少數民族、革命老區和山區為主,中南地區以山區少數民族、革命老區類為主,西南地區以少數民族類型包括山區的少數民族和非山區的少數民族為主,西北地區則5種貧困類型比較均勻。但在所有地區內部,少數民族類型的貧困人口都占有相對高的比重。以上這些貧困結構顯示了在不同區域之內,哪些是更為主要的貧困類型。
(五)連片特困地區的貧困人口類型與分布
《中國農村扶貧開發綱要(2011-2020年)》明確了扶貧攻堅的主戰場,將六盤山區、秦巴山區、武陵山區、烏蒙山區、滇桂黔石漠化區、滇西邊境山區、大興安嶺南麓山區、燕山-太行山區、呂梁山區、大別山區、羅霄山區等區域的連片特困地區和已經明確實施特殊政策的西藏、四川藏區、新疆南疆三地州確立為扶貧攻堅主戰場。除了西藏、四川藏區、新疆南疆三地州之外,11個連片特困地區都在農村貧困監測調查范圍之內。在已有聚類分析的基礎上,對各連片特困地區的貧困人口進行貧困類型識別有助于了解連片特困地區的主要限制特征,為連片特困地區的扶貧開發提供一定參考依據。
表8呈現的是2010年連片特困地區的基本貧困概況。根據2010年貧困監測的樣本數據結果可以發現,根據兩種貧困標準,從貧困發生比率看,大興安嶺南麓山區、呂梁山區、燕山-太行山區的貧困發生率高出總樣本平均水平許多;從貧困人口總量來看,燕山-太行山區、秦巴山區、六盤山區、滇黔桂石漠化區、滇西邊境山區、武陵山區的貧困人口數量較大。尤其是燕山-太行山區,貧困發生比率和貧困人口數量都在11個片區位于前列。
根據前文表4的總體聚類結果,將11個連片特困地區中5個貧困類型的結構比例列出在表9中。從表9中可以看出,11個連片特困地區有各自不同的主要貧困類型,滇黔桂石漠化區、滇西邊境山區、烏蒙山區以“山區少數民族”類型的貧困為主導,大別山區、羅霄山區、武陵山區以“革命老區”類型的貧困為主導,大興安嶺南麓山區則以“非山區少數民族”類型的貧困為主導,六盤山區、呂梁山區以“山區”型貧困類型為主導,而秦巴山區、燕山-太行山區沒有一個絕對主導的貧困類型,屬于多種貧困類型區域。
由此可見,作為新綱要中確定的扶貧攻堅主戰場的11個連片特困地區,其主要的貧困類型各不相同,當然,這里的基礎聚類指標中沒有考慮特殊的自然環境因素,在片區扶貧開發過程中,實際上還需要將貧困類型與當地特殊的自然環境因素結合考慮。
四、基本結論與建議
首先,貧困類型的分布,既呈現了扶貧對象在區域間分布的不平衡性,也表明了區域內部扶貧需要提高針對性。各種貧困類型的不同特點和區域分布上的差異從一個視角揭示了收入差距特別是貧困程度差異化的來源。除了受教育水平低、沒有鄉鎮企業務工機會和家庭缺乏外出打工成員這些共同特征之外,不同的區域內不同類型的貧困類型組合結構,意味著各個地區貧困形成的深層次原因可能各不相同。因此,扶貧政策可能需要針對不同地區的貧困類型組合對不同地區的貧困人口所面臨的共同障礙和特殊劣勢做出合理的調整。
第二,少數民族地區的貧困特征突出,尤其以西南、西北、華北為多數。老少邊區特殊類型貧困地區中,尤其以少數民族地區以及少數民族和革命老區或者邊境地區的重疊地區的貧困人口比重大。少數民族地區的貧困特征方面,除了一些共性,還表現在外出務工比例低和受教育水平低。從目前的扶貧實踐體系來看,主流的一些扶貧政策,例如異地扶貧搬遷、整村推進、以工代賑、就業促進等方式未必能在少數民族地區奏效,尚需對少數民族地區貧困的形成機制和脫貧方式開展更加深入的研究,以便提出針對少數民族地區的因地制宜的扶貧開發措施。
第三,對于一些貧困人群共有的脫貧障礙,比如教育水平低下、外出務工成員少、沒有鄉鎮企業工作的機會,即使他們在特征表現上相同,但是這些特征本身的形成也具有不相同的原因。而另一些障礙也與相應的區域環境有密切的相關,比如少數民族人口比較多的區域,受教育水平和外出務工的比例都更低,山區的人口因為離市場遠、土地更加有限(以及可能更惡劣的生存環境)而更容易陷入貧困。家庭人口特征和地區的環境因素可能同時對貧困的發生造成影響。結合地區特征來實施提高農村貧困人口素質和能力的措施可能更加有效。
第四,貧困類型在區域內分布的不同結構,為不同區域的扶貧政策制定和資源分配提供了參考。比如華北地區的貧困人口以革命老區(34.8%)和山區(21.1%)、非山區的少數民族(24.3%)為主,其中,革命老區和山區這兩類都具有山區地域的限制特征且外出務工的比例又低,對于這些地域的貧困人口,不僅需要提高土地的產出水平,更需要提高當地貧困人群的生計能力,通過提高農業生產技術、外出務工能力來提高他們的就業能力,而對于該地區的非山區的少數民族貧困人口,或許提高外出務工能力并不是合適的政策措施,而主要應當根據他們的生計策略和文化習俗,提高特色經濟的發展能力,比如發展鄉土教育、特產經濟、文化旅游等。
第五,11個連片特困地區的主導貧困類型各不相同,而貧困類型之間又有一些相同特征,這意味著片區扶貧開發需要具有片區針對性的扶貧政策,并需要結合當地特殊的自然環境因素綜合考慮,同時,主導貧困類型相同的片區之間的扶貧開發策略似乎在一定程度上可以互相借鑒。
總而言之,盡管聚類分析只是一種探索性分析,但是農村貧困人口的聚類仍然為我們定義各種貧困的類型以及它們在不同區域間、特定區域劃分、片區間的分布結構提供了非常有價值的信息。同時,這種探索性分析也將為進一步的統計推斷分析提供基礎。
①以六盤山區、秦巴山區、武陵山區、烏蒙山區、滇桂黔石漠化區、滇西邊境山區、大興安嶺南麓山區、燕山-太行山區、呂梁山區、大別山區、羅霄山區等區域的連片特困地區和已明確實施特殊政策的西藏、四省藏區、新疆南疆三地州14片集中連片貧困地區,是我國農村貧困人口集中分布的地區。
②所謂特殊類型貧困地區,是指老少邊貧困地區,多位于經濟發展落后的中西部山區和丘陵地區。其中,老區是指在第二次國內革命戰爭和解放戰爭時期,在中國共產黨領導下創立的革命根據地,它們所在的縣即為老區縣;少數民族地區主要指民族自治地方155個(其中自治區5個,自治州30個,自治縣(旗)120個),中國半數以上貧困人口在少數民族地區;邊區是指沿陸地國境線的縣級行政區劃單位(新疆建設兵團56個邊境團場未在統計范圍內),共有陸地邊境縣共計134個。
③在住戶調查表中,農村常住戶是指在農村范圍內居住或即將居住半年以上的家庭戶。戶口不在本地而在本地居住或即將居住半年及以上的住戶也包括在本地農村常住戶范圍內;有本地戶口,但舉家外出謀生半年以上的住戶,無論是否保留承包耕地都不包括在本地農村住戶范圍內。
④國內的面板數據聚類分析方法研究可以參看朱建平、陳民懇提出了針對單指標面板數據的聚類方法[2],李因果、何曉群在重構面板數據相似性測度的距離函數和Ward聚類算法的基礎上提出的面板數據聚類方法[4],但是這些方法尚待業內討論,也沒有公開的分析程序包可供調用。
⑤F值越大,結果越理想。
⑥這里的貧困家庭是按照收入貧困線確定的貧困家庭,在分析時會指出對應的貧困線標準。
⑦這些特征都是0-1變量,1表示符合這一特征,0表示不符合這一特征。
⑧由于新貧困標準下的貧困農戶都應被視為扶貧對象,所以選用新的貧困線進行聚類更具有現實意義。
⑨革命老區和邊境地區是沒有重疊的。
作者介紹:王瑜,中國人民大學農業與農村發展學院博士研究生,中國人民大學反貧困問題研究中心助研 北京 100872;汪三貴,中國人民大學農業與農村發展學院教授、博士生導師,中國人民大學反貧困問題研究中心主任 北京 100872
【農村貧困人口的聚類與減貧對策分析】相關文章:
譜聚類的擾動分析04-28
共詞矩陣在聚類結果分析中的作用04-29
農村弱勢群體的心理狀態分析及對策04-27
農村工業污染成因及對策分析04-26
聚類準則研究04-28
現階段我國農村主要矛盾分析及對策05-01
農村地區居民環境意識現狀分析及對策05-02
我國農村生態環境問題原因分析及對策04-28
蚌埠市農業污染態勢分析與減排對策研究04-28
藥物設計構效關系研究的聚類-判別分析方法04-29