- 相關推薦
社會科學研究中統計學方法應用的問題研究論文
社會科學的實證研究在應用統計學時,統計分析是其關鍵環節,資料性質分析、資料類型的判斷、統計方法的選擇等各個環節都應把握好,否則,其分析結果將是沒有意義的。本文擬通過對社會科學實證研究論文中應用統計分析方法出現的問題,從描述性分析、定量資料的統計分析、定性資料的統計分析、相關與回歸分析等方面進行解析。
一、描述性分析問題
在社會科學實證研究中,一般首先要對社會調查數據進行描述性統計分析,以發現其內在的規律性,再選擇進一步的分析方法。描述性統計分析要對調查總體所有變量的有關數據做統計性描述,主要包括數據的頻數分析、集中趨勢分析、離散程度分析、分布形態以及一些基本的統計圖形。
描述性統計分析雖然較為簡單,但如果對某個事件或某種現象的描述不清楚或存在偏差,那么其后的所有分析都將值得懷疑,而描述的偏差可能會引起公眾或學術界對某些社會現象的誤解,甚至誤導政府決策。
1.均值的誤用
均值是用于描述樣本集中趨勢的最常用指標,但應注意,對于正態或近似正態的對稱分布樣本,它是較好的指標,一般與離散趨勢指標中的標準差一起描述數據資料(即形式);而對于偏態分布的樣本,則常用中位數來描述集中趨勢,一般與離散趨勢指標中的四分位數間距一起描述數據資料(即形式),究其原因是均值容易受到極端值的影響。
對于兩個分布完全不同的樣本,可能會得到相同的均值,因此均值在某種程度上抹殺了樣本內部的差異,而往往這種內部差異正是需要進行深入研究或應當引起人們注意的。為了彌補均值的這種缺陷,一般在報告均值的同時,也應該報告標準差,或用直方圖或散點圖的形式描述分布,以展示群體內部的差異。
2.絕對數的誤用
因為社會調查研究比較容易得到大容量的樣本,所以對任何小概率事件,用絕對數報告都會出現較大的數字,單純對絕對數的強調往往會產生誤解。比較合理的方式一般是在報告某事件絕對數的同時,給出該事件的發生率或占研究樣本的比例。
3.相對數的誤用
相對數常用于描述定性資料的內部構成情況或相對比值或某現象的發生強度,一般有比與率兩種形式。雖然比與率的計算形式是相同的,即兩個絕對數之商乘以100%,但它們的含義是不同的。率用于反映某種事物或現象發生的強度,而比則用于反映部分與整體或某一部分與另一部分之間的關系。當數據的比較基礎相差懸殊,用絕對數表述沒有可比性時,就要借助于相對數。
應用相對數也容易出現一些問題,如:百分比與百分率的混用;當分母很小時,只計算百分比或百分率,而沒有報告樣本量;當比較兩個或多個總體率時,沒有考慮到各總體對應的內部構成情況是否一致,而直接比較等。
例如在報告流動人口犯罪問題時,給人的印象往往是流動人口犯罪率高于常住人口,其實是忽視了流動人口的年齡和性別構成與常住人口完全不同,且青年男性是犯罪率較高的人群,這樣對兩個不同群體的比較往往會導致錯誤的結論。
二、定量資料的統計分析問題
定量資料的統計分析是指所觀測的結果變量是定量的,而且希望考察定性的影響因素取不同水平時,定量觀測結果的均值之間的差別是否有統計學意義。定量資料的統計分析在統計學應用中占有很大的比重,出現的誤用也比較多。
正確選擇定量資料統計分析方法的關鍵有兩點:一是正確判斷統計研究設計的類型;再是檢驗定量資料是否滿足“獨立性、正態性及方差齊性”的前提條件。
在社會科學研究中,定性資料的統計分析常犯的錯誤主要就是列聯表的誤判,從而錯誤的選用統計方法。
三、相關與回歸分析問題
相關分析是研究變量之間的相互關系,常局限于統計描述,較難從數量角度對變量之間的聯系進行深入研究;回歸分析則是研究變量之間的依賴關系,可實現對自變量進行控制,對因變量進行預測,及對隨機變化趨勢進行適當修勻。
相關分析可用于對定類、定序、定距及定比等尺度的各類資料進行定量描述,但各類資料的計算公式是不同的,所以應用時,需要判明資料的類型;而回歸分析則要根據因變量性質的不同,選用不同的回歸分析方法,一般可分為兩類:一是因變量為連續型變量,具體的,當為非時間性的連續型變量時,可用線性回歸分析、多項式回歸分析、非線性回歸分析等;當為時間變量時,可用COX半參數回歸分析、指數分布回歸分析及威布爾回歸分析等;當為隨時間變化的連續型變量時,則需要利用時間序列分析。二是因變量為離散型變量,需要利用Logistic回歸分析、對數線性模型分析及多項Logit模型分析等。
在社會科學研究中,相關與回歸分析的應用非常廣泛。但應用時也經常出現一些錯誤:
1.沒有結合問題的專業背景和實際意義,就進行相關與回歸分析。其結果有時可能是莫名奇妙的,可能出現所謂的虛假相關。
2.對于較簡單的線性相關與回歸分析,不注意應用條件,盲目套用。一般地,Pearson相關分析要求兩變量都是隨機變量,且都服從或近似服從正態分布,若不滿足條件,應采用其它相關分析法,如Spearman相關分析等。而線性回歸分析則要求因變量必須是隨機變量,且服從或近似服從正態分布,在回歸分析前,先要進行統計檢驗,證實兩變量的顯著相關性,再進一步進行回歸分析才有意義。
3.只求得相關系數或回歸方程,而不進行參數假設檢驗就下統計分析結論。因為相關系數或回歸方程都是由樣本數據求得的,是否具有統計學意義,必須通過其相關參數的假設檢驗來判定。
4.多元回歸分析策略的錯誤。在社會科學實證研究中,對多元回歸分析的應用,不少人采取的策略是先用單變量分析,得到有統計學意義的多個變量,再將它們引入回歸方程進行多變量分析,用逐步回歸法進行篩選,從中選出有統計學意義的變量,這種分析策略是不正確的。因為自變量之間可能存在不同程度的交互作用,在單變量分析中無統計學意義的變量并非在多元回歸分析中也沒有意義。正確的處理方法應該是先綜合分析各種變量之間的作用、實際意義及關系,有些可作為控制變量(如性別、年齡等),將經過初步篩選的所有變量代入回歸方程進行分析,再采用逐步回歸方法,必要時可多用幾種篩選變量的方法,同時要注意自變量間的交互作用,進行綜合分析,這樣才能得到較為可靠的結果。
【社會科學研究中統計學方法應用的問題研究論文】相關文章:
關于社會科學研究方法問題04-26
科學研究中的意義建構問題05-01
社會科學研究中的本體論問題04-27
生物學中的科學研究方法05-01
應用統計學的教學研究與體會論文05-03
科學研究中的理想實驗方法04-27
現代生物技術在環境科學研究中的應用04-28
科學研究的設計和方法中的科學性05-01
社會科學研究中的超越與融合04-26