關于主成分分析的常用改進方法論文
針對傳統主成分分析方法的缺點和應用當中可能出現的誤區,總結幾種常用的主成分分析改進方法。是一種化繁為簡,將指標數盡可能壓縮的降維(即空間壓縮)技術,也是一種綜合評價方法。
關鍵詞:主成分改進,綜合評價
0. 引言
主成分分析是一種常用的多元統計分析(即多指標的統計方法)方法。是一種化繁為簡,將指標數盡可能壓縮的降維(即空間壓縮)技術,也是一種綜合評價方法。免費論文。目前已廣泛應用于許多領域,如:城市生態系統可持續發展的分析,工業企業經濟效益的分析,公司財務評價,學習成績的比較評價等等。但是,傳統的主成分分析法在綜合評價當中已暴露出很多缺陷,很多學者也提出了不同的.改進方法,這些改進方法是與一定的現實條件相關聯的,因此也不乏出現誤用。本文將對常用的改進方法作進一步探討。
1.傳統PCA評價模型的算法:
1.1 輸入樣本觀測值:
1.2 計算各指標的樣本均值和樣本標準差:
1.3 對標準化,計算樣本相關陣:
1.4 求的特征值及對應的特征向量
1.5 建立主成分。
按累積方差貢獻率
1.6 計算前個主成分的樣本值
2.運用傳統主成分分析方法易出現的誤區及改進方法
在實際應用中,為了消除變量量綱的影響,往往對原始數據標準化,但是標準化在消除量綱或數量級影響的同時,也抹殺了各指標變異程度的差異信息,在此種情況下,我們通常可采用對原始數據進行均值化處理 [2],該方法已得到廣泛采用。另外,主成分分析對于處理線性結構有很好的效果,然而對于許多實際問題,其觀測數據陣并非線性結構而呈非線性結構。這時,若采用線性方法,效果往往很差。這就需要進一步的改進。本文將介紹幾種簡單的對原始數據進行處理的方法以及“對數—線性比”[1]主成分方法。
改進方法操作如下:
2.1 對原始數據的處理
2.1.1 數據的均值化
2.1.2 對數變換法
描繪原始數據的散點圖,若散點圖呈現對數曲線特征時,令
2.1.3 平方根變換法
若散點圖呈現拋物線特征時,令
然后以作為新的數據代替原始數據進行分析即可。
當上述三種變換仍然不能很好的解決問題,而原始數據又明顯呈現非線性特征時,還可以采用下述方法。免費論文。
2.2“對數—線性比”主成分方法
原香港大學統計系主任Aitchison教授(1981年)提出用對數—比(logratio)變換
亦即 其中為成分向量的任一恒正函數。為簡便起見,一般可取
相應的
可以證明為奇異陣,至多有個非零特征值。免費論文。對其作譜分解:
便可以求得其廣義主成分
3.其它改進方法
除了上述改進方法之外,近來不少學者又提出了新的改進方法,如主成分聚類法。主成分聚類即先做主成分分析,再取若干主成分對樣品進行聚類分析,結合第一主成分得分排序對樣品進行分類排名。由此得到一種新的綜合評價方法,具體操作方法詳見文獻[2]。另外還有分組主成分分析方法 [5] 等。在實際應用當中,如果不考慮具體問題條件,一味采取同一個模式,難免有失偏頗,甚至與現實大相徑庭。因此,根據不同的問題采用不同的改進方法,對解決具體問題是很有必要的。
【主成分分析的常用改進方法論文】相關文章:
區間主成分分析方法的比較11-03
主成分分析及算法07-03
sas主成分分析07-16
海水富營養化評價的主成分-聚類分析方法07-16
海洋經濟與環境發展的主成分分析01-18
割手密主要數量性狀的主成分及聚類分析07-06
主成分分析法在水質評價中的應用及分析01-10
香菇數量性狀的相關性分析和主成分分析07-26