數據挖掘學生全口徑接收效果分析論文
隨著我國高等教育招生規模的提升,高等教育的大眾化已基本實現,研究生的規模也迅速擴大,因此研究生課堂教學質量逐漸成為各大高校關注的焦點問題之一。而課堂接收效果直接影響研究生課堂教學質量,進而影響人才的培養。因此,調查、了解研究生的課堂狀態,深入研究影響課堂接收效果的因素,對于提升研究生課堂質量具有十分重要的現實意義。本文通過調查東北財經大學研究生課堂行為,挖掘影響大學課堂效果的相關因素,歸納出其主要影響因素并從中尋求提升大學課堂效果的可行性策略。
一、文獻綜述
劉華和李瑗[1]通過教學態度,教學內容,教學方法這三個指標打分情況,進而利用Microsoft決策樹算法,Microsoft關聯算法和Microsoft聚類分析法挖掘模型進行挖掘分析。駱懿玲[2]基于元規則約束的關聯挖掘進行課堂教學質量評價挖掘,并得出分析結果,給出建議。邵珠艷等[3]利用灰色關聯分析,對影響課堂教學效果的因素打分后進行分析。葉勇[4]將云模型引入到遺傳算法,再用改進遺傳算法對支持向量機參數進行優化,并與BP神經網絡、多元線性回歸模型比較,以便對課堂教學質量的模型評價效果進行評價。袁萬蓮和鄭誠[5]利用關聯規則進行數據挖掘,得出與教學質量相關因素是教師的學歷、職稱以及教齡;職稱為講師、教齡較長或者高級職稱、高學歷的教師教學質量較好。張震等[6]將評價指標大致分為教學態度、教學內容、教學水平以及教師研究能力,利用關聯規則進行數據挖據。戴俊[7]以教師因素,學生因素,師生雙方因素以及環境因素和考試成績作為變量,通過主成分回歸方法對影響課堂教學效果的因素進行分析,為改進教學評價方式與提高課堂教學效果提供理論參考。許云華等[8]設計調查問題為“您最想對課堂教學提的意見”“改進方法”“如何實現從被動學習向動吸收知識的轉變”,基于扎根理論對上述問題答案進行分析并得出分析結果。柴志賢和邱風[9]借鑒過程—成果研究方法,在以往研究的教師職稱、年齡、所教年級、課程類別這些教師背景變量的基礎上,增加教學素質、教學技能與教學責任心這三個影響因子進行分析,從而為提高高校課堂教學效果提供一定經驗指導。
二、理論
(一)支持向量機(SVM)
支持向量機是由CorinnaCortes和Vapnik等在1995年首先提出的,是一種基于統計學習原理的數據挖掘技術。支持向量機分為支持向量回歸機和支持向量分類機,本文主要應用支持向量分類機進行數據挖掘。支持向量機分類的核心是找到兩相互平行并且間隔(margin)最大,并能將屬于不同類別的樣本點正確分開的邊界,位于兩邊界中間位置并與之平行的超平面,稱之為最大邊界超平面,即為最終解。
(二)TF-IDFTF-IDF
是一種判斷詞語在文件中重要性程度的加權統計方法。一個詞語在文件中出現的頻率越高,它對這個文件來說就越重要;這個詞語在整個語言中出現的頻率越高,它對這個文檔來說越不重要。TF-IDF可以利用計算機技術在不需要人工進行干預的情況下提取文件中的關鍵詞,并快速對詞頻進行統計,常被用于文本挖掘和信息檢索等前言領域。TF-IDF的主要思想是:若某個詞在其他文件中很少出現,但在這一文件中出現的頻率高,那么它極有可能反映了這一文件的特性,則認為它很適合用來分類,因為它具有很好的類別區分能力。TF-IDF實際上代表的是TF*IDF,TF表示詞頻,IDF表示逆文件頻率。
三、模型
(一)數據來源
1.變量選取
為了獲得教師因素、學生因素以及環境因素這三個變量的收稿日期:有效數據,筆者精心設計一份調查問卷,影響因素分為教師、學生及環境。教師因素中包括:學與生互動情況、授課方法、課堂考勤、按時上下課、PPT使用情況、普通話水平、講課聲音大小、作業布置情況以及課程考查形式。學生因素包括:出勤狀況、遇到問題交流情況、課下與同學和老師交流情況、學習狀態、聽課表現、上課做筆記情況、課程內容掌握情況以及課堂上的感受。環境因素包括:上課時周邊環境、所用教室類型、課程安排上下學期情況、上機教學與否、教學設備、授課時間段、授課時長以及教室衛生環境。
2.數據獲取
在調查對象的選擇上,我們主要以東北財經大學研究生為調查對象,發放線上調查問卷,讓學生認真對自己所學課程中某一門課的教學效果進行評價。
(二)數據挖掘過程及結果
(1)讀入數據。選擇源選項卡中的excel節點,將調查問卷中數據導入到clementine中。
(2)數據審核。選擇輸出選項卡中的數據審核節點連接到excel節點上,由審核結果可知,Q5變量的類別比為90∶9∶1,單個類別值過大,會影響建模的精確程度,故應刪除。
(3)數據分區。利用分區節點將數據進行分區,其中70%為訓練集,其余30%為測試集。
(4)變量相關性分析。利用統計量節點分析變量之間的相關性,若相關性高,需要剔除相關變量,反之則不需剔除。經測試,在本文的變量中未發現高相關性變量,因此無需剔除變量。
(5)得分變量重新分類。利用“重新分類”節點將得分變量分類,其中0—7分為一類,8、9、10分為另一類。
(6)特征選擇建模。選擇建模選擇項卡中的特征選擇節點,將其連接到數據流的恰當位置上。
(7)支持向量機建模。提取上一步得到的重要變量,選擇建模選擇項卡中的SVM節點進行建模。
(8)數據測試。測試過程和訓練過程是相同的,且得到的準確率為93%,測試結果良好。
(三)文本挖掘過程及結果
1、數據清洗。原始調查問卷數據中包括文字,標點符號。其中一些信息對關鍵詞抽取沒有幫助,甚至會嚴重影響研究。為了方便抽取工作順利開展,有必要先對原始評論數據進行清洗,如“無”或“好”等,對問卷內容沒有幫助,進行直接刪除處理。
2、數據預處理。預處理可以把句子級別的文本數據劃分成可識別的`詞、詞組,主要包括分詞、詞性標注和依存句法分析三個部分。在本文中使用LTP進行分詞。
3、關鍵詞提取。由于人工標注會造成主觀干擾,本文為了減小人工標注的主觀性影響,要利用TF-IDF算法自動提取關鍵詞。
四、結論及建議
(一)結論
學生、教師、環境三方面均對課堂接收效果產生較大影響。數據挖掘結果中,課堂興趣、學科掌握內容為學生因素,授課方法以及課堂互動屬于教師因素,排在第二位的上課周邊環境則是環境因素。文本挖掘結果中,學生、課程、認真為學生因素,理論、講課、上課、教學、案例、互動屬于教師因素,教室則是環境因素。因此,三種因素均對課堂接收效果產生影響。利用文本挖掘與數據挖掘對比分析可以得到良好的研究結果。文本挖掘與數據挖掘的結果中均體現出了學生因素、教師因素以及環境因素對課堂接收效果產生影響,并且兩種方法的分析結果中均以高頻率出現“互動”因素,印證了文中使用的兩種方法均可行并可得到較為精準的結果。
(二)建議
增加課堂小組討論環節。集體討論是課堂中不可忽視的環節,既可以活躍課堂的氣氛,交換意見觀點,拓寬學習范圍;又可以活躍學生思維,多角度展開思考,提升解決問題的能力,避免傳統灌輸式的教學方式。增加師生課堂互動。加強師生互動,調動課堂氣氛,并利用實際問題創設情境,讓學生給出解決的方案,提高學生的學習興趣。增加課本知識與實際案例的結合。書本的知識往往是生硬抽象的,而結合實際的案例后,不僅可以使死板的課本知識更加形象生動,易于理解消化,融會貫通于實際案例中;也可以提高學生的學習興趣,提升學習的積極性與主動性。增加課程實踐環節。將課本知識用于實際操作中,不僅可以升學生學習的樂趣,還可以使學生結合生活經驗學習相關知識,更好地將書本知識用于實際學習以及未來的工作中,同時在實踐中深化對于課本知識的理解。增加高校課改調查。
本文針對東北財經大學研究生的調查問卷結果進行分析,并提出建議。不同學校的實際情況會有一定差異,師資力量會有差異,學生學習素質不同,院校學習氛圍也有一定差異等。不同院校根據本校情況設計相應的調查研究方式,會使研究結果更具可信性,建議更具可行性,為教學改革提供更加切合實際的方案。
【數據挖掘學生全口徑接收效果分析論文】相關文章:
大數據崛起與數據挖掘分析論文11-28
數據挖掘論文09-24
聘:數據分析 數據挖掘01-15
數據挖掘分析報告模板02-08
軟件工程數據挖掘進展分析論文06-01
基于數據挖掘的社交網絡分析與研究論文01-23
網絡游戲的數據挖掘與數據分析01-15
數據挖掘技術的研究論文01-22
數據分析/挖掘工作的疑惑?01-17