當前位置:學問谷 >

校園範例 >語文 >

試卷質量的分析

試卷質量的分析

一、項目分析

試卷質量的分析

評價試題質量的指標主要是試題的難度和區分度,再是選擇題分心答案的誘導效用性。項目分析是對每道試題的難度、區分度以及選擇題的分心答案的誘導效用性分別加以分析。

1、難度分析難度是表示試題難易程度的指標。其計算方法是以學生答對某題的比率來進行的。依題型及評分方法的不同,可用下面幾個公式計算。

<1>當用二值計分法時(只有答對或答錯兩種情況),可用公式P=R/N計算。P表難度,R表答對人數,N表受試總人數或抽樣的總樣本數。因受試者有可能憑猜測答對某些試題

2、提出了依D值大小,對試卷質量進行評價的標準。D≥0.4,質量非常良好;0.30≤D≤0.39,質量良好;0.20≤D≤0.29,質量尚可,應修改;D≤0.19,質量低劣,應淘汰。D值越大,區分度越高,則能力強、水平高的受試者得分較高;能力弱、水平低的受試者得低分,這樣可把不同程度的受試者鑑別開來。影響區分度的因素較多,其中最主要的是難度,通過理論計算得出:當P=0.5時,D有極大值。由此可知,改變難度就可調節區分度。

3.選擇題分心答案誘導效用性分析選擇題在客觀性測驗與考試中應用最廣。每題都由一個題乾和幾個備選答案組成。備選答案中,有對有錯,且對與錯有一定相關性,這樣可使備選答案形成似是而非的狀況。受試者在選擇正確答案時,錯誤的答案會起到分心或迷惑作用,故錯誤的備選答案常被稱作分心答案或誘答。對受試者來説,只有認真地分析、比較,才能選出正確答案。那些對所學知識掌握不夠好的受試者,常被誘答迷惑住,那麼該誘答就失去了應有作用,其效用性就低。分析誘答的誘導效用性,其方法是比較高分組和低分組選答每一個誘答的人數。良好誘答,應促使高分組選答它的人數少於低分組選答它的人數。設高分組選第i個誘答的人數為H,低分組選其人數為L。對i誘答,若滿足L>H,則該誘答的誘導效用性就高。若一個選擇題的幾個誘答都滿足上述條件,則該題的質量就高。

綜上所述,對試題分別進行三個項目分析後,依分析結果,即可對試題質量作出綜合評價。

二、總體分析

試卷質量不僅與試題質量有關,而且還與試題的選取、編制等因素有關。通常可用信度、效度及受試者成績的統計分佈狀態來反映試卷的總體質量。

1.信度分析測驗與考試是測量受試者知識、能力、技能等方面的重要手段。凡測量,必有一定的誤差,而測量誤差的大小,決定了測量結果的可信程度。如果誤差超出了規定的範圍,測量結果就不可信了。試卷的信度就是衡量試卷可信程度的指標。

試卷信度可用信度係數來表示,係數越大,信度越高,試卷可信程度亦越高。計算信度係數有幾種方法,如再現法、等值法、兩分法。這三種方法均涉及到積矩相關數公式的應用,數據處理甚為繁瑣。筆者在此介紹一種十分簡便的方法:查表法。先求出試卷中各試題區分度的

2.效度分析效度總是與測量目標密切相關的。關於測驗與考試,對某個目標有效的試卷,對其它目標不一定有效。涉及試卷的效度有兩種:一是內容效度;二是效標關聯效度。對效度的分析,以定性為主,定量為輔。

<1>內容效度分析內容效度指試題取樣是否充分概括了所要測量的全部內容,亦即其代表性如何。教材內容和教學目標是內容效度的兩個基本要素。這裏教材內容是指“主題”或“教材領域”,如普通化學包括物質結構與化學鍵、溶液與酸鹼理論、電化學初論、元素及其化合物等主題,亦可分得更細,每章代表一個主題。教學目標指學生的學習結果。按布魯姆的分類法,可將教學目標分為知識、理解、應用、分析、綜合、評價六個方面。在分析內容效度時,應同時考慮教材內容和教學目標這兩個基本要素。

對於測量學業成就的測驗與考試來説,內容效度是最主要的。影響內容效度的因素很多,試題難度、區分度較大的試題可以提高內容效度。此外,試卷中所涉及各教材內容、教學目標的權重以及諸試題的獨立性對試卷內容效度有很大的影響。

試卷中所涉及教材內容、教學目標的權重,一般依它們的相對重要性來確定。而相對重要性的確定,目前尚無具體可行的方法,大多依專家的意見來確定。就教材內容的權重而言,筆者以為可以從諸教材內容在教材中所佔比例(如頁數比、習題比)以及按大綱教學所用學時數佔總學時數之比來確定教材內容的權重。

如果某試卷中的教材內容的權重偏離表(依具體教材及大綱編制的計算表)中權重較遠,則會對試卷內容效度帶來不利影響。

對於各學習結果(即教學目標)的權重,只能定性而論。其權重的大小與測量目標有關,而且諸目標之間的相關性很高,相互間的界限不甚明朗。從發展趨勢來看,在試卷中,尤其是測學業成就的試卷中,應增大測量應用、分析、綜合、評價等與能力有關的教學目標的權重,而純知識(主要靠死記硬背)內容的比例不宜過大。一般而論,其值不超過百分之五十。

試題的獨立性對試卷內容效度也有一定影響。試卷中,各試題都應有獨立性,各題之間不能相互提供額外的'解題信息,並且測A教材內容的試題不宜滲入B教材內容,除非A、B間相關性很高或測受試者綜合應用知識的能力。例如在“建築材料”這門課程的試卷中,測“水泥”這一章教材內容的試題不宜摻進“氣硬性膠凝材料”這一章的教材內容。因為水泥屬水硬性膠凝材料,它與後一章教材內容無相關性。若滲進了後一章內容,就會造成測量目標不明確,使測水泥的試題失去了獨立性,這樣會降低內容效度。倘若在測水泥的試題中摻進了“混凝土”這一章教材內容,儘管使該題失去了獨立性,但“水泥”與“混凝土”相關性很高,故而試題的測量目標仍很明確,只是其由單一性變成了綜合性。我們在分析時,應明確各試題的測量目標以及各試題所涉及教材內容之間的相關性,就可對試題的獨立性作出判斷。試題獨立性強,有利於提高試卷的內容效度。

從以上論述中可以看出,對試卷進行內容效度分析要綜合考慮多種因素。既要利用難度與區分度分析,又要定性確定教學目標的大致比例和定量計算材料內容的權重,同時還要判斷試題的獨立性。難度適中、區分度較大的試題有利於提高試卷內容效度;各試題所涉及教材內容的權重與按表中所示方法計算出的權重大致相符時,有助於提高試卷的內容效度;獨立性高的試題對內容效度有積極貢獻;諸教學目標的比例適當對內容效度有積極影響。

<2>效標關聯效度分析效標關聯效度是指一個測量結果與另一個可以作為效標(即效度標準)的測量結果的相關程度。譬如,大學聯考前的摹擬考試試卷可將往年大學聯考試卷作效標。摹擬試卷的效標關聯效度就是指這兩種試卷間的相關程度,二者相關程度越高,摹擬試卷的效度越高。由於其它試卷難以尋到對應的效標,所以常用定性方法加以分析。例如:教師依平時的考查,認為李的某一課程學得很好,若李在該學科的期末考試中取得優秀成績,則可説明該試卷的效度較高。在這裏,教師平時的認真觀察和記錄的結果就充當了效標的作用。

3.成績統計分佈狀態分析一般而論,對同組受試者,成績拔尖的少,成績差的少,較優、較差的要多一些,而多數受試者的成績處於中間狀態。亦即成績分佈曲線屬於或接近正態分佈曲線。基於此點,就有必要對成績分佈狀態作一分析,看其是否屬或近正態分佈。具體方法如下:

①將百分制成績劃分為若干個分數段,並定其中點值。一般將5分作為一個分數段。

②在全部分數中確定各分數段的人數。

③以分數(中點值)為橫座標,各分數段人數作縱座標,建立一個座標系。

④描點、作圖。描點時,以各分數段的實際人數作為縱座標值,相應分數段的中點值為橫座標值。如90-94分數段有4人,該段中點值為92,則可在座標系中找出點(92,5),將諸點連成光滑曲線即得成績分佈曲線。

依前述方法作出的曲線,若為正態分佈曲線,則成績統計分佈較為正常,試題的難度、區分度較適宜,試卷質量較好。

結束語

決定試卷質量的指標較多,且諸指標間相關性很高,我們在進行試卷質量分析時,應綜合考慮諸指標對試卷質量的影響,從而為合理評價試卷質量提供科學的依據。

標籤: 試卷
  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flxy/yuwen/m46odl.html