2021年6月1日 星期二

Rasch 第一堂課前預習(看完一次,但還沒唸完)

 

Rasch 測量理論與其在教育和心理之應用 王文中

 

一、                傳統測驗總分的用途與劣勢:

僅管傳統測驗中分數大多是順序尺度。但我們習慣將分數加總。

利用其總分進行:1. 比較個別差異、2. 評估前後測改變、3. 進行團體比較

但傳統測驗既是測驗依賴又是樣本依賴,且各單題之間難度未定。

所以可能出現問題為:

1.      題目都可以讓A答對,但B答錯,但僅能顯示適合A的題目較多,不能顯示A的能力比B

2.      測驗整體都很難,導致每個受試者的分數都很低,但卻沒有辦法顯示出受試者能力。(測驗依賴)

3.      受試者超強,不管什麼題目都對受試者來說很簡單。因此無法看出受試者能力。(樣本依賴)

 

所以傳統測驗的劣勢就是將「受試者能力估計」與「題目難度」綁定,導致互相干擾,彼此都解釋不了。

 

 

二、                Rasch分數轉換的基本概念(有一些數學式我弄不懂)

 

1.      會找一個參照的相對0點,以利於比較()

假設:

受試者能力為A

題目難度為B

在某題二分變項答1分(能力好)的機率為P1,答0分(能力差)的機率為P2

 

Odd ratio = P1/ P0 代表答對的機率比答錯的機率高幾倍

Odd ratio = A/B 代表相對於B題來說,A的能力為B的幾倍

----我不太懂為什麼兩個式子相等

如果有甲乙兩人作同一份測驗

Odd ratio/ Odd ratio = A/A

----不懂為什麼相除之後就可以得到能力比值

但總之取logit之後,兩個人的能力就可相減(變成等距),差距為logit單位

 

三、                圖的解釋:

圖一:如果兩者能力差距為X軸;兩者的答對機率差為Y

EX:如果兩者能力差異為0,答對的機率為0.5

----不是很確定文章中用的描述

疑問點有二:

1. 如果按照舉例所述,要怎麼看/定義兩者能力差距

2. 還是說兩者除了AB兩者以外,也可以同義代成能力與題目難度的差距

 



圖二:以不同能力的受試者來看三道題目

此圖特色有二

1.      隨著能力越高,答對機率越高(monotonically increasing

2.      三道題目的曲線不會交叉,代表對所有能力的人來說,題目難易度皆相同

3.      ICC是曲線不是直線,是直線會導致答對機率超過1

----不懂為什麼用0.5來代表難易度



 

四、參數估計

 

使用最大概率估計法(maximum likelihood estimation)或是貝式統計

----先放著

總之就是出現某種情況的最大機率為何。

 

 

五、資料與rasch適配

 

1.      看受試者作答反應是否與模式預期相同

2.      看題目被作答的情形是否與模式預期相同 

*不符合的模式稱為殘差

可能情形有:答錯簡單,但答對很難的、猜測、亂答、特殊解法等等。因此有其他的模式以估計這種情況

 

六、多參數模式:

 

粗曲線:單參數模式:參數:題目難度

細曲線:二參數模式:參數:a斜率(鑑別度參數)+題目難度

點曲線:三參數模式:參數:c漸進線(猜測參數)+斜率(ICC+題目難度

---問題很多:

為什麼粗曲線被認為是不好的曲線?

新增的兩參數(a斜率、漸進線)的意義?

 


七、分數使用:

效度:通過IRT檢驗即有效度

信度:每位受試者之誤差不相同,誤差因人而異

常模:無須依賴常模,但發展時仍要看其異質性

DIF:是否因為某種因素導致題目難度對受試者不一

沒有留言:

張貼留言

CAT終止條件注意事項

  CAT 終止條件設定:   共會有三種考量: 分別為: 1.       MRR :某個人的信度到達 N 後,即停止施測。 2.       LRI : 某個人 增加信度小於 N 3.       MRR or LRI   首先: CAT 的考...