Rasch 測量理論與其在教育和心理之應用 王文中
一、
傳統測驗總分的用途與劣勢:
僅管傳統測驗中分數大多是順序尺度。但我們習慣將分數加總。
利用其總分進行:1. 比較個別差異、2. 評估前後測改變、3. 進行團體比較
但傳統測驗既是測驗依賴又是樣本依賴,且各單題之間難度未定。
所以可能出現問題為:
1.
題目都可以讓A答對,但B答錯,但僅能顯示適合A的題目較多,不能顯示A的能力比B好
2.
測驗整體都很難,導致每個受試者的分數都很低,但卻沒有辦法顯示出受試者能力。(測驗依賴)
3.
受試者超強,不管什麼題目都對受試者來說很簡單。因此無法看出受試者能力。(樣本依賴)
所以傳統測驗的劣勢就是將「受試者能力估計」與「題目難度」綁定,導致互相干擾,彼此都解釋不了。
二、
Rasch分數轉換的基本概念(有一些數學式我弄不懂)
1.
會找一個參照的相對0點,以利於比較()
假設:
受試者能力為A
題目難度為B
在某題二分變項答1分(能力好)的機率為P1,答0分(能力差)的機率為P2。
Odd ratio = P1/ P0 代表答對的機率比答錯的機率高幾倍
Odd ratio = A/B 代表相對於B題來說,A的能力為B的幾倍
----我不太懂為什麼兩個式子相等
如果有甲乙兩人作同一份測驗
Odd ratio甲/ Odd ratio乙 = A甲/A乙
----不懂為什麼相除之後就可以得到能力比值
但總之取logit之後,兩個人的能力就可相減(變成等距),差距為logit單位
三、
圖的解釋:
圖一:如果兩者能力差距為X軸;兩者的答對機率差為Y倍
EX:如果兩者能力差異為0,答對的機率為0.5
----不是很確定文章中用的描述
疑問點有二:
1. 如果按照舉例所述,要怎麼看/定義兩者能力差距
2. 還是說兩者除了AB兩者以外,也可以同義代成能力與題目難度的差距
圖二:以不同能力的受試者來看三道題目
此圖特色有二
1.
隨著能力越高,答對機率越高(monotonically increasing)
2.
三道題目的曲線不會交叉,代表對所有能力的人來說,題目難易度皆相同
3.
ICC是曲線不是直線,是直線會導致答對機率超過1
----不懂為什麼用0.5來代表難易度
四、參數估計
使用最大概率估計法(maximum likelihood estimation)或是貝式統計
----先放著
總之就是出現某種情況的最大機率為何。
五、資料與rasch適配
1.
看受試者作答反應是否與模式預期相同
2. 看題目被作答的情形是否與模式預期相同
*不符合的模式稱為殘差
可能情形有:答錯簡單,但答對很難的、猜測、亂答、特殊解法等等。因此有其他的模式以估計這種情況
六、多參數模式:
粗曲線:單參數模式:參數:題目難度
細曲線:二參數模式:參數:a斜率(鑑別度參數)+題目難度
點曲線:三參數模式:參數:c漸進線(猜測參數)+斜率(ICC)+題目難度
---問題很多:
為什麼粗曲線被認為是不好的曲線?
新增的兩參數(a斜率、漸進線)的意義?
七、分數使用:
效度:通過IRT檢驗即有效度
信度:每位受試者之誤差不相同,誤差因人而異
常模:無須依賴常模,但發展時仍要看其異質性
DIF:是否因為某種因素導致題目難度對受試者不一
沒有留言:
張貼留言