整理完之後的問題如下:
1. 機器學習模型無法估計樣本數,那要怎麼知道結果是穩定的?(重新再跑一次看結果會不會一致?)
2. 當初為什麼不照上下肢題目的比例去選?
3. 分數雖然變得可比較性,但可比較性似無沒有太大意義。我認為的原因如下:雖然可以用AI-ML去逼近原始分數,但是轉換後的原始分數,沒有辦法呈現各關節的狀況。且FM也沒有常模。還是難以推估個案能力;所以對於臨床人員來說,分數解讀的問題還是在。
4. 文中提到用,Person's r 看反應性,但person'r的數值不是差距,這個概念想要釐清。
5. 如何決定幾個cell/幾層layer
AI-FM 整理
AI-FM研究目的:AI-FM想要突破的主要問題為短版FM (12-FM / 32-FM)的分數無法與原版分數相比較,所以臨床應用性低。
研究方法與結果:
第一步:
1.
受試者資料:使用次級資料
2.
將此筆資料(208筆)分成8:2,80%用以發展、20%用以測試
第二步
1. 選題:上肢/下肢各選5題;選題方式:使用randomized lasso method。
概念大致如下:
「抽取少數樣本量,使用該群樣本之各題分數預測其總分,並挑出相關係數最高的5題」此過程重複多次,再挑出出現次數最高的5題,當作最終題目。
2.
建立計分系統
使用Artifical neural network(類似多層的全有全無率,所以文中才說可能是線性/非線性)
概念大致如下:
「選題後,得題分數會「乘以某係數」後將題目資訊輸入information shared layer中的cell,在cell中,會加總原題目「得分X係數」,並判斷是否有通過某閾值,如有通過,則再乘以某係數傳到下一層的cell;如未通過則乘以0。以此可以將有重要資訊的題目保留,並替除不重要之題目。」
*因為有很多不同段之係數轉換,故其分數轉換非線性。
「保留重要資訊後,再進入到information specific layer,將被保留的重要資訊分數膨脹以推估總分」
第三步
1.
檢查其心理計量特性
i. 同時效度:
FM 與 AI –FM之pearson’s r = 0.95~0.99(優於其他版本)
ii.收斂效度:
全部UE-FM與BI之pearson’s r = 0.54~0.76
全部LE-FM與BI之pearson’s r = 0.58~0.82 (與PASS優於其他版本,與BI劣於其他版本)
iii.反應性:
UE (優於其他版本)
AI-FM:4.9~6.7;SRMs=0.37-0.71
FM與AI-FM person’s=0.72~0.95
LE(其他版本相似)
AI-FM:2.4-3.4;SRMs=0.37-0.71
FM與AI-FM person’s=0.78~0.91
iv. 再測信度
UE:AI-FM ICC = 0.92;MDC=13.2;MDC%=20%(ICC劣於其他版本;MDC優於其他版本)
LE:AI-FM ICC = 0.88;MDC=5.3;MDC%=15.6% (劣於其他版本)
結論:
1.
AI-FM較有效率(比12-FM、37-FM更短)
2.
有好的同時效度、再測信度;MDC優於其他版本
3.
AI-FM可以非常逼近原始分數
沒有留言:
張貼留言