7/7 遠距
昨日完成:
1. IRT-JM正課;及JM相關筆記於雲端:https://docs.google.com/document/d/1OWwYs45rpDXsjV0k2CBvglDNZmpncklkQYHteyd2nNY/edit
2. 職災資料分析:清資料部分(我沒想到清資料是這麼瑣碎的事情,我大概花了4個小時才搞定,整個下午晚上都浸在這件事情裡面哈哈哈,應該要學習有效的清資料的方法)
3. 花了一點時間研究logistic reg的用法:https://www.youtube.com/watch?v=KDGdIrLvALk。
大致紀錄一下:
二分變項不能使用Linear reg的原因有二
1. 線性機率模型有異質變數(heteroscedasticity)之問題--但這不重要我也不是很清楚
2. 預測機率會超過1
而必須使用Logistic Regression;因為Logistic Reg的Y是勝算比的概念,也就是1發生的機率比0發生的機率高出幾倍。
式子:P/(1-P) = eb0+b1x1 ;ln(P/1-P)= b0+b1x1 ;取In的時候,會與X呈現線性關係,且Logistic Reg 也可以是多元回歸
*Logistic Regression用的非最小平方法而是最大概似法,不用最小平方法的原因是因為Y只有0/1,In中若分子為1則值會無限,分母為0則值會負無限。
雖然看了一些,但是用處似乎不太大QQ
行程:
9:00-12:00
1.
預計完成職災資料分析
13:00-14:00
1.
Lynn 英文
14:00-?
1.
寫週一IRT之程式碼作業
2.
研究就下學期要修哪們統計課
沒有留言:
張貼留言