廣義線性模型的理論,強調兩個重要組成部分
鏈接函數(這實際上是在預測模型的關鍵)
分布或方差函數
考慮數據集
-lin.mod = lm(dist~speed,data=cars)
如果我們可視化線性回歸,得到:
基于某些誤差項生成與先前描述的模型相同的模型。該模型可以在下面看到,
這里有兩部分:平均值的線性增加 和正態(tài)分布的恒定方差 。
另一方面,如果我們假設泊松回歸,
poisson.reg = glm(dist~speed,data=cars,family=poisson(link="log"))
我們有這樣的結果
我們的模型不再是線性的,而是指數的,并且方差也隨著解釋變量的增加而增加,因為有了泊松回歸,
如果改編前面的代碼,我們得到
問題是,當我們從線性模型引入Poisson回歸時,我們改變了兩件事。因此,讓我們看看當我們分別更改兩個成分時會發(fā)生什么。首先,我們可以使用高斯模型來更改鏈接函數,但是這次是乘法模型(具有對數鏈接函數)
這次是非線性的?;蛘呶覀兛梢栽赑oisson回歸中更改鏈接函數,以獲得線性模型