[編輯]
Tobit模型的形式
Tobit模型的形式如下:
yi = α + βxi + υi (1)
其中υi為隨機誤差項,xi為定量解釋變量。yi為二元選擇變量。此模型由James Tobin 1958年提出,因此得名。如利息稅、機動車的費改稅問題等。設(shè)
若是第一種選擇等于1,第二種選擇是0。對yi取期望,
E(yi) = α + βxi (2)
下面研究yi的分布。因為yi只能取兩個值,0和1,所以yi服從兩點分布。把yi的分布記為,
則:
E(yi) = 1(pi) + 0(1 − pi) = pi (3)
由(2)和(3)式有:
pi = α + βxi (yi的樣本值是0或1,而預(yù)測值是概率。) (4)
以pi = − 0.2 + 0.05xi 為例,說明xi 每增加一個單位,則采用第一種選擇的概率增加0.05。假設(shè)用這個模型進行預(yù)測,當(dāng)預(yù)測值落在 [0,1] 區(qū)間之內(nèi)(即xi取值在[4, 24] 之內(nèi))時,則沒有什么問題;但當(dāng)預(yù)測值落在[0,1] 區(qū)間之外時,則會暴露出該模型的嚴重缺點。因為概率的取值范圍是 [0,1],所以此時必須強令預(yù)測值(概率值)相應(yīng)等于0或1(見下圖)。線性概率模型常寫成如下形式,
(5)
然而這樣做是有問題的。假設(shè)預(yù)測某個事件發(fā)生的概率等于1,但是實際中該事件可能根本不會發(fā)生。反之,預(yù)測某個事件發(fā)生的概率等于0,但是實際中該事件卻可能發(fā)生了。雖然估計過程是無偏的,但是由估計過程得出的預(yù)測結(jié)果卻是有偏的。
由于線性概率模型的上述缺點,希望能找到一種變換方法,(1)使解釋變量xi所對應(yīng)的所有預(yù)測值(概率值)都落在(0,1)之間。(2)同時對于所有的xi,當(dāng)xi增加時,希望yi也單調(diào)增加或單調(diào)減少。顯然累積概率分布函數(shù)F(zi) 能滿足這樣的要求。采用累積正態(tài)概率分布函數(shù)的模型稱作Probit模型。用正態(tài)分布的累積概率作為Probit模型的預(yù)測概率。另外logistic函數(shù)也能滿足這樣的要求。采用logistic函數(shù)的模型稱作logit模型。