Tobit模型也稱為樣本選擇模型、受限因變量模型,是因變量滿足某種約束條件下取值的模型。 這種模型的特點(diǎn)在于模型包含兩個(gè)部分,一是表示約束條件的選擇方程模型;一種是滿足約束條件下的某連續(xù)變量方程模型。研究感興趣的往往是受限制的連續(xù)變量方程模型,但是由于因變量受到某種約束條件的制約,忽略某些不可度量(即:不是觀測值,而是通過模型計(jì)算得到的變量)的因素將導(dǎo)致受限因變量模型產(chǎn)生樣本選擇性偏差。兩部模型(two-part model)與Tobit模型有很大的相似之處,也是研究受限因變量問題的模型;但是這兩種模型在模型結(jié)構(gòu)形式、估計(jì)方法、假設(shè)條件等方面也存在一定的區(qū)別。
[編輯]
Tobit模型的形式
Tobit模型的形式如下:
yi = α + βxi + υi (1)
其中υi為隨機(jī)誤差項(xiàng),xi為定量解釋變量。yi為二元選擇變量。此模型由James Tobin 1958年提出,因此得名。如利息稅、機(jī)動(dòng)車的費(fèi)改稅問題等。設(shè)
若是第一種選擇等于1,第二種選擇是0。對(duì)yi取期望,
E(yi) = α + βxi (2)
下面研究yi的分布。因?yàn)閥i只能取兩個(gè)值,0和1,所以yi服從兩點(diǎn)分布。把yi的分布記為,
則:
E(yi) = 1(pi) + 0(1 − pi) = pi (3)
由(2)和(3)式有:
pi = α + βxi (yi的樣本值是0或1,而預(yù)測值是概率。) (4)
以pi = − 0.2 + 0.05xi 為例,說明xi 每增加一個(gè)單位,則采用第一種選擇的概率增加0.05。假設(shè)用這個(gè)模型進(jìn)行預(yù)測,當(dāng)預(yù)測值落在 [0,1] 區(qū)間之內(nèi)(即xi取值在[4, 24] 之內(nèi))時(shí),則沒有什么問題;但當(dāng)預(yù)測值落在[0,1] 區(qū)間之外時(shí),則會(huì)暴露出該模型的嚴(yán)重缺點(diǎn)。因?yàn)楦怕实娜≈捣秶?[0,1],所以此時(shí)必須強(qiáng)令預(yù)測值(概率值)相應(yīng)等于0或1(見下圖)。線性概率模型常寫成如下形式,
(5)
然而這樣做是有問題的。假設(shè)預(yù)測某個(gè)事件發(fā)生的概率等于1,但是實(shí)際中該事件可能根本不會(huì)發(fā)生。反之,預(yù)測某個(gè)事件發(fā)生的概率等于0,但是實(shí)際中該事件卻可能發(fā)生了。雖然估計(jì)過程是無偏的,但是由估計(jì)過程得出的預(yù)測結(jié)果卻是有偏的。
由于線性概率模型的上述缺點(diǎn),希望能找到一種變換方法,(1)使解釋變量xi所對(duì)應(yīng)的所有預(yù)測值(概率值)都落在(0,1)之間。(2)同時(shí)對(duì)于所有的xi,當(dāng)xi增加時(shí),希望yi也單調(diào)增加或單調(diào)減少。顯然累積概率分布函數(shù)F(zi) 能滿足這樣的要求。采用累積正態(tài)概率分布函數(shù)的模型稱作Probit模型。用正態(tài)分布的累積概率作為Probit模型的預(yù)測概率。另外logistic函數(shù)也能滿足這樣的要求。采用logistic函數(shù)的模型稱作logit模型。
-
留言與評(píng)論(共有 0 條評(píng)論)