毎日がんばれあたん

計量社会学に関するメモとモチベーションを高めてくれる推しについて

ロジットとプロビット

いわゆる1か0かの選択,例えば大学に合格したか否か,あるいは現在幸せか否か,などの2択がどんな要因によって決定されるか分析する際には二項選択モデルをことが一般的です.代表的なのはロジット(ロジスティック)分析(以下ロジット分析),プロビット分析.これらの分析について両者の違いにも言及しながらなるべく簡易な説明を行います.今回は数式を使って説明しますが,なるべく簡単かつ数式がわからずとも理解できるように.

 

今回の従属変数はとします.iはある値でyが条件づけられることを指します.たとえばi=1の時のyの値,i=2の時のyの値…というようにiの値によって,yが変わりうることを指しています.こうしたある値によって注目する値(ここではy)が変わりうることを(yの)条件付き分布と言います.この辺りは二項選択モデルでなくとも当てはまる考え方です.ここでyはが何かを選択すれば1,選択しなければ0となります.普通のOLS回帰の場合はこのyの値の範囲が0より小さい値や1より大きい値をとるわけです.こうした1か0かをとりうる確率モデルはベルヌーイ関数として定式化が可能です.ここでは数式での理解よりも,より実践的な場面での理解や注意点を目指した説明を重視しますが,こちらの式は(教科書や分野によって多少変形するものの)よく出てくるので,理解しておくことを推奨します.今回は,北村(2009)ミクロ計量経済学入門(日本評論社)を参考にしています.さて,ベルヌーイ確率関数は以下のように定式化できます.

 

ここで, の省略形です.この省略形の式は,ある個人iのxがある値をとる時,その個人iの値yが1となる時の確率という意味です.1との間の縦線はその線の右側の値で条件づけた時に左側がどうなるか,という感じのニュアンス,Prは確率(Probability)のことです.そして,肝心のの式について訳していくと,はxで条件づけられた時のyの関数は…となります.fは関数(function)も意味.そして,右辺の第一項は先ほど説明した通り,二項のはy=0となる確率のことです.1か0かしか取り得ない確率の場合,例えば大学に行ける確率が80%なら,行けない確率は1-0.8=0.2で20%となります.引いては,0か1かしか取り得ない値の分布,つまりベルヌーイ分布は0になる確率と1になる確率の積で示すことができるということです.そして,その期待値(平均)をとすると,

=1×+0×(1-)=

となります.ちなみに分散は,(1-と表すことができます.

 

さて,最小2乗法でもそうですが,よくある回帰分析ではこの平均を求めることが一般的な手続きで,様々な統計パッケージの出力も基本はこの平均値を出力してくれます(もちろん分散も).この期待値は先ほど何度もxを出していたようにふつうは変数で説明され下記のように表します.

となります.この意味は,を変数xとその係数βで説明しようくらいの意味です.そして,このの定式化によってロジット分析かプロビット分析か名前が変わりうるのです.これをロジスティック分布とする場合はロジット分析,標準正規分布とする場合はプロビット分析と言います.難しいテキストとのかけ橋のために丁寧に説明すると,ロジット分析では確率分布をベルヌーイ分布(二項分布)でリンク関数をロジスティック分布とする分析で,プロビット分析では確率分布をベルヌーイ分布(二項分布)でリンク関数を標準正規分布とする分析です.

確率分布とリンク関数とは?となる人もかなり多いと思いますので(私は最初チンプンカンプンだったので)説明すると,確率分布はいわゆる従属変数yがどういった分布に従うのか想定するもので,今回の例でいえば1か0かをとるので,こういった分布の場合にはベルヌーイ分布を用いることが最も一般的です(もちろん他の分布もありますが).ただし,当然ながら注目するyは平均と分散を持っているわけです(もし平均や分散,つまりはyの値に違いがなければその違いを予測しようという話にはならないわけなので).そしてこのyの値はもしかするとxの値によって変化しうるのです.具体的にはyの値はxの値によって直線的に上昇することもあれば,xが小さい時はyも小さいがxが大きくなるにつれてyが非直線的に急上昇することもある,という話です.直線的な変化を予測できる場合にはリンク関数は直線でよいわけですが(これを恒等リンク関数といいます.一般的なOSLの際はこれです),非直線的に上昇する場合には別の関数が必要です.二項選択モデルの時の代表的なリンク関数がロジスティック分布(ロジット分析),標準正規分布(プロビット分析)といいます.

 ここで話を少し戻して,先ほどのを微分したものがxの効果ですが(説明略),これを微分したものをとします.ここで,lは説明変数xのl番目の要素つまりはxの値であることを示します.ここでとても重要なことはxの効果を表すこの式に,lという添え字がついていることで,つまりはxの値によって係数βの値が変わりうるということです.これはOLSとの大きな違いです.少しくどいですが丁寧に説明すると,これはxのどの値で偏微分するかによってβの値が変わるということ,それはOLSが線形であり二項選択モデルが非線形であるから,という理由です.また,これに合わせて,ロジット分析とプロビット分析の違いにも触れていくと,両者とも同様に非線形,つまりは関数が曲線なのですが,その曲線の形状(曲率)が違うために,同様にxが一単位増加した時(たとえばxが1→2に増加したとき)の係数値を比較することができないことになります(曲率の違いはネット検索で出てきます).

 さて,もう一度xの効果であるβについて考えてみます.また難しいテキストとの橋渡しのために,このxの効果を平均限界効果(marginal probability effect)と言います.限界〇〇は経済学の入門的な用語でつまりは一単位変化した時に注目する変数(ここではy)がどれくらい変化するか,というものです.先ほど述べたようにはl番目の要素によって限界効果が変わりうることを述べましたが,添え字iもあるので,iによっても限界効果が変わりうるのです.これをより簡単にいうと,例えば塾に通った年数が1年→2年の時と2年→3年の効果は同じ1単位でも違うし,しかも1年から2年通った時の効果は男性と女性という別の要素によっても変わりうることを示しています.そこで何とかして値を一意に評価する方法はないか,ということで,限界効果を次の2つの方法で評価することがあります.

 第一が平均限界効果(AMPE)です.次のように示します.

この式が示すことは,上記のすべての個人iの平均を限界効果として代表するという方法であり,そのためにn番目の個人の効果の合計をnで割っています.解釈としては,「xが1単位増加した時に全体として平均的にどう増加するか」を示します.

 次が期待限界効果(EMPE)という方法です.次のように示します.

EMPE=

これは,平均的なxをとる人の値が1単位増加した時の効果を示しています.

 

ちなみにstataでの平均限界効果の出力は,通常のロジット,プロビット分析の後に

margins,dyxy(*)

期待限界効果は,

margins,dyxy(*) atmeans

と入力します.