人の好みは変わるに決まってるだろ

かなり気に入った文章を見つけた.論文の中のパラグラフ.理論の実証パフォーマンスが悪い理由の解釈を述べているもの.

A third general class of explanation for the results we obtained involves changing tastes. Just as the identification of traditional demand curves depends on the predominance of technological shocks relative to taste shocks, identification in models of the type estimated here depends on the maintained hypothesis of constant tastes. This is clearly a fiction. In every arena where taste shocks are easy to disentangle, fashion being an obvious example, they are pervasive. Even if the tastes of individuals were stable over time, the tastes of individuals of different ages differ, and the age distribution represented by the representative consumer has changed through time. An important topic for future research is the estimation of models that allow for changing tastes, either through random shocks, or endogenously on the basis of experience. The latter possibility relates closely to the problem of nonseparability in the utility function.

“Intertemporal Substitution in Macroeconomics,” by N. Gregory Mankiw (with Julio Rotemberg and Lawrence Summers), pp.249

ちょっと長いが,かなりこの文章好き.しかも,超有名論文でこれを見つけてうれしい.これは1985年にQJEで発表された,「GMM使えばこんなことできちゃうんだよ,すごいでしょ」ということが書かれた論文で,かなり有名.Mankiwは言わずとしれた一流のプロフェショナル・エコノミストだし,Summersは28歳でHarvardの教授になって財務長官とHarvard学長をやった天才.Rotemberg はよく知らん.この論文は,Classical Paperと言えるでしょう.あ,Claasical Paperとは,「みんなその論文を知っているが,誰も読んだことがない論文」と定義されます.

言っていることは,「人の好みは変わるに決まってるだろ」という一言に尽きます.何を当たり前な,と思うわれるかもしれませんが,通常,経済理論では「人の好みは不変」と考えます.専門的に言えば,「効用関数の形状(パラメータ)は不変」ということです.

理論経済学がそんなだから,計量経済学では一致性と仮説検定を重視するのだと僕は考えています.「理論なき計測はダメよ」という呪縛の根源でもあるんじゃなかろうか.

不変の経済構造があって,これはいつの時代も変わらなくって,そのとき,データが増えたら真理(真のパラメータの値)に確率収束するのだから,一致性は大事よ,というのが基本的な計量経済学のスタンスです.ところが,経済構造が不変でないのだったらどうでしょう.時系列の場合,サンプルサイズを大きくする=長いサンプル期間を考える,ということですが,経済構造が不変でなく変動するのであれば,「データを無限にとって,一致性を確保しよう」という主張は意味がなくなります.なぜならば,確率収束先となる真理(真のパラメータの値)がそもそも存在しないんですから(本当は,パラメータは時変なんですから),「サンプル期間を長くとって,サンプルサイズを増やせば漸近理論によれば,どんどん推定量はこのましい性質を持つはずだ(漸近的に真理を捉えられるはずだ)」という思考回路は無意味になってしまうからです.

大体,「サンプルサイズは5000あります,だから問題ありません」とか,逆に「サンプルサイズは50しかありません,だから問題あるかもです」とか,意味ない.数字の絶対値ではなく,あくまでの母集団との相対的な大きさが重要なのであるから.母集団が非常に大きければ,サンプルサイズは10000あったとしてもそれは小標本だし,母集団が小さければ,サンプルサイズは50でも問題はないかもしれないわけだから.

地方自治体の47のデータを全てつかって,「一致性あるからOLSしますよ」とか,何がしたいんだ.そのサンプル=母集団なんだから,「もう既に一致」してるはずだろう.それともあれですか,日本国を無限個の県に分割する日がやってくるとでもいいたいんですかそうですか.

話がそれてきましたが,人の好みが変わらないと想定し,あるモデルを作り,それを検証する.そのとき,計量経済学者は,
「その理論モデルが妥当する期間」を決めなければなりません.「この期間ならば,ファンダメンタルは変わらず,モデルの実証をするにふさわしいだろう」ということを決定しなけらばならない.

基本的に,人の好みは変わるし経済のファンダメンタルも時間を通じて変動しているはずなので,「ある時期は理論Aが支持され,ある時期では理論Bが支持されました」というのが,実際の経済なのだと思う.計量の論文で,いろいろと実証したけど,両論併記に近い結論しか出てこないのは,こういうことが原因だと思う.

さて,以上を踏まえれば「経済学とは,まったく正反対のことを言っている二人が,二人ともノーベル賞をとれる唯一の学問」というジョークも身にしみますね,あれしみませんか,僕はしみます.

さらに,仮説検定に計量経済学者はこだわるわけですが・・・.まぁ,僕も初めて仮説検定というものをならったときに,なんて科学的な分析なんだ,と感じた.それは,紛れのある背理法とでも言えばよいのだろうか,とにかく,厳密モデルが成り立ち得ない現実を分析する際の,すばらしい発想だと感じた.

でも結局,Type1 errorとType2 errorの間のトレードオフを,経済的損失に基づいて考慮し,最後は分析者の主観に基づき,有意水準を決定し,初めてこれは科学的な分析になるわけですが,実際にはみんな5%とか1%みたいなキリがいい数字を使っているだけですね.たまにうまくいかないと10%で有意と言い張ってみたり.あはは.それならば,6%有意水準で有意です,とか言ってみたい.このあたりのことは,『ノーベル賞経済学者の大罪』という本に詳しいです.

とにかく,有意水準の決定もテキトーにやっているのに,仮説検定にやたらこだわったり,サンプルサイズについてあまりよく考えない.いったん思考停止したら,最後は「一体なにをやってるんだ俺は」と計量ソフトがはじき出す数字におぼれるのみですね.5%とか1%って,根拠なく決められた有意水準をつかうならば,計量分析なんて人間の出る幕はなく,すべてコンピューターがやってくれるではないか.分析者の主観が混じるのは科学的ではないとかいうが,主観が混ざらない論文なんか読んだことがない.実際には多分に混じっているものなのです主観は.だからといってベイジアンほど楽観的にはなれませんが,しかし,ベイジアンにはかなり親近感を感じます.主観を堂々と混ぜるべきところは,結局,有意水準の決定でしょう.統計的有意ではなく,経済的有意な結論を出すには,損失関数の評価をどうするか,という分析者個人が主観で決めるべき
問題で,論文の主張の妥当性は,その主観的判断を,どの程度,他の人間もが同意できるか,で計測されるべきなのだろう.

・・・ときれいごとを述べまくってみましたが,現実はいつも甘くなく,業績出したかったら学界に溶け込むべくこの世界のルールに従いみんなと同じことをやれ,ということになってしまいますね.

経済学者は反省しなさい,と強烈なメッセージを送っている以下の本はオススメです.

ノーベル賞経済学者の大罪

この本にはかなり影響を受けました.でも,トンデモ本では決してなく,非常に優れた経済学者が書いた本です.

コメント

タイトルとURLをコピーしました