最大後悔最小化基準
『ライブ・合理的選択論―投票行動のパラドクスから考える』という本では、市民の投票行動を読み解こうとする方法論がいろいろ紹介されています。そのなかで「最大後悔最小化基準」という言葉に興味をひかれました。
これは「市民は、最大の後悔を最小化するような行動を選択する」(p153)と見なす考え方です。ここで「後悔」とは「選択の前に状況を正しく理解していれば獲得しえたものと、選択によって実際に獲得したものの差額」と定義されています。
「ディシジョン・ツリーを作ってみる」で紹介したディシジョン・ツリーでは、将来を左右する不確定な要素が起きる確率を見積もりました。この本が論じているのは、そういった数字が一切手に入らない状況で、それでも決めなければいけないときにどう考えるか、という話です。
勉強がてら、先のノートで使ったチャートをもう一度引っ張り出して、この本の例を真似てみたいと思います。右端のカッコは、前回同様3年後の満足度です。
┌好景気 ─シナリオ1 (10)
┌起業する──○
│ └不景気 ─シナリオ2 (0)
□
│ ┌好景気 ─シナリオ3 (-1)
└起業しない─○
└不景気 ─シナリオ4 (5)
さて、起業した場合の後悔はどう計算できるか。
・起業して好景気になった(シナリオ1)としたら、「選択によって実際に獲得したもの」は満足度10です。「選択の前に状況を正しく理解していれば獲得しえたもの」(長いので「神の選択」と名付けます)はどうか。好景気が来ると分かっていれば起業したのでやはり満足度10。後悔はその差なのでゼロです。
・起業して不景気になった(シナリオ2)としたら、
後悔 = 実際の選択による満足度 – 神の選択による満足度(したがって値が小さいほど後悔が大きい)
= 0 – 5(神なら不景気になることを知っているのでシナリオ4を選ぶ)
= -5
したがって最大後悔は-5。
次に起業しない場合。
・起業しないで不景気になった(シナリオ4)としたら、上と同様の理屈で後悔はゼロ。
・起業しないで好景気になった(シナリオ3)としたら、
後悔 = 実際の選択による満足度 – 神の選択による満足度
= -1 – 10(神なら好景気になることを知っているのでシナリオ1を選ぶ)
= -11
したがって最大後悔は-11。
こんな感じでしょうか。合っているといいのですが……。
両者を比べると、最大後悔が小さいのは「起業する」ケースです。
上図のような満足度の分布ですと、計算をしなくても「最大の後悔を最小化するような行動」は選択できそうですね。シナリオ1の満足度が飛び抜けて高いので、もしこれを選ばずに失敗したら後悔は大きなものになりそうですから、それを選択するべきということになります。
もともと「最大後悔最小化基準」は、将来を左右する要素の起きる確率が分からない中での選択基準です。とすると、ひらたい表現でいうならば「将来がまったく読めないときは、思い切り大きな満足に賭けるべし」ということになって、これはまさに「後悔最小化理論」に通じるものがあります。
この「最大後悔最小化基準」、冒頭で引用した本によれば、統計学者レナード・サヴェジが考えたもので、別名を「サヴェジ基準」ともいうそうです。