🎯 EV:普遍的な意思決定の公式
期待値(EV)とは、ある決断を何度も繰り返した場合の平均的な結果だ。合理的な意思決定において最も重要な概念:
$$EV = \sum_{i} P(\text{結果}_i) \times \text{価値}(\text{結果}_i)$$または2つの結果の単純なケースでは:
$$EV = P(\text{勝ち}) \times \text{利益} - P(\text{負け}) \times \text{コスト}$$すべての決断には期待値がある — 計算するかどうかに関わらず。EV思考の目標は、計算されたEVがプラスの決断をし、マイナスEVの決断を避けることだ。
なぜ結果 ≠ 決断の質なのか
これはポーカーからあらゆる場面に応用できる最も重要な教訓だ:良い決断が悪い結果を生むこともあり、悪い決断が良い結果を生むこともある。
例:信号を確認せずに道路を渡って生き延びた。結果は良かったが — その決断のEVは最悪だ。無事に帰宅した飲酒運転者は良い決断をしたのではなく、悪い決断が運良く良い結果になっただけだ。
ポーカーは結果ではなくEVで決断を評価することを訓練する。10万ハンド後、このマインドセットは自動化される。これをポーカー以外に応用することで、結果から推論する人々に対して体系的な優位性を得られる。
🌍 現実世界でのEV計算
例1:就職オファーの判断
安定した年収800万円の仕事がある。スタートアップが成功した場合(確率30%)に5,000万円相当の株式、失敗した場合(70%)にゼロ、さらに在籍中は年収600万円を提示してきた。
安定した仕事のEV(4年間):\(4 \times 800\text{万} = 3{,}200\text{万円}\)
スタートアップのEV:
$$EV_{\text{startup}} = 0.30 \times (600\text{万} \times 4 + 5{,}000\text{万}) + 0.70 \times 600\text{万} \times 4$$ $$= 0.30 \times 7{,}400\text{万} + 0.70 \times 2{,}400\text{万} = 2{,}220\text{万} + 1{,}680\text{万} = 3{,}900\text{万円}$$スタートアップの方がEVが高い(4年で+700万円)。ただしリスクも重要 — ダウンサイド(低い給与)が耐えられない場合、純粋なEV計算だけでは状況全体を捉えられないこともある。
例2:保険
自動車保険が年間12万円。保険なしの場合、年間2%の確率で30万円の事故が発生する。
$$EV_{\text{保険なし}} = -0.02 \times 30\text{万} = -6{,}000\text{円/年}$$ $$EV_{\text{保険あり}} = -12\text{万円/年}$$純粋なEVでは保険に入らない方が年6,000円得。しかし保険が合理的な理由:
- 30万円の損失は財政的に壊滅的(効用は非線形)
- リスク許容度が重要 — 分散の低減には実際の価値がある
- これが合理的な人がマイナスEVにもかかわらず保険に入る理由だ
例3:勉強vs余暇
ポーカー戦略を1時間勉強すると、ウィンレートが0.1 bb/100改善するとする。毎時200ハンド、1bb=100円のステークスでは:
$$EV_{\text{勉強1時間}} = 0.1 \times 200 / 100 \times 100\text{円} = +20\text{円/プレイ時間}$$将来1,000時間のプレイで:+20,000円。その1時間の「投資」には明確なプラスリターンがある。
EVの改善は複利で積み重なる。ウィンレートが0.5 bb/100改善すると、1/2NLで毎時+50円。年間500時間では年+25,000円、毎年、一度の学習改善から。小さなEVの向上も時間をかければ小さくない。
📋 5ステップEV意思決定フレームワーク
各選択肢の現実的な結果を列挙する。楽観バイアス(メリットしか想像しない)も悲観バイアス(デメリットしか想像しない)も避ける。
基準率、データ、参照クラス予測を使用する。最も難しいパート — 人間はキャリブレーションされた確率推定が苦手で有名だ。
一貫した単位で利益と損失を定量化する。金銭的でない価値(時間、ストレス、人間関係)もできる限り含める。
公式を適用する。EVで選択肢を比較する。分散も考慮する — 壊滅的なダウンサイドを持つ高EVの選択肢はリスク調整が必要かもしれない。
最高EVの決断を実行する。結果が悪いこともあると受け入れる。決断の質をプロセスで判断し、結果で判断しない。
🧠 EV思考を破壊する認知バイアス
1. 損失回避
人間は損失を同等の利益の約2倍強く感じる(カーネマン&トベルスキー)。これがプラスEVのギャンブルを体系的に過小評価させる:
$$\text{知覚EV} \approx P(\text{利益}) \times \text{利益} - 2 \times P(\text{損失}) \times \text{損失}$$結果:EVが明らかにプラスでも人々は頻繁に折りたたむ(ポーカーでも人生でも)。
2. 結果バイアス
プロセスではなく結果で決断を判断する。ポーカーの同等物:コールが正しかったのに、コインフリップを負けたからといってそのコールを批判すること。このバイアスは学習を妨げ、将来の意思決定の質を低下させる。
3. 利用可能性ヒューリスティック
鮮明または最近の結果を過大評価する。最近ひどい交通事故を見たなら、事故の確率を過大評価して保険に入りすぎる。最近悪いコールで勝ったなら、将来のコールのEVを過大評価する。
4. サンクコスト(埋没費用)の誤謬
将来のEV計算に過去のコストを含める。すでにポットに入れたチップは、コールがプラスEVかどうかとは無関係だ。人生では:「もうこんなに投資したから」という理由で悪いプロジェクトを続けるのは非合理だ。
$$EV_{\text{将来}} = P(\text{勝ち}) \times \text{将来の利益} - P(\text{負け}) \times \text{将来のコスト}$$過去のコストは無関係だ。将来の確率とペイオフのみが重要。
サンクコスト思考はポーカープレイヤーに毎年何万円もの悪いコールで損をさせる。ポットにすでに入っているお金は消えた — あなたの決断は将来の期待リターンがコール額を正当化するかどうかについてだけだ。
⚠️ EVとリスク:調整が必要な場合
純粋なEV最大化はリスクを無視する。しかし合理的な主体は以下を考慮すべきだ:
限界効用の逓減
お金の効用は線形ではない。貯金500円の人にとっての1万円は、億万長者の1万円より価値がある。これが意味するのは:
- 壊滅的な損失に対してはマイナスEVの保険でも受け入れる
- 財政破綻のリスクを冒すプラスEVのベットは避ける
- ケリー基準はこれを形式化する:富の最大化ではなく対数富を最大化する
\(p\) = 勝率、\(b\) = ネットオッズ。このバンクロール比率で賭けることで、破産を避けながら長期的な成長を最大化できる。
EV-リスクのトレードオフ表
| 状況 | 純粋EVが言うこと | リスク調整後が言うこと |
|---|---|---|
| 保険に入る | No(マイナスEV) | Yes(壊滅的なダウンサイド) |
| 宝くじを買う | No(マイナスEV) | 場合による(娯楽価値) |
| インデックスファンドに投資 | Yes(プラスEV) | Yes(低分散、プラスEV) |
| 起業する | 場合による | EV+かつダウンサイドが耐えられるならYes |
| AAでプリフロップオールイン | Yes(最高EV) | Yes(バンクロール次第) |
ポーカーテーブルでのEV思考の年月は稀な精神的筋肉を鍛える:結果ではなくプロセスで決断を評価する能力、感情的な歪みなしに分散を受け入れる能力、恐れではなく確率に基づいて行動する能力。これはゲームの外でも真に価値がある。