🎯 EV:普遍的な意思決定の公式

期待値(EV)とは、ある決断を何度も繰り返した場合の平均的な結果だ。合理的な意思決定において最も重要な概念:

$$EV = \sum_{i} P(\text{結果}_i) \times \text{価値}(\text{結果}_i)$$

または2つの結果の単純なケースでは:

$$EV = P(\text{勝ち}) \times \text{利益} - P(\text{負け}) \times \text{コスト}$$

すべての決断には期待値がある — 計算するかどうかに関わらず。EV思考の目標は、計算されたEVがプラスの決断をし、マイナスEVの決断を避けることだ。

なぜ結果 ≠ 決断の質なのか

これはポーカーからあらゆる場面に応用できる最も重要な教訓だ:良い決断が悪い結果を生むこともあり、悪い決断が良い結果を生むこともある。

例:信号を確認せずに道路を渡って生き延びた。結果は良かったが — その決断のEVは最悪だ。無事に帰宅した飲酒運転者は良い決断をしたのではなく、悪い決断が運良く良い結果になっただけだ。

ポーカープレイヤーの優位性

ポーカーは結果ではなくEVで決断を評価することを訓練する。10万ハンド後、このマインドセットは自動化される。これをポーカー以外に応用することで、結果から推論する人々に対して体系的な優位性を得られる。

🌍 現実世界でのEV計算

例1:就職オファーの判断

安定した年収800万円の仕事がある。スタートアップが成功した場合(確率30%)に5,000万円相当の株式、失敗した場合(70%)にゼロ、さらに在籍中は年収600万円を提示してきた。

安定した仕事のEV(4年間):\(4 \times 800\text{万} = 3{,}200\text{万円}\)

スタートアップのEV

$$EV_{\text{startup}} = 0.30 \times (600\text{万} \times 4 + 5{,}000\text{万}) + 0.70 \times 600\text{万} \times 4$$ $$= 0.30 \times 7{,}400\text{万} + 0.70 \times 2{,}400\text{万} = 2{,}220\text{万} + 1{,}680\text{万} = 3{,}900\text{万円}$$

スタートアップの方がEVが高い(4年で+700万円)。ただしリスクも重要 — ダウンサイド(低い給与)が耐えられない場合、純粋なEV計算だけでは状況全体を捉えられないこともある。

例2:保険

自動車保険が年間12万円。保険なしの場合、年間2%の確率で30万円の事故が発生する。

$$EV_{\text{保険なし}} = -0.02 \times 30\text{万} = -6{,}000\text{円/年}$$ $$EV_{\text{保険あり}} = -12\text{万円/年}$$

純粋なEVでは保険に入らない方が年6,000円得。しかし保険が合理的な理由:

  • 30万円の損失は財政的に壊滅的(効用は非線形)
  • リスク許容度が重要 — 分散の低減には実際の価値がある
  • これが合理的な人がマイナスEVにもかかわらず保険に入る理由だ

例3:勉強vs余暇

ポーカー戦略を1時間勉強すると、ウィンレートが0.1 bb/100改善するとする。毎時200ハンド、1bb=100円のステークスでは:

$$EV_{\text{勉強1時間}} = 0.1 \times 200 / 100 \times 100\text{円} = +20\text{円/プレイ時間}$$

将来1,000時間のプレイで:+20,000円。その1時間の「投資」には明確なプラスリターンがある。

複利効果

EVの改善は複利で積み重なる。ウィンレートが0.5 bb/100改善すると、1/2NLで毎時+50円。年間500時間では年+25,000円、毎年、一度の学習改善から。小さなEVの向上も時間をかければ小さくない。

📋 5ステップEV意思決定フレームワーク

1
ありうるすべての結果を特定する

各選択肢の現実的な結果を列挙する。楽観バイアス(メリットしか想像しない)も悲観バイアス(デメリットしか想像しない)も避ける。

2
正直な確率を割り当てる

基準率、データ、参照クラス予測を使用する。最も難しいパート — 人間はキャリブレーションされた確率推定が苦手で有名だ。

3
結果を正直に評価する

一貫した単位で利益と損失を定量化する。金銭的でない価値(時間、ストレス、人間関係)もできる限り含める。

4
各選択肢のEVを計算する

公式を適用する。EVで選択肢を比較する。分散も考慮する — 壊滅的なダウンサイドを持つ高EVの選択肢はリスク調整が必要かもしれない。

5
決断して結果から切り離す

最高EVの決断を実行する。結果が悪いこともあると受け入れる。決断の質をプロセスで判断し、結果で判断しない。

🧠 EV思考を破壊する認知バイアス

1. 損失回避

人間は損失を同等の利益の約2倍強く感じる(カーネマン&トベルスキー)。これがプラスEVのギャンブルを体系的に過小評価させる:

$$\text{知覚EV} \approx P(\text{利益}) \times \text{利益} - 2 \times P(\text{損失}) \times \text{損失}$$

結果:EVが明らかにプラスでも人々は頻繁に折りたたむ(ポーカーでも人生でも)。

2. 結果バイアス

プロセスではなく結果で決断を判断する。ポーカーの同等物:コールが正しかったのに、コインフリップを負けたからといってそのコールを批判すること。このバイアスは学習を妨げ、将来の意思決定の質を低下させる。

3. 利用可能性ヒューリスティック

鮮明または最近の結果を過大評価する。最近ひどい交通事故を見たなら、事故の確率を過大評価して保険に入りすぎる。最近悪いコールで勝ったなら、将来のコールのEVを過大評価する。

4. サンクコスト(埋没費用)の誤謬

将来のEV計算に過去のコストを含める。すでにポットに入れたチップは、コールがプラスEVかどうかとは無関係だ。人生では:「もうこんなに投資したから」という理由で悪いプロジェクトを続けるのは非合理だ。

$$EV_{\text{将来}} = P(\text{勝ち}) \times \text{将来の利益} - P(\text{負け}) \times \text{将来のコスト}$$

過去のコストは無関係だ。将来の確率とペイオフのみが重要。

最もコストの高いバイアス

サンクコスト思考はポーカープレイヤーに毎年何万円もの悪いコールで損をさせる。ポットにすでに入っているお金は消えた — あなたの決断は将来の期待リターンがコール額を正当化するかどうかについてだけだ。

⚠️ EVとリスク:調整が必要な場合

純粋なEV最大化はリスクを無視する。しかし合理的な主体は以下を考慮すべきだ:

限界効用の逓減

お金の効用は線形ではない。貯金500円の人にとっての1万円は、億万長者の1万円より価値がある。これが意味するのは:

  • 壊滅的な損失に対してはマイナスEVの保険でも受け入れる
  • 財政破綻のリスクを冒すプラスEVのベットは避ける
  • ケリー基準はこれを形式化する:富の最大化ではなく対数富を最大化する
$$\text{ケリー比率} = \frac{p \cdot b - (1-p)}{b}$$

\(p\) = 勝率、\(b\) = ネットオッズ。このバンクロール比率で賭けることで、破産を避けながら長期的な成長を最大化できる。

EV-リスクのトレードオフ表

状況 純粋EVが言うこと リスク調整後が言うこと
保険に入るNo(マイナスEV)Yes(壊滅的なダウンサイド)
宝くじを買うNo(マイナスEV)場合による(娯楽価値)
インデックスファンドに投資Yes(プラスEV)Yes(低分散、プラスEV)
起業する場合によるEV+かつダウンサイドが耐えられるならYes
AAでプリフロップオールインYes(最高EV)Yes(バンクロール次第)
ポーカープレイヤーの人生における優位性

ポーカーテーブルでのEV思考の年月は稀な精神的筋肉を鍛える:結果ではなくプロセスで決断を評価する能力、感情的な歪みなしに分散を受け入れる能力、恐れではなく確率に基づいて行動する能力。これはゲームの外でも真に価値がある。