日常のEV思考 — ポーカー以外にも使える意思決定フレームワーク

🎯 EV：普遍的な意思決定の公式

期待値（EV）とは、ある決断を何度も繰り返した場合の平均的な結果だ。合理的な意思決定において最も重要な概念：

$$EV = \sum_{i} P(\text{結果}_i) \times \text{価値}(\text{結果}_i)$$

または2つの結果の単純なケースでは：

$$EV = P(\text{勝ち}) \times \text{利益} - P(\text{負け}) \times \text{コスト}$$

すべての決断には期待値がある — 計算するかどうかに関わらず。EV思考の目標は、計算されたEVがプラスの決断をし、マイナスEVの決断を避けることだ。

なぜ結果 ≠ 決断の質なのか

これはポーカーからあらゆる場面に応用できる最も重要な教訓だ：良い決断が悪い結果を生むこともあり、悪い決断が良い結果を生むこともある。

例：信号を確認せずに道路を渡って生き延びた。結果は良かったが — その決断のEVは最悪だ。無事に帰宅した飲酒運転者は良い決断をしたのではなく、悪い決断が運良く良い結果になっただけだ。

ポーカープレイヤーの優位性

ポーカーは結果ではなくEVで決断を評価することを訓練する。10万ハンド後、このマインドセットは自動化される。これをポーカー以外に応用することで、結果から推論する人々に対して体系的な優位性を得られる。

🌍 現実世界でのEV計算

例1：就職オファーの判断

安定した年収800万円の仕事がある。スタートアップが成功した場合（確率30%）に5,000万円相当の株式、失敗した場合（70%）にゼロ、さらに在籍中は年収600万円を提示してきた。

安定した仕事のEV（4年間）：$4 \times 800\text{万} = 3{,}200\text{万円}$

スタートアップのEV：

$$EV_{\text{startup}} = 0.30 \times (600\text{万} \times 4 + 5{,}000\text{万}) + 0.70 \times 600\text{万} \times 4$$ $$= 0.30 \times 7{,}400\text{万} + 0.70 \times 2{,}400\text{万} = 2{,}220\text{万} + 1{,}680\text{万} = 3{,}900\text{万円}$$

スタートアップの方がEVが高い（4年で+700万円）。ただしリスクも重要 — ダウンサイド（低い給与）が耐えられない場合、純粋なEV計算だけでは状況全体を捉えられないこともある。

例2：保険

自動車保険が年間12万円。保険なしの場合、年間2%の確率で30万円の事故が発生する。

$$EV_{\text{保険なし}} = -0.02 \times 30\text{万} = -6{,}000\text{円/年}$$ $$EV_{\text{保険あり}} = -12\text{万円/年}$$

純粋なEVでは保険に入らない方が年6,000円得。しかし保険が合理的な理由：

30万円の損失は財政的に壊滅的（効用は非線形）
リスク許容度が重要 — 分散の低減には実際の価値がある
これが合理的な人がマイナスEVにもかかわらず保険に入る理由だ

例3：勉強vs余暇

ポーカー戦略を1時間勉強すると、ウィンレートが0.1 bb/100改善するとする。毎時200ハンド、1bb=100円のステークスでは：

$$EV_{\text{勉強1時間}} = 0.1 \times 200 / 100 \times 100\text{円} = +20\text{円/プレイ時間}$$

将来1,000時間のプレイで：+20,000円。その1時間の「投資」には明確なプラスリターンがある。

複利効果

EVの改善は複利で積み重なる。ウィンレートが0.5 bb/100改善すると、1/2NLで毎時+50円。年間500時間では年+25,000円、毎年、一度の学習改善から。小さなEVの向上も時間をかければ小さくない。

📋 5ステップEV意思決定フレームワーク

ありうるすべての結果を特定する

各選択肢の現実的な結果を列挙する。楽観バイアス（メリットしか想像しない）も悲観バイアス（デメリットしか想像しない）も避ける。

正直な確率を割り当てる

基準率、データ、参照クラス予測を使用する。最も難しいパート — 人間はキャリブレーションされた確率推定が苦手で有名だ。

結果を正直に評価する

一貫した単位で利益と損失を定量化する。金銭的でない価値（時間、ストレス、人間関係）もできる限り含める。

各選択肢のEVを計算する

公式を適用する。EVで選択肢を比較する。分散も考慮する — 壊滅的なダウンサイドを持つ高EVの選択肢はリスク調整が必要かもしれない。

決断して結果から切り離す

最高EVの決断を実行する。結果が悪いこともあると受け入れる。決断の質をプロセスで判断し、結果で判断しない。

🧠 EV思考を破壊する認知バイアス

1. 損失回避

人間は損失を同等の利益の約2倍強く感じる（カーネマン＆トベルスキー）。これがプラスEVのギャンブルを体系的に過小評価させる：

$$\text{知覚EV} \approx P(\text{利益}) \times \text{利益} - 2 \times P(\text{損失}) \times \text{損失}$$

結果：EVが明らかにプラスでも人々は頻繁に折りたたむ（ポーカーでも人生でも）。

2. 結果バイアス

プロセスではなく結果で決断を判断する。ポーカーの同等物：コールが正しかったのに、コインフリップを負けたからといってそのコールを批判すること。このバイアスは学習を妨げ、将来の意思決定の質を低下させる。

3. 利用可能性ヒューリスティック

鮮明または最近の結果を過大評価する。最近ひどい交通事故を見たなら、事故の確率を過大評価して保険に入りすぎる。最近悪いコールで勝ったなら、将来のコールのEVを過大評価する。

4. サンクコスト（埋没費用）の誤謬

将来のEV計算に過去のコストを含める。すでにポットに入れたチップは、コールがプラスEVかどうかとは無関係だ。人生では：「もうこんなに投資したから」という理由で悪いプロジェクトを続けるのは非合理だ。

$$EV_{\text{将来}} = P(\text{勝ち}) \times \text{将来の利益} - P(\text{負け}) \times \text{将来のコスト}$$

過去のコストは無関係だ。将来の確率とペイオフのみが重要。

最もコストの高いバイアス

サンクコスト思考はポーカープレイヤーに毎年何万円もの悪いコールで損をさせる。ポットにすでに入っているお金は消えた — あなたの決断は将来の期待リターンがコール額を正当化するかどうかについてだけだ。

⚠️ EVとリスク：調整が必要な場合

純粋なEV最大化はリスクを無視する。しかし合理的な主体は以下を考慮すべきだ：

限界効用の逓減

お金の効用は線形ではない。貯金500円の人にとっての1万円は、億万長者の1万円より価値がある。これが意味するのは：

壊滅的な損失に対してはマイナスEVの保険でも受け入れる
財政破綻のリスクを冒すプラスEVのベットは避ける
ケリー基準はこれを形式化する：富の最大化ではなく対数富を最大化する

$$\text{ケリー比率} = \frac{p \cdot b - (1-p)}{b}$$

$p$ = 勝率、$b$ = ネットオッズ。このバンクロール比率で賭けることで、破産を避けながら長期的な成長を最大化できる。

EV-リスクのトレードオフ表

状況	純粋EVが言うこと	リスク調整後が言うこと
保険に入る	No（マイナスEV）	Yes（壊滅的なダウンサイド）
宝くじを買う	No（マイナスEV）	場合による（娯楽価値）
インデックスファンドに投資	Yes（プラスEV）	Yes（低分散、プラスEV）
起業する	場合による	EV+かつダウンサイドが耐えられるならYes
AAでプリフロップオールイン	Yes（最高EV）	Yes（バンクロール次第）

ポーカープレイヤーの人生における優位性

ポーカーテーブルでのEV思考の年月は稀な精神的筋肉を鍛える：結果ではなくプロセスで決断を評価する能力、感情的な歪みなしに分散を受け入れる能力、恐れではなく確率に基づいて行動する能力。これはゲームの外でも真に価値がある。