バランス頻度の数学 — GTO的なベット/チェック比率の導出

無差別原理

GTO（ゲーム理論最適）プレイの核心には、ひとつの強力なアイデアがある：相手を無差別にすることだ。相手が無差別であれば、常にひとつのオプションを選ぶことで自分を搾取することができない——コールとフォールドのどんな組み合わせも同じEVをもたらす。

これはバランスのとれたレンジを構築することで実現する。常に強いハンドでベットし、弱いハンドで常にチェックすれば、相手はすべてのベットをフォールドしてすべてのチェックをコールすることで搾取できる。バランスのとれたレンジには正しい比率でバリューハンドとブラフの両方が含まれており、相手が有利に逸脱することができなくなる。

無差別条件： GTOの解では、2つのアクションが同じEVをもたらすとき、プレイヤーはそのアクション間で無差別になる。相手のコールEVとフォールドEVが等しくなる正確な頻度でミックスすることでこれを実現する。

最適ブラフ頻度の導出

リバーのスポットを考えよう。ポット $P$ にベット $B$ をする。相手はコールかフォールドを選ぶ必要がある。相手が無差別になるためには、コールのEVがフォールドのEVと等しくなければならない。

フォールドのEV ＝ 0（ポットを諦める）。コールのEV：

$$\text{EV}_{\text{コール}} = P(\text{ブラフ}) \times (P + B) - P(\text{バリュー}) \times B$$

$\text{EV}_{\text{コール}} = 0$ に設定し、$x$ ＝ベットのうちブラフの割合とすると：

$$x(P + B) = (1-x)B$$ $$x \cdot P + x \cdot B = B - x \cdot B$$ $$x \cdot P = B(1 - 2x)$$

$x$ について解くと：

$$x = \frac{B}{P + 2B}$$

ポットサイズベット（$B = P$）の場合：

$$x = \frac{P}{P + 2P} = \frac{1}{3} \approx 33\%$$

ポットサイズベットの3回に1回はブラフにして相手を無差別にする。ハーフポットベット（$B = P/2$）の場合：

$$x = \frac{P/2}{P + P} = \frac{1}{4} = 25\%$$

ベットサイズ（ポット比）	最適ブラフ割合	バリュー：ブラフ比率
33%ポット	20%	4:1
50%ポット	25%	3:1
75%ポット	30%	7:3
100%ポット	33%	2:1
150%ポット	37.5%	5:3

レンジからのベット頻度

バランス頻度はベット全体のレート（ベット内のブラフ比率だけでなく）も決定する。ベットしすぎると、チェックレンジが弱すぎて相手が有利にプローブできる。ベットしなすぎると、ベットレンジが強すぎて相手が自動的にフォールドしすぎる。

最適なベット頻度はレンジ構成によって異なる。あるボードで自分のレンジが以下を含むとする：

強いバリューハンド（レンジ上位20%）：ほぼ常にベット
ミディアムハンド（中位40%）：ミックス——プロテクションのためのベット、またはエクイティ実現のためのチェック
弱いハンド・エア（下位40%）：一部をブラフに使い、残りはチェック

総ベット頻度はチェックレンジを防衛可能に保つべきだ。大まかなガイドライン：レンジの $x\%$ をベットする場合、チェックレンジにはプローブに対する保護として強いハンドが十分含まれている必要がある。一般的にGTOソルバーはほとんどのフロップで40〜70%のベット頻度を出力する。

アルファ式とMDF

アルファ（$\alpha$）式は、純粋なブラフを不利にするためにコーラーが必要とする最低ディフェンス頻度（MDF）を与える：

$$\alpha = \frac{B}{P + B}$$

これはコーラーがコールしなければならないハンドの割合（またはブラフが成功したときに得るポットの割合）だ。最低ディフェンス頻度（MDF）は：

$$\text{MDF} = 1 - \alpha = \frac{P}{P + B}$$

MDFはディフェンダーがブラフを損益分岐点にするために守らなければならないハンドの割合（コールまたはレイズ）だ。ディフェンダーが $\alpha$ 以上フォールドすれば、ブラフは自動的に利益を生む。

ベットサイズ	アルファ（α）	MDF（1−α）
25%ポット	20%	80%
33%ポット	25%	75%
50%ポット	33%	67%
75%ポット	43%	57%
100%ポット	50%	50%

アルファとブラフ頻度は連動している： ベット側から見た最適ブラフ頻度と、コール側から見たアルファ/MDFは同じコインの両面だ。両プレイヤーがGTOでプレイすると、どちらも逸脱することでEVを改善できなくなる。

3つの計算例

例1：リバーのポラライズされたレンジ

設定： ポット＝\$100、\$100をベット（ポットサイズ）。自分のレンジはポラライズ：ナッツかコンプリートブラフのみ。 GTOブラフ頻度は？

$$\alpha = \frac{100}{100 + 100} = 50\%$$ $$\text{ブラフ頻度} = \frac{B}{P + 2B} = \frac{100}{300} = 33\%$$

3回のベットのうち、2回はバリューで1回はブラフ。相手は50%の確率でコールしなければならない（MDF＝50%）。相手がちょうど50%コールすれば、ブラフは損益分岐点でバリューベットは最大限の利益を生む。

例2：75%ポットベットのターンバランスレンジ

設定： ポット＝\$80、\$60をベット（75%ポット）。レンジに21コンボのバリューがある。GTOのブラフコンボ数は？

$$\text{ブラフ比率} = \frac{B}{P + 2B} = \frac{60}{80 + 120} = \frac{60}{200} = 30\%$$

ベットの30%がブラフ、70%がバリュー。ブラフコンボ数＝ $\frac{0.30}{0.70} \times 21 = 9$ コンボ。バランスのとれたターンベットレンジは21バリュー＋9ブラフ＝合計30コンボとなる。

例3：フロップCベット頻度

設定： ドライボード（K72レインボー）でのPFR。レンジは強い（トップペア、オーバーペア、セット）。合計100コンボ。33%ポットのCベットでMDF＝75%。

Cベットレンジをバランスさせるには、ベットのブラフ%＝20%（上のテーブルより）。100コンボ中60コンボをCベットする場合：

バリューベット：60 × 0.80 ＝ 48コンボ（トップペア以上、セット、オーバーペア）
ブラフ：60 × 0.20 ＝ 12コンボ（バックドアドロー、トップペアなしのオーバーカード）

チェックする40コンボには、強いハンド（チェックレイズ保護のため）とミディアムストレングスのハンド（ターンのコールダウン用）の両方が含まれている必要がある。

実践での活用方法

ライブプレイでバランス頻度を適用することはロボットになることを意味しない。目標は数字通りにすべてのハンドをプレイすることではなく、搾取されないことだ。以下に実践的な活用方法を示す：

未知の相手に対して： 搾取されないよう、GTO頻度に近いプレイから始める。
フォールドしすぎる相手に対して： ブラフ頻度をGTO以上に増やす。MDFを超えてフォールドすれば、ブラフは自動的に利益を生む。
コールしすぎる相手に対して： ブラフ頻度をゼロに近づけ、バリューベット頻度とサイジングを増やす。
アルファをサニティチェックとして使う： ブラフをする前に、アルファを超えるフォールドが期待できるか問いかける。そうなら進む。そうでなければ再考する。

よくある間違い： 多くのプレイヤーは強いハンドをあまりにもチェックしなさすぎる。これによりチェックレンジが弱くなりすぎる。チェックした際に相手が有利にベットできないよう、常に一部の強いハンドをチェックレンジに含めること。