石川さんのご指摘 予測市場が「状態 $Z$ を当てる装置」としては成り立っているが、それが「不完備契約下で、努力 $e$ を正しく選ばせる装置」として完結していないこと。 ### 0. 以前のモデル - 投資 $e$ が成功確率 $π(e)$ を決める - 予測市場は $Z$ の確率を正しく集約する - 予測市場の価格 $p$ は情報を集約したシグナルとして使われる - 価格ベース契約は $(p, Z)$ に条件付いて移転を決める このモデルでは、石川さんの指摘通り - $e → Z$ の分布が変わる - $p$ は $Z$ に関する情報を反映する という統計的関係はあったものの、$e$ が私的情報であるため、$p$ と $Z$ をみても実際にどれだけ努力したかを検証する保証は得られなかった。 したがって解くべきなのは、事後に観察・執行可能な変数だけに基づいて均衡で望ましい $e^*$ を選ばせることとになる。予測市場は依然として、$Z$ の確率を集約する装置であるが、ここでは努力が期待支払いを通じて報われるように設計する必要がある。 ### 1. 完備契約で実現したい価値を定義する - 投資後に、各主体$i\in{S}$が持つ信念を $r_i := \Pr(Z=1\mid \mathcal e_i)$と書く。 - 実現したい継続価値をその信念の関数として $V_i:[0,1]\to \mathbb R$ で表す。 ### 2. $V(\mu)$を Bayes envelope に持つ proper scoring rule $S$ を設計する 二値アウトカムでは、$V$ が $凸$ なら $V$ をBayes envelopeに持つproper scoring rule $S(Z,p)$ を構成でき、信念 $r:=\Pr(Z=1\mid e)$ を持つ主体の最適報告が $p=\mu$ になる。 ここでいうBayes envelopeとは、あるスコアリングルールの下で信念 $\mu$ の主体が最適に報告したときにもらえる最大の期待スコアを $\mu$ の関数として集めたものである。 #### Bayes envelopeの定義 > 状態を$Z\in\{0,1\}$、価格を$p\in P:=[\varepsilon,1-\varepsilon]$とし、スコアを > $$ > S:\{0,1\}\times P\to\mathbb{R} > $$ > とする。信念を $\mu:=\Pr(Z=1)$ とすると、報告 $p$ のときの期待スコアは > $$ > \mathbb{E}[S(Z,p)\mid \mu]=\mu S(1,p)+(1-\mu)S(0,p). > $$ > この期待スコアを $p$ について最大化した値 > $$ > V(\mu):=\sup_{p\in P}\ \{\mu S(1,p)+(1-\mu)S(0,p)\} > $$ > をBayes envelopeと呼ぶ。 ### 3. 市場をMSR(Market Scoring Rule)として運用して、事後に清算する - 価格を $p\to q$ に更新した更新者は、成果 $Z$ が確定した後に $$S(Z,q)-S(Z,p)$$ を受け取る(負なら支払う)。 - properness により更新者は自分の信念に合わせて $q=\mu$ に動かすのが逐次最適になる。 > **補足**: なぜMSRを使うのか? LMSRを用いると、真実報告時の最大期待スコア(Bayes envelope)は特定の形 $$V_{\log}(\mu)$$ に固定される。したがって、私たちが実現したい継続価値が $$V^{\text{target}}(\mu)=aV_{\log}(\mu)+c\qquad(a>0)$$ のように正のスケール+定数で一致するなら、LMSRでも本質的に同じ目的を達成できる。 しかし、別ページの論文原稿で定義したベンチマーク由来の $V^{\text{target}}$ は、completion の上包絡として $$V^{\text{target}}(\mu)=\max_k\{(1-\mu)w(0,k)+\mu w(1,k)\}$$ のように区分線形になりやすく、一般に $V_{\log}$ と同型にならない。 このため、ベンチマークの形をそのまま実装したい場合には、一般のMSR(またはLMSR+top-upによる同値化)が必要になる。 ### 4. 努力 $e$ が期待支払いに入る - 努力$e$は、(i) 成功確率や、(ii) 私的シグナルの情報量を変えることで、取引時点の信念 $\mu(e)$ やその分布を変える - MSRでは、主体が取引直前価格$p$を$q$に更新したときの清算利得は $S(Z,q)-S(Z,p)$ である。信念 $\mu$ の下での期待利得は $$\mathbb{E}[S(Z,q)-S(Z,p)\mid \mu] =\mathbb{E}[S(Z,q)\mid \mu]-\mathbb{E}[S(Z,p)\mid \mu]$$ よって(外部利得が無い場合)propernessにより $q=\mu$ が逐次最適であり、そのときの最大期待利得は $$ D_V(\mu,p) := V(\mu)-\bigl[\mu S(1,p)+(1-\mu)S(0,p)\bigr] $$ で与えられる($D_V(\mu,p)\ge 0$、かつ$\mu=p$なら$D_V(\mu,p)=0$)。 さらに$V$が微分可能で、$S$が$V$から構成されている場合には $$ D_V(\mu,p)=V(\mu)-V(p)-V'(p)(\mu-p) $$ となり、これは$V$に対応するBregman divergenceである。 - したがって、真実更新が成立する均衡では、投資段階から見た「市場内利得(清算利得)」は一般に $$ \mathbb{E}\bigl[D_V(\mu_i(e),\,p_{\mathrm{pre},i}(e))\bigr] $$ の形で努力$e$に依存する ### 5. $e^*$ を投資ゲームの均衡として誘導する - 投資は2主体がそれぞれ選ぶので、実装目標は「ある契約・制度の下で、望ましい投資プロファイル $e^*=(e_B^*,e_S^*)$ が投資ゲームのナッシュ均衡になる」ことである。 - 具体的には、(真実更新が成立する)取引均衡を所与として、各主体 $i\in\{B,S\}$ の投資段階の縮約利得を $$U_i(e_B,e_S):=\lambda_i\,\mathbb{E}\bigl[D_V(\mu_i(e_B,e_S),\,p_{\mathrm{pre},i}(e_B,e_S))\bigr]+ t_i - c_i(e_i)$$ と書く($\lambda_i>0$は市場内利得の取り分係数、$t_i$は参加制約調整のための定数移転。)。 - このとき、$e^*$を均衡として誘導する条件は $$ e_i^*\in\arg\max_{e_i\in E_i}A\ U_i(e_i,e_{-i}^*) \qquad (i\in\{B,S\}) $$ である。設計変数は主に$(V,\lambda_B,\lambda_S,t_B,t_S)$であり、これらを調整して上の最適反応条件(および参加制約)を満たすようにする。 - ここで重要なのは、契約として $e$ に条件付ける必要がないことである。裁判所が観測・執行するのは最終価格 $p$ と成果 $Z$ に条件付く移転、および定数移転のみで十分である。一方、MSRに基づくスコア差分 $S(Z,q)-S(Z,p)$ の清算は、市場制度(マーケットメーカー)が取引ログに基づいて担保の範囲で自動的に行えるため、裁判所が取引ログ自体を検証して執行する必要はない。 ### 6. 限界条件と注意(outside incentive と properness) - もし努力が情報・成功確率を変えず、$\mu_i(e)$ の分布が不変なら、$\mathbb{E}[D_V(\mu_i(e),p_{\mathrm{pre},i}(e))]$も不変となり、市場内利得だけでは努力誘因を作れない。 - また、最終価格$p$に依存する外部利得(例:契約移転$\tau_i(p,Z)$)があると、取引者の逐次目的関数は $$\max_{q\in P}\ \Bigl\{\mathbb{E}[S(Z,q)-S(Z,p_{\mathrm{pre}})\mid \mathcal{I}]+ \mathbb{E}[\tau_i(q,Z)\mid \mathcal{I}]\Bigr\}$$ となり、一般には$q=\mu$(properness)が崩れ得る。 - 対処は大きく2通りある: 1. **歪みを許容して上界で管理する**:$\mathbb{E}[\tau_i(q,Z)\mid\mathcal{I}]$ の $q$ 感度を小さく抑える(あるいは有界と仮定する)ことで、$|q-\mu|$を$O(\kappa/b)$ で上から抑え、近似実装として扱う(あなたの原稿の第5–6章のロジック)。 2. **外部利得をスコアに吸収してpropernessを設計で回復する**:外部の $p$ 依存利得を別建てで与えるのではなく、(マーケットメーカーが清算する)スコアリングルール自体を調整して、更新者の純利得があるproper scoring ruleの差分になるようにする。すなわち、ある合成スコア $\widetilde S$ を用意して更新者に $\widetilde S(Z,q)-\widetilde S(Z,p_{\mathrm{pre}})$ を与える形に統一すれば、(外部利得が無いのと同様に)propernessは構成上確保される。 1/27