###### tags: `math` `research`
# 研究進捗 (株のみが取引される場合の離散モデル)
$\DeclareMathOperator{\real}{\mathrm{Re}}
\DeclareMathOperator{\cl}{\mathrm{Cl}}
\DeclareMathOperator{\argmin}{\mathrm{arg~min}}
\newcommand{\setZ}{\mathbb{Z}}
\newcommand{\setR}{\mathbb{R}}
\newcommand{\setC}{\mathbb{C}}
\newcommand{\setT}{\mathbb{T}}
\newcommand{\setF}{\mathbb{F}}
\newcommand{\probP}{\mathbb{P}}
\newcommand{\probQ}{\mathbb{Q}}
\newcommand{\expec}{\mathbb{E}}
\newcommand{\fieldF}{\mathcal{F}}
\newcommand{\barY}{\overline{Y}}
\newcommand{\barZ}{\overline{Z}}
\newcommand{\til}[1]{\widetilde{#1}}$
更新日:2021/10/3
# A. 株価過程が格子上を動く場合
株価過程は1次元非対称ランダムウォークであるとして、市場均衡価格問題の離散化を考える。
※以下、プレーヤー$a$に対して議論を進めるが、数式中のこの添え字は省略する。
## 1.設定
時間集合:$\setT := \{0, \dots, T\}$、確率空間:$(\Omega, \fieldF,\probP)$
次を満たす独立同分布列$(X_t)_{t=1}^T$をとる:
$$\probP(X_t = 1) = p, \quad \probP(X_t = -1) = 1-p \quad (p \in (0,1))$$
$(X_t)$により生成されるフィルトレーションを$\setF=\{\fieldF_t\}_{t=0}^T$と表記する。(つまり、$\fieldF_t := \sigma[X_1, \dots, X_t]$。)
そして、株価過程を
$$S_t := \sum_{u=1}^t X_u, \quad S_0 := 0$$
とおく。(株価がマイナスになってしまう可能性があるが、簡単のために今はこのような仮定をおく。)
終端時刻での収入(endowments)を$H \in L^\infty(\fieldF_T)$、投資戦略を有界な$\setF$-可予測過程$(\pi_t)_{t=1}^T$とする。そして、投資戦略$\pi = (\pi_t)$により得た時刻$t$での資産を
$$V_t(\pi) := \sum_{u=1}^t \pi_t (S_u-S_{u-1}) = \sum_u \pi_t X_u \quad (t=1,\dots,T)$$
とする。
## 2.リスク尺度を定めるBSΔE
$H+V_T(\pi)$の時刻$t$でのリスク評価を与える動的リスク尺度は、次のBSΔEの解により表現されるとする:
$$Y_t = -(H+V_T(\pi)) + \sum_{u=t}^{T-1} g(u,Z_u) - \sum_{u=t}^{T-1} Z_u (X_{u+1} - p) \tag{A-1}$$
ただし、ドライバー$g:\setT \setminus \{T\} \times \setR \to \setR$は次を満たす:
* $\forall t \in \setT \setminus \{T\}, \quad z \mapsto g(t,z):C^1級かつ狭義凸関数$
* $\forall t \in \setT \setminus \{T\}, \quad \min_{z \in \setR} g(t,z)が存在する$
---
**注意**
上のBSΔEの定め方だと、$p$に依存してリスク尺度が定まることになる。しかしながら、今回は株価を決定する$p$を定めるごとの最適戦略を考えたいので、上記の設定でも問題ないと考えている。
---
$V_t(\pi)$の形を利用してBSΔE(1)を変形すると、
$$Y_t + V_t(\pi) = -H + \sum_{u=t}^{T-1} [ g(u,Z_u) -\pi_{u+1} p ] - \sum_{u=t}^{T-1} (Z_u + \pi_{u+1}) (X_{u+1} - p) $$
を得る。よって、
$$\barY_t(\pi) := Y_t + V_t(\pi), \, \barZ_t(\pi) := Z_t + \pi_{t+1}, \, G(t,\pi,z) := g(t,z-\pi) - \pi p$$
とおけば、新しく得られたBSΔEは
$$\barY_t(\pi) = -H + \sum_{u=t}^{T-1} G(u,\pi_{u+1},\barZ_u(\pi)) - \sum_{u=t}^{T-1} \barZ_u(\pi) (X_{u+1} - p) \tag{A-2}$$
となる。このBSΔE(2)は[HPR]と同様の変形により得られたものである。
BSΔE(1)中で$X_{u+1} - p$の形が出てくるのは新たな(2)を得るためでもあるが、加えて、学部の卒研で読んでいた論文[ESC]で議論されているBSΔEの解の存在性に関する結果が応用できるというメリットもある。
## 3.各プレーヤーの最適戦略
比較定理が成り立つような仮定をBSΔE(2)のドライバー$G$が満たすとき、FOC(First Order Conditions)によって最適戦略が特徴づけられることを確かめる。(比較定理については後ほどまとめる。)
$G$のminimizer $\Pi_t(z)$を考える:
$$\Pi_t(z) := \argmin_{\pi \in \setR} G(t,\pi,z)$$
ドライバー$g$の仮定より、関数$\Pi$はwell-definedである。そして、$\Pi$について次が成り立つ:
$$\pi = \Pi_t(z) ~\Leftrightarrow~ \partial_\pi G(t,\pi,z) = 0 \quad (\forall t \in \setT \setminus \{0\}, \forall \pi \in \setR, \forall z \in \setR)$$
ただし、$\partial_z := \partial/\partial z$とした。上式の右辺を計算することで、
$$\pi = \Pi_t(z) ~\Leftrightarrow~
\partial_z g(t,z-\pi) = -p \quad
(\forall t \in \setT \setminus \{0\}, \forall \pi \in \setR, \forall z \in \setR) \tag{A-3}$$
を得ることができ、この(A-3)がFOCである。そして、比較定理より次の主張が得られる。
---
#### 定理A-1
$\til{G}(t,z) := G(t, \Pi_t(z), z)$とおく。ドライバー$\til{G}$を用いたBSΔEの解$(\til{Y}, \til{Z})$が存在したとする:
$$\til{Y}_t = -H + \sum_{u=t}^{T-1} \til{G}(u,\til{Z}_u) - \sum_{u=t}^{T-1} \til{Z}_u (X_{u+1} - p)$$
このとき、$\til{\pi}_t := \Pi_t(\til{Z}_t)$が最適戦略となる。$\square$
---
## 4.市場均衡価格の導出
### 4-1.
まず、representative agentを構成する上で重要となる補題を用意する。
---
#### 補題A-2
endowmentsが$H$のときの最適戦略が$\til{\pi}$ならば、endowmentsが$H+vS_T \, (v \in \setR)$のときの最適戦略は$\til{\pi} + v$となる。$\square$
---
#### 証明
endowmentsが$H$のときの最適戦略を$\til{\pi}$とする。また、戦略$\pi$を一つとって固定する。すると、$\barY(\pi)$を戦略$\pi$に対応する次のBSΔE
$$\barY_t(\pi) = -H + \sum_{u=t}^{T-1} G(u,\pi_{u+1},\barZ_u(\pi)) - \sum_{u=t}^{T-1} \barZ_u(\pi) (X_{u+1} - p) \tag{A-2}$$
の解としたとき、$\barY_0(\til{\pi}) \le \barY_0(\pi)$が成り立つ。
$v \in \setR$を一つとって固定する。
$$S_T = \sum_{u=0}^{t-1} X_{u+1} + \sum_{u=t}^{T-1} X_{u+1} \quad (t = 1, \dots, T)$$
であるから、
\begin{align}
\barY_t(\pi) &- v\sum_{u=0}^{t-1} X_{u+1} \\
&= -(H+vS_T) + \sum_{u=t}^{T-1} [g(u,\underline{\barZ_u(\pi) - \pi_{u+1}})- (\pi_{u+1}-v)p] - \sum_{u=t}^{T-1}(\barZ_u(\pi) - v)(X_{u+1} - p) \\
&= -(H+vS_T) + \sum_{u=t}^{T-1} [g(u,\underline{(\barZ_u(\pi)-v) - (\pi_{u+1}-v)})- (\pi_{u+1}-v)p] - \sum_{u=t}^{T-1}(\barZ_u(\pi) - v)(X_{u+1} - p) \\
&= -(H+vS_T) + \sum_{u=t}^{T-1} G(u, \pi_{u+1}-v, \barZ_u(\pi) - \pi_{u+1}) - \sum_{u=t}^{T-1}(\barZ_u(\pi) - v)(X_{u+1} - p)
\end{align}
これより、$(\barY_t(\pi) - vS_t, \barZ_t(\pi)-v)$は戦略$\pi -v$に対応する次のBSΔE((A-2)の終端条件を$-(H+vS_T)$に変えたもの)の解である:
$$\widehat{Y}_t(\pi) = -(H+vS_T) + \sum_{u=t}^{T-1} G(u,\pi_{u+1},\widehat{Z}_u(\pi)) - \sum_{u=t}^{T-1} \widehat{Z}_u(\pi) (X_{u+1} - p)$$
つまり、$\widehat{Y}_t(\pi-v) = \barY_t(\pi) - vS_t$である。以上の議論は最適戦略$\til{\pi}$に対しても同様である。以上より、
$$\widehat{Y}_0(\pi-v) = \barY_0(\pi)-vS_0 \ge \barY_0(\til{\pi})-vS_0 = \widehat{Y}_0(\til{\pi}-v)$$
であり、$\pi$は任意の戦略であったから、$\til{\pi}-v$はendowmentsが$H+vS_T$のときの最適戦略である。$\square$
この補題により、市場で売買されているデリバティブの数は0だと仮定しても一般性を失わないことが保証される(定理A-3)。定理を見る前に、用語の定義をしておく。(以下、$\mathbb{A}$を市場に参加するプレーヤー全体からなる集合とする。)
---
#### 定義
確率$p^* = \probP(X_1 = 1)$のもとで、均衡条件
$$\sum_{a \in \mathbb{A}} \til{\pi}^a_t \equiv n \quad (n \in \setR)$$
を満たす最適戦略$\til{\pi}^a \, (a \in \mathbb{A})$が存在するとき、$p^*$を**市場均衡確率**と呼ぶ$\square$
---
#### 定理A-3
このとき、任意の$n \in \setR$に対して、次の2つの条件における市場均衡価格は同じである:
1. 各プレーヤー$a \in \mathbb{A}$は終端時刻に収入$H^a$を受け取る。また、各プレーヤーの最適戦略$\til{\pi}^a$について、次の均衡条件が成り立つ:
$$\sum_a \til{\pi}_t \equiv n \quad (\forall t = 1, \dots, T)$$
2. 各プレーヤー$a \in \mathbb{A}$は終端時刻に収入$H^a + v^a S_T$を受け取る。ただし、$\sum_a v^a = n$。また、各プレーヤーの最適戦略$\til{\pi}^a$について、次の均衡条件が成り立つ:
$$\sum_a \til{\pi}_t \equiv 0 \quad (\forall t = 1, \dots, T)$$
$\square$
---
#### 証明
プレーヤー$a \in \mathbb{A}$を固定して考える。条件2において市場均衡確率$p^*$が定まり、その価格のもとでの最適戦略を$\til{\pi}^a$とする。すると、補題A-2よりendowmentsが$H^a$に変わったときの最適戦略は$\til{\pi}^a+v^a$となる。さらに、
$$\sum_a(\til{\pi}^a_t + v^a) = \sum_a \til{\pi}^a_t + \sum_a v^a \equiv n \quad (t = 1,\dots, T)$$
となり、条件1の均衡条件を満たす。以上より、条件1における市場均衡確率も$p^*$である。
以上の議論の逆も全く同様である。$\square$
### 4-2.representative agentの構成
以下、簡単のために市場のプレーヤーは2人だけ($\mathbb{A} = \{a,b\}$)とする。また、定理A-3の条件2のもとで議論を進める。
プレーヤー$a,b$の持つリスク尺度を定めるドライバーを$g^a,g^b$としたとき、representative agentのリスク尺度を定めるドライバー$g^{ab}$が
$$g^{ab}(t,z) := \inf_{x \in \setR} \left\{ g^a(t,z-x) + g^b(t,x) \right\}$$
で定まることを確かめる。ここで、仮定を1つ追加する。
---
#### 仮定
任意の$t$に対して、$z \mapsto g^{ab}(t,z)$は狭義凸関数で、
$$g^{ab}(t,z) := g^a(t,z-x^*) + g^b(t,x^*) $$
を満たすような$x^* \in \setR$が存在する。$\square$
---
#### 注意
上記のような仮定を満たすドライバーは存在して、実際、
$$g^a(t,z) = \frac{|z|^2}{2 \gamma_a} \quad (\gamma_a > 0)$$
などがある。
---
簡単な計算により、次の命題が得られる。
---
#### 命題A-4
任意の$z \in \setR$に対して、次が成り立つ:
$$x^* = \argmin_{x \in \setR} \left\{ g^a(t,z-x) + g^b(t,x) \right\} ~\Leftrightarrow~
\partial_z g^a(t,z-x^*) = \partial_z g^b(t,x^*)$$
$\square$
---
representative agentの最適戦略は、(次のBSΔE(A-4)に比較定理を適用できれば)各プレーヤーの最適戦略と同様にして導かれる(3章を参照)。つまり、representative agentが終端時刻に$H^a+H^b+nS_T$(参加者$a,b$のendowmentsを足し合わせたもの)だけもらえるとして、representative agentのリスク尺度を定めるBSΔE
$$\barY^{ab}_t(\pi^{ab}) = -(H^a+H^b+nS_T) + \sum_{u=t}^{T-1} G^{ab}(u,\pi^{ab}_{u+1},\barZ^{ab}_u(\pi^{ab})) - \sum_{u=t}^{T-1} \barZ^{ab}_u(\pi^{ab}) (X_{u+1} - p) \tag{A-4}$$
を考える。ただし、$G^{ab}(t,\pi,z) := g^{ab}(t,z-\pi) - \pi p$。すると、最適戦略を定めるFOC
$$\partial_z g^{ab}(t,z-\pi) = -p$$
を得ることができ、このFOCの$\pi$についての解を$\Pi^{ab}_t(z)$とおくと、representative agentの最適戦略$\til{\pi}^{ab}$は、ドライバー$\til{G}^{ab}(t,z) := G(t,\Pi^{ab}_t(z),z)$を用いた次のBSΔE
$$\til{Y}^{ab}_t = -(H^a+H^b+nS_T) + \sum_{u=t}^{T-1} \til{G}^{ab}(u,\til{Z}^{ab}_u) - \sum_{u=t}^{T-1} \til{Z}^{ab}_u (X_{u+1} - p)$$
の解を用いて$\til{\pi}^{ab}_t = \Pi^{ab}_t(\til{Z}^{ab}_t)$と表される。
## 5 本モデルの問題点
この先、[HPR]と同様に議論を進めるならば、「representative agentの最適戦略が$\til{\pi}^{ab} \equiv 0$となるように確率$p^*$を定める」といったことがしたい。しかし、(4)中で$\pi^{ab} \equiv 0$としても、
$$\barY^{ab}_t(0) = -(H^a+H^b+nS_T) + \sum_{u=t}^{T-1} G^{ab}(u,0,\barZ^{ab}_u(0)) - \sum_{u=t}^{T-1} \barZ^{ab}_u(0) ( \underline{X_{u+1} - p}) \tag{A-4'}$$
となり、(A-4')は依然として$p$に依存したBSΔEとなっている。ここでは、$p$に依存しないBSΔEを解いてから、その解を用いて均衡価格$p^*$を定めたいので、その手法を用いる際に(A-4')は使えないのである。
**↓定理A-5は未完成です↓**
---
#### 定理A-5
次のBSΔEを考える:
$$\barY^{ab}_t = -(H^a+H^b+nS_T) + \sum_{u=t}^{T-1} \overline{G}^{ab}(u,\barZ^{ab}_u) - \sum_{u=t}^{T-1} \barZ^{ab}_u (X_{u+1} - p) \tag{A-5}$$
ただし、$\overline{G}^{ab}(t,z) := g^{ab}(t,z)$($\overline{G}^{ab}$を導入する意味がないが、今後の議論との対応を分かりやすくこうする)。BSΔE(5)の解とFOCを利用して、
$$p^* := -\partial_z g^{ab} (t,\barZ^{ab}_t)$$
とおく(FOC中の$\pi$を0とした)。このとき、$p^*$は均衡条件
$$\til{\pi}^a_t + \til{\pi}^b_t \equiv 0$$
を満たす市場均衡価格となる。$\square$
---
#### 証明
まず、FOCの性質と$\overline{G}^{ab}$の定め方より、任意の戦略$\pi$に対して
$$\overline{G}^{ab}(t,\barZ^{ab}_t) = G(t,0,\barZ^{ab}_t) \le G(t,\pi_t,\barZ^{ab}_t)$$
が成り立つ。よって、$\til{\pi}^{ab} :\equiv 0$は確率$p^*$のもとでのrepresentative agentの最適戦略である。
そして、確率$p^*$のもとで各プレーヤー$a,b$の最適戦略$\til{\pi}^i \, (i=a,b)$がFOCによって定まる。つまり、
$$\partial_z g^i (t, z-\pi^i) = -p^* \quad (i = a,b) \tag{A-6}$$
の$\pi^i$についての解を$\Pi^i_t(z)$とおいて、ドライバー$\til{G}^i(t,z) := G(t,\Pi^i_t(z),z)$のBSΔE
$$\til{Y}^i_t = -(H^i + \frac{1}{2}S_T) + \sum_{u=t}^{T-1} \til{G}^i(u,\til{Z}^i_u) - \sum_{u=t}^{T-1} \til{Z}^i_u (X_{u+1} - p^*)$$
の解を用いて$\til{\pi}^i_t = \Pi^i_t(\til{Z}^i_t)$と表される。
主張を得るために、$\til{\pi}^{ab}_t = \til{\pi}^a_t + \til{\pi}^b_t$が成り立つことを確かめる。FOC(6)と命題A-4より、
$$g^{ab}(t, \til{Z}^a_t + \til{Z}^b_t - (\til{\pi}^a_t + \til{\pi}^b_t))
= g^a(t, \til{Z}^a_t - \til{\pi}^a_t) + g^b(t, \til{Z}^b_t - \til{\pi}^b_t)$$
これより、
$$G^{ab}(t,\til{\pi}_t^a+\til{\pi}_t^b, \til{Z}^a_t + \til{Z}^b_t) = G^a(t, \til{\pi}^a_t, \til{Z}^a_t) + G^b(t, \til{\pi}^b_t, \til{Z}^b_t)$$
となるので、
$$\barY^{ab}_t(\til{\pi}^a+\til{\pi}^b) := \til{Y}^a_t + \til{Y}^b_t, \quad \barZ^{ab}_t(\til{\pi}^a+\til{\pi}^b) := \til{Z}^a_t + \til{Z}^b_t$$
は$\pi^{ab}=\til{\pi}^a+\til{\pi}^b$のときのBSΔE(4)の解となる。
## モデルAの修正


## 価格過程が格子上の値をとるようにする意義
本研究は「金融商品の価格過程が格子上を動く」という仮定のもとで議論を進めようとしているが、この仮定の重要性を改めて考えたい。
例えば、[KPZ]では[HPR]と同様に株とデリバティブの2つが取り引きされている市場を考えて、デリバティブの市場均衡価格を求めている。ここで、株価をドリフト項を用いて価格過程を表現している:
$$S_{t+1} - S_t = S_t (\mu_t + \sigma_t X_t) \quad (\mu_t, \sigma_t:適当な条件を満たす過程) \tag{A}$$
つまり、[KPZ]において、価格過程は格子上を動くとは限らない。
本研究では(取引される商品数が2つのときに)各時刻で3方向に動く格子上のランダムウォークを考えるが、このランダムウォークを用いて(A)と同様に株価を定めれば、BSΔEの可解性を保ちながら[HPR]と同様の議論を展開することができるのではないだろうかと思う。もしこの手法で特に問題がなければ、本研究の主なアイデアである「価格過程それ自体を格子上ランダムウォークで表現する」ことの意義が曖昧になってしまう。
以上の事情で、私は現在「価格過程それ自体を格子上ランダムウォークで表現する」ことの理由が気になっている。今のところ、上記の理由として私が思い浮かべているのは次の2つである:
1. 現実世界において、価格は最小単位を持つから。
2. 価格が決められた格子上を動くと決まっている場合、数値計算をしたときに計算速度が速くなるから。
1を理由とする場合、$\setZ^2$のような形状の格子上の点と価格の値が対応するようにしたい。(以前、深澤先生がオフィスの黒板にメモしていたようなランダムウォークのことです。)
# B. 株価過程が格子上を動く仮定を外した場合
$S_t$が格子上を動くという仮定を外して、[HPR]とどうように均衡価格が求まることを確かめる。
※特に言及がない場合、記号や設定はモデルAのときと全く同様であるとする。
## 1.設定
株価過程について、終端時刻$T$での価格$S_T$は既に与えられているものとし、ある$(\Omega,\fieldF)$上の確率測度(リスク中立測度)$\probQ$に関してマルチンゲールとなるように定まっているものとする:
$$\expec^\probQ [S_{t+1} | \fieldF_t] = S_t \quad (t=0, \dots, T-1)$$
以下、**$S_t$が市場均衡価格となるような確率測度$\probQ$を見つけたい。**
ここで、$\fieldF_{t+1}$-可測な関数$F_{t+1}:\Omega \to \setR$を考える。Doob-Dynkinの補題より、あるBorel可測な関数$f:\setR \to \setR$が存在して、
$$F_{t+1} = f(X_1, \dots, X_{t+1})$$
が成り立つ。ここで、次のように$F_{t}^+, F_t^-$を定義する:
$$F_t^\pm := f(X_1, \dots, X_t, \pm 1)$$
そして、$(X_t)$は$\probP, \probQ$に関して独立同分布であり、次が成り立つとする:
$$\probP(X_t = \pm 1) = \frac{1}{2}, \quad \probQ(X_t = 1) = q, \quad \probQ(X_t = -1) = 1-q \quad (q \in (0,1))$$
1次元ランダムウォークを
$$ W_0 :=0, \quad W_t := \sum_{u=1}^t X_u$$
と定義し、株価のランダムネスの元と解釈する。(つまり、Bにおいても株価は二項モデルに従う。)
## 2.リスク尺度を定めるBSΔE
$H+V_T(\pi)$の時刻$t$でのリスク評価を与える動的リスク尺度は、次のBSΔEの解により表現されるとする:
$$Y_t = -(H+V_T(\pi)) + \sum_{u=t}^{T-1} g(u,Z_u) - \sum_{u=t}^{T-1} Z_u \Delta W_{u+1} \tag{B-1}$$
ただし、$\Delta W_{t+1} := W_{t+1} - W_t$とする。ここで、BSΔE(B-1)を変形するための準備を行う。
---
#### 補題 B-1 (マルチンゲール表現定理の特殊形)
$$m^\probQ := \expec^\probQ [\Delta W_t] = 2q - 1$$
とおく。このとき、次の方程式
$$\Delta S_t = \kappa_t^\probQ (\Delta W_t - m^\probQ)$$
を満たす$\setF$-可予測過程$(\kappa^\probQ_t)_{t=1}^T$が存在する。特に、$\kappa^\probQ_t$は次のように表現される:
$$\kappa^\probQ_{t+1} = \frac{(\Delta S_t)^+ - (\Delta S_t)^-}{2} \tag{B-2}$$
---
#### 証明
$\kappa^\probQ_{t+1}$は次の連立方程式の解として表現される:
$$\begin{cases}
(\Delta S_{t+1})^+ &= \kappa^{\probQ}_{t+1} (1 - m^\probQ) \\
(\Delta S_{t+1})^- &= \kappa^{\probQ}_{t+1} (-1 - m^\probQ)
\end{cases}$$
$S_t$が$\probQ$-マルチンゲールであることから、解が存在することに注意する。そして、解は(B-2)のように表される。$\square$
補題B-1の結果を用いると、$V_t(\pi)$は
$$V_t(\pi) = \sum_{u=o}^{t-1} \pi_{u+1} \Delta S_{u+1} = \sum_{u=0}^{t-1} \pi_{u+1} \kappa^\probQ_{u+1} \Delta W_{u+1} - \sum_{u=0}^{t-1} \pi_{u+1} \kappa^\probQ_{u+1} m^\probQ$$
と表すことができるので、BSΔE(B-1)は次のように書き直すことができる:
$$Y_t + V_t(\pi) = -H + \sum_{u=t}^{T-1} [ g(u,Z_u) +\pi_{u+1} \kappa^\probQ_{u+1} m^\probQ ] - \sum_{u=t}^{T-1} (Z_u + \pi_{u+1} \kappa^\probQ_{u+1}) \Delta W_{u+1} $$
よって、
$$\barY_t(\pi) := Y_t + V_t(\pi), \,
\barZ_t(\pi) := Z_t + \pi_{t+1} \kappa^\probQ_{u+1}, \,
G(t,\pi,z) := g(t,z-\pi \kappa^\probQ_{u+1}) - \pi \kappa^\probQ_{u+1} m^\probQ$$
とおけば、新しく得られたBSΔEは
$$\barY_t(\pi) = -H + \sum_{u=t}^{T-1} G(u,\pi_{u+1},\barZ_u(\pi)) - \sum_{u=t}^{T-1} \barZ_u(\pi) \Delta W_{u+1} \tag{B-3}$$
となる。
## 3.各プレーヤーの最適戦略
ここでの議論はモデルAと全く同様である。つまり、
$$\Pi_t(z) := \argmin_{\pi \in \setR} G(t,\pi,z)$$
と定義すると、$\Pi_t$はFOCの解として表現される:
$$\pi = \Pi_t(z) ~\Leftrightarrow~
\partial_z g(t,z-\pi \kappa^\probQ_{u+1}) = m^\probQ \quad
(\forall t \in \setT \setminus \{0\}, \forall \pi \in \setR, \forall z \in \setR) \tag{B-4}$$
#### 注意
1. モデルBでは、$G(t,\pi,z)$が確率変数となっているため、$\Pi_t(z)$も確率変数となる。
2. (B-4)を得るためには、$\kappa^\probQ_t \ne 0$である必要がある。つまり、(B-2)より$(\Delta S_t)^+ \ne (\Delta S_t)^-$でなければならない。
---
#### 定理B-2
$\til{G}(t,z) := G(t, \Pi_t(z), z)$とおく。ドライバー$\til{G}$を用いたBSΔEの解$(\til{Y}, \til{Z})$が存在したとする:
$$\til{Y}_t = -H + \sum_{u=t}^{T-1} \til{G}(u,\til{Z}_u) - \sum_{u=t}^{T-1} \til{Z}_u \Delta W_{u+1}$$
このとき、$\til{\pi}_t := \Pi_t(\til{Z}_t)$が最適戦略となる。$\square$
---
## 参考文献
[ESC] Robert J. Elliott, Tak Kuen Siu & Samuel N. Cohen: Backward stochastic difference equations for dynamic convex risk measures on a binomial tree, J. Appl. Probab., 52
pp. 771 - 785 (2015)
[HPR] U. Horst, T. Pirvu, & G. dos Reis: On securitization, market completion and equilibrium risk transfer, Math. Financ. Econ., 2, pp. 211-252 (2010)
[KPZ] M. Kwak, T. Pirvu, & H. Zhang: A multiperiod equilibrium pricing model, Journal of Applied Math., 2, pp. 1-14 (2014)