###### tags: `math`
# 価値関数の微分可能性
$\DeclareMathOperator{\real}{\mathrm{Re}}
\DeclareMathOperator{\cl}{\mathrm{Cl}}
\newcommand{\setK}{\mathbb{K}}
\newcommand{\setR}{\mathbb{R}}
\newcommand{\setC}{\mathbb{C}}
\newcommand{\onset}[1]{\mathrm{on} \;#1}$
次を満たす$C^1$級関数$g : \setR_x^d \times \setR_\alpha^d \to \setR$を考える:
1. $gは狭義凸関数$
2. $\forall \alpha \in \setR^d, \, \min_{x \in \setR^d} g(x,\alpha)が存在する$
1より、
$$
\forall \alpha \in \setR^d, \, \forall x \in \setR^d \quad
x \mapsto g(x,\alpha), \, \alpha \mapsto g(x,\alpha) : 狭義凸関数
$$
であることに注意する。
ここで、$\alpha \in \setR^d$に対して
$$\min_x g(x,\alpha) = g(x^*(\alpha), \alpha)$$
を満たすような$x^*(\alpha)$を考えると、$x^* : \setR^d \to \setR^d$はwell-definedな関数である(狭義凸性よりこれが分かる)。
次のような**価値関数**$V$を考える:
$$V(\alpha) := \min_x g(x,\alpha) = g(x^*(\alpha), \alpha)$$
本稿の主題は、この価値関数の微分可能性である。$x^*$の微分可能性が保証されれば、連鎖律より$V$は明らかに微分可能である。しかし、$x^*$の微分可能性は非自明である(例えば、陰関数定理を用いた議論が必要であろう)。今回は、$g$の凸性を利用することで、$x^*$の微分可能性を考えるまでもなく$V$の微分可能性が導かれることを確かめる。
---
## 補題
上記の設定の下で、$V$は凸関数である。
---
## 証明
暇があれば書きます。ちなみに証明は簡単。
---
## 定理
上記の設定の下で、$V$は$\setR^d$上で微分可能である。
---
## 証明
$\alpha_0 \in \setR^d$を任意にとり、この点での微分可能性を確かめる。$W : \setR^d \to \setR$を次のように定める:
$$
\bar{x}(\alpha) := x^*(\alpha_0) + \alpha_0 - \alpha, \quad
W(\alpha) := g(\bar{x}(\alpha), \alpha), \quad
(\alpha \in \setR^d)
$$
$\bar{x}$の定め方から、$W$は凸関数であり、かつ$C^1$級関数である。また、次が成り立つ:
$$W(\alpha) \ge V(\alpha) \, (\alpha \in \setR^d), \quad W(\alpha_0) = V(\alpha_0) \tag{1}$$
$V$の凸性より
$$
V(\alpha_0) \le \frac{1}{2}V(\alpha_0 - \varepsilon e_i) + \frac{1}{2} V(\alpha_0 + \varepsilon e_i) \quad
(\varepsilon > 0)
$$
が成り立つ。ただし、$e_i$第i成分が0の単位ベクトルである。子の不等式を変形すると、
$$
\frac{V(\alpha_0) - V(\alpha_0 - \varepsilon e_i)}{\varepsilon} \le \frac{V(\alpha_0 + \varepsilon e_i) - V(\alpha_0)}{\varepsilon}
\tag{2}
$$
を得る。よって、(1)、(2)より、
\begin{align}
\frac{W(\alpha_0) - W(\alpha_0 - \varepsilon e_i)}{\varepsilon}
&\le \frac{V(\alpha_0) - V(\alpha_0 - \varepsilon e_i)}{\varepsilon}\\
&\le \frac{V(\alpha_0 + \varepsilon e_i) - V(\alpha_0)}{\varepsilon}
\le \frac{W(\alpha_0 + \varepsilon e_i) - W(\alpha_0)}{\varepsilon}
\end{align}
が成り立つ。$W$の微分可能性より、上式で$\varepsilon \searrow 0$として
$$D^-_i V(\alpha_0) = D^+_i V(\alpha_0) = D_i W(\alpha_0)$$
を得る。ただし、$D^+_i, D^-_i$はそれぞれ第i成分に関する右偏微分/左偏微分、$D_i$は第i成分に関する偏微分としている。以上より、$V$は$\alpha_0 \in \setR^d$ですべての成分について連続偏微分可能である。
任意の$\alpha_0$に対して以上の議論が適用できるので、$V$は$\alpha_0$の近傍で$C^1$級の関数である。これより、$V$が$\alpha_0$で微分可能であることが示された(cf. 杉浦解析Ⅰ 定理5.3)。$\square$