# ТПР Биматричные игры
**Биматричная игра** – это игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)
**Ненулевая сумма** означает то, что выйгрыш игрока А может быть не равен проигрышу игрока Б
Записывается две платежные матрицы: 1 для игрока А, 2 - для игрока Б
Исход игры в матрицах А и Б находится на одинаковых позициях aik, bik

**равновесием Нэша** (называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения.
Далее рассматривается **Игра двух лиц, в которой одним из игроков является "природа"**
---
Два способа решений статистических игр:
1) Определение максимального выйгрыша по матрице выйгрышей
2) Определение минимального риска
Три степени неопределенности состояний групп:
1) стохастическая (вероятностная) - вероятности состояний природы qj известны или могут быть вычислены
2) вероятности qj заранее не известны, но могут быть оценены
3) полная неопределенность. Вероятности qj не могут быть оценены
При стохастической неопределенной используется Байесовский критерий
средний выйгрыш:
$$
\overline{s} = \max_i\sum_{j=1}^naijqj = \max_i\overline{s_i} = S_k\\
\overline{q} = \min_i\sum_{j=1}^nrijqj = \max_i\overline{r_i} = r_k\\
$$
Критерий Лапласа: частный случай байесовского критерия, когда все состояния "природы" равновероятны
$$
qj = \frac{1}{n}, j = \overline{1,n}\\
\overline{s_{лаплас}} = \min_i\frac{1}{n}\sum_{j=1}^nrij\\
$$
При полной неопределенности используется
1) критерий Вальза (максиминный критерий или критерий крайнего пессимизма) - игрок А придерживается принципа наибольшей осторожности (берется лучший из худших вариантов).
$$
\alpha = \max_i\min_jaij
$$
2. Критерий крайнего оптимизма (критерий азартного игрока)
$$
\beta = \max_i\max_jaij
$$
3. Критерий Сэваджа (критерий минимаксного риска)
$$
s = \min_i\max_jrij
$$
Составление матрицы риска (матрицы сожалений):
1) Найдем максимум в каждой строке.
$$
yi = max_i(\sum_j{xji})
$$
2) Рассчитаем значения риска для каждого элемента и составим из них новую матрицу
$$
r_{ij} = yi - aij\\
$$
4. Критерий Гурвица (критерий пессимизма-оптимизма)
$$
H = max_i\{\alpha{min_jaij} + (1 - \alpha)max_jaij\}\\
a\ в\ [0,1]
$$
a - коэффициент "пессимизма"
Если а = 0, то получаем критерий азартного игрока
Если а = 1, то получаем критерий Вальза
Если a заранее не известно, то берут а = 0.5
В случае стохановской неопределенности можно использовать критерий Ходжа-лемана??? - основанный на критериях Вальза и Байеса
$$
W = \max_j\{\alpha*\sum_{j=1}^naijqj + (1-\alpha)minaij\}\\
\alpha\ в \ [0,1]
$$
Если а = 0, получаем критерий Вальза
Если а = 1, получаем критерий Байеса
Если а не известно, берут а = 0.5
Пример:
Определить оптимальную стратегию с помощью 3 критериев:
$$
\begin{bmatrix}& П1 & П2 & П3 & П4\\A1 & 1 & 4 & 5 & 9\\A2 & 3 & 8 & 4 & 3\\A3 & 4 & 6 & 6& 2\end{bmatrix}
$$
Воспользуемся критерием вальдера
$$
\alpha = \max_j\{1,3,2\} = 3 (=> A_2)
$$
Воспользуемся критерием Севаджа
Переходим к матрице рисков
$$
R = \begin{pmatrix}3 & 4 & 1 & 0\\1 & 0 & 2 & 6\\0 & 2 & 0 & 7\end{pmatrix}\\
\overline{z} = \min_i{4,6,7} = 4 (=> A1)
$$
Воспользуемся критерием Гурвица (а = 0.5)
$$
H = \max_j\{\frac{1}{2}(1,3,2) + \frac{1}{2}(9,8,6)\} = \frac{1}{2}\{1 + 9, 3 + 8, 2 + 6\} = \frac{1}{2}{10,11,8} = 11 (=> A2)
$$
Так как большинство стратегий указало стратегию 2 как оптимальную:
1. Либо всегда используем 2 стратегию
2. Либо используем стратегию 2 в 2 раза чаще 1 стратегии
Составим вектор решений в смешанных стратегиях (2 способ)
$$
X_a = (\frac{1}{3}, \frac{2}{3}, 0)
$$
Пример 2:
Критерий лапласа для матрицы
$$
\begin{pmatrix}6 & 3 & 9 & 5\\3 & 4 & 5 & 13\\ 9 & 6 & 4 & 11\end{pmatrix}
$$
$$
W = max_j\{\frac{1}{4}\sum_jaij\} =\\ = max{\frac{1}{4}(6 + 3 + 9 + 5), \frac{1}{4}(3 + 4 + 5 + 13), \frac{1}{4}(9 + 6 + 4 + 11)} = \\max{\frac{23}{4}, \frac{25}{4}. \frac{30}{4}} = \frac{30}{4} (=> A3)
$$
Другими словами - берем строку, в которой сумма всех элементов максимальная
Пример 3:
Предприятие может выращивать картошку (A1), свеклу (A2), кукурузу (A3)
П1 - лето жаркое и сухое (q1 = 1/10)
П2 - лето сухое и прохладное (q2 = 2/10)
П3 - лето жаркое и с дождями (q3 = 5/10)
П4 - лето прохладное и дождливое (q4 = 2/10)
Платежная матрица (прибыль с 1 гектара):
$$
A = \begin{pmatrix}1 & 4 & 5 & 9\\3 & 8 & 4 & 3\\4 & 6 & 6 & 2\end{pmatrix}
$$
Воспользуемся критериев Бейеса
$$
\overline{s_1} = \frac{1}{10}1 + \frac{2}{10}4 + \frac{5}{10}5 + \frac{2}{10}9 = \frac{52}{10}\\
\overline{s_2} = \frac{1}{10}3 + \frac{2}{10}8 + \frac{4}{10}4 + \frac{2}{10}3 = \frac{45}{10}\\
\overline{s_3} = \frac{1}{10}4 + \frac{2}{10}6 + \frac{4}{10}6 + \frac{2}{10}2 = \frac{50}{10}\\
$$
По критерию Байеса эффективна стратегия 1
Похозжа-лемана (a = 1)
$$
W = max_j{\alpha*{sj} + (1 -\alpha)minaij} = max\frac{1}{2}\{5,2 + 1, 4,5 + 3, \}
$$