owned this note
owned this note
Published
Linked with GitHub
# 人工知能対策
###### tags: `School`
## 年代
- **1946**年: **ENIAC** 誕生
- **1950**年: チューリングテスト by Turing
- キーボードの先は、人間か?機械か?
- 1956年: **ダートマス会議**
- 人工知能という言葉を名づける
- 1966年: **ELIZA** by Weisenbaum
- 患者との会話
- 1970年: SHRDLU by Winograd
- 積み木の世界
- 1976年: Newell & Simon
- 記号システム
## 深さ優先探索

| ステップ | オープンリスト | クローズドリスト |
|---------|-------------------------------|--------------------------|
| 1 | A | (空) |
| 2 | B, C | A |
| 3 | D, E, C | A, B |
| 4 | I, E, C | A, B, D |
| 5 | E, C | A, B, D, I |
| 6 | C | A, B, D, I, E |
| 7 | F, G, H | A, B, D, I, E, C |
| 8 | G, H | A, B, D, I, E, C, F |
| 9 | J, H | A, B, D, I, E, C, F, G |
| 10 | H | A, B, D, I, E, C, F, G, J|
| 11 | (空) | A, B, D, I, E, C, F, G, J, H|
## 幅優先探索

| ステップ | オープンリスト | クローズドリスト |
|---------|----------------------------------------|------------------------------------|
| 1 | A | (空) |
| 2 | B, C | A |
| 3 | C, D, E | A, B |
| 4 | D, E, F, G, H | A, B, C |
| 5 | E, F, G, H, I | A, B, C, D |
| 6 | F, G, H, I | A, B, C, D, E |
| 7 | G, H, I | A, B, C, D, E, F |
| 8 | H, I, J | A, B, C, D, E, F, G |
| 9 | I, J | A, B, C, D, E, F, G, H |
| 10 | J | A, B, C, D, E, F, G, H, I |
| 11 | (空) | A, B, C, D, E, F, G, H, I, J |
## 最適探索
- 予測値(ゴールからの距離)をつかわないでコストだけ
- オープンリストの最小コストノードを探索(ソートしてる)

| 行数 | オープンリスト | クローズドリスト |
|-----|---------------------------------|-------------------------------|
| 0 | S(0) | |
| 2 | A(2) B(6) | S(0) |
| 3 | C(3) B(4) | S(0) A(2) |
| 4 | B(4) E(5) D(8) | S(0) A(2) C(3) |
| 5 | E(5) D(8) F(8) | S(0) A(2) C(3) B(4) |
| 6 | D(6) F(8) G(10) | S(0) A(2) C(3) B(4) E(5) |
| 7 | G(7) F(8) | S(0) A(2) C(3) B(4) E(5) D(6) |
| 8 | F(8) | S(0) A(2) C(3) B(4) E(5) D(6) G(7) |
## 最良優先探索
- 予測評価値(ゴールからの距離)

| 行数 | オープンリスト | クローズドリスト |
|-----|-----------------------------------------|---------------------------------------|
| 0 | S(4) | |
| 2 | B(2) A(4) | S(4) |
| 3 | F(0) E(1) A(4) | S(4) B(2) |
| 4 | E(1) A(4) | S(4) B(2) F(0) |
| 5 | G(0) D(1) C(3) A(4) | S(4) B(2) F(0), E(1) |
| 6 | D(1) C(3) A(4) | S(4) B(2) F(0), E(1) G(0) |
## A*アルゴリズム
- コスト+予測値で評価

| 行数 | オープンリスト | クローズドリスト |
|-----|---------------------------------------------|-----------------------------------------------|
| 0 | S(4) | |
| 2 | A(4+2) B(2+6) | S(4) |
| 3 | B(2+4) C(3+3) | S(4) A(4+2) |
| 4 | C(3+3) F(0+8) E(1+9) | S(4) A(4+2) B(2+4) |
| 5 | E(1+5) F(0+8) D(1+8) | S(4) A(4+2) B(2+4) C(3+3) |
| 6 | D(1+6) F(0+8) G(0+10) | S(4) A(4+2) B(2+4) C(3+3) E(1+5) |
| 7 | G(0+7) F(0+8) | S(4) A(4+2) B(2+4) C(3+3) E(1+5) D(1+6) |
| 8 | F(0+8) | S(4) A(4+2) B(2+4) C(3+3) E(1+5) D(1+6) G(0+7)|
## 支配戦略均衡
- 支配戦略
- 相手の行動関係なく、その行動をしたら高い利得を得られる行動

## ミニマックス法
- βカット
- 評価値**最小化**局面の枝刈り
- αカット
- 評価値**最大化**局面の枝刈り
## ベイズ理論

## 状態遷移確率
- 状態から状態への移動を確率の行列で表す


## 情報量
- 確率pの事象の情報量
- 情報量 𝑏𝑖𝑡 = −log2 𝑝
- 情報量が大きい=良い
## 情報エントロピー

- 情報エントロピーが大きい=良くない
- 小さい方が利得が高く、質問数を減らせる
## Sigmoid関数の微分

## 自然言語処理
- 形態素解析
- 
- 構文解析
- 
- 意味解析
- 
- 文脈解析
- 
## tf-idf
- ある単語が、特定の文書に頻繁に現れ(tf)、かつ、他の文書に現れない珍しい単語である(dfの逆数)時、重要キーワードと考える
- tf
- 単語頻出度
- idf
- 文書出現頻度の逆数
## 強化学習
### 割引累積報酬

報酬の将来価値に割引率を掛け合わせたもの

#### 例

| | A | B | C | D | E|
| -- | -- | -- | -- | -- | -- |
| 方策 1 | 1.5 | 2 | 0 | 3 | 0 |
| 方策 2 | 1.75 | 1.5 | 0 | 3 | 0 |
### 行動価値関数

### 状態価値関数

### 最適価値関数

### Q 学習

#### 例

##### 1.
##### 2.