# Green Circle 1手目だけUCB1のモンテカルロ法で自ターンをシミュレートするのが良さそう(ドローの部分がランダムなので) 自ターンだけのISMCTSでもいいけど とりあえず評価関数を作る必要がある 結果が確定的なアクションのノードまで展開するするMCTSがしたかったが、弱すぎた(プレイアウトのアクションはif文AIで決定的に行ってdrawはランダム) **結局やったのはif文によるルールベースでした!!!** ## 探索 * 相手のDEBTを全部draw_pileに入れてるので不当に有利になっとる * 増えたdebtはdiscardsに入れる? ## TODO * ☆6にできるならする * ぶつかってもCIできるならする * 最後の探索: debt、位置を考慮する(敵の前で占領できる材料マスが多いほうがいい) * 2周目以降がかなり探索の余地ありそうだな〜〜 * (リリースできるか,リリースできるときの負債,CI量,adminからの距離を評価値にすると良さそう) * debt - adminからの距離を最小にすると良さそう? * DAILY_ROUTINE中はREFACTORINGからTRAININGを取ったほうが良さそう * CONTINUS_INTEGRATIONよりDAILY_ROUTINEや! * は? * デッキにボーナス4未満のときはリリースしない,で弱くなってる可能性あり * 12個(30個)のアプリの負債/リリース化を1つのintに押し付ける ## DONE * CI対象の探索 * ターゲットアプリの材料 * 残りのアプリの材料 * アプリの材料になってないやつは要らない * 2周目,アプリの材料になってないマスには止まらない(☆4になってから?) * **BONUSを4枚automateするのが最優先事項っぽい!!!!** * TASK_PRIORITIZATIONで勝てるなら,やる * 残ってるカードを実装する * 隣接マスを通ったりadminを跨いだりして5枚目がリリース可能ならやる * 相手がautomateしてるタスクを取るのが良い * デッキにあるタスクも * 要調整 * 途中のリリース,自分がCIしたものが材料になってるappを残して置く優しさが必要かもしれん * score == 4で後ろにいてリリースできないならTRAININGに移動したほうがいい * TRAININGが材料じゃなくてもこれやってくれ!! * 5つ目がリリース可能ならadmin通っても良いようにする必要あり * ☆が枯渇したらCODE REVIEW取りに行ったほうがいい * **☆が手にあるときはCI取りにいけるけど,** * **CIが手にあっても☆は1ターンでは手に入らない** ## やめた * 後攻で2を取られたら圧縮型にする * 俺のほうが強い * 先手2→3→4に対して後手5→7→6→5で先手の必勝パターンの妨害 ## 評価値 * リリースしたアプリの数 * bonus ci * valid ci * 相手のvalid ci * debt * adminからの距離 * valid cards