# 上期目標達成 # 1. リサーチャー # 最先端技術調査 ## ・機械学習技術の学術調査5本論文(最先端論文により、構想段階のサービスへの実装可能性をあげる) 達成率100% https://www.one-tab.com/page/YK4-9ba6SuOBLvvvA4Sx8w 1. Non-negative Matrix Factorization http://papers.nips.cc/paper/1861-algorithms-for-non-negative-matrix-factorization.pdf 2. Tensor Factorization https://pdfs.semanticscholar.org/16f7/2d1107b66f90f27dd19ae241fc1a528971a5.pdf 3. Biased Matrix Factorization https://www.cs.rochester.edu/twiki/pub/Main/HarpSeminar/Factorization_Meets_the_Neighborhood-_a_Multifaceted_Collaborative_Filtering_Model.pdf 4. Factorization Machines https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 5. Field-aware Factorization Machines for CTR Rediction https://www.csie.ntu.edu.tw/~cjlin/papers/ffm.pdf ## ・機械学習技術の記事15本(実際に使われている形での知見の収集や、当該コードを読むことによる実装への還元) 達成率400% 65本 https://www.one-tab.com/page/atqcGHQ0Ssi8t6NDWxn2Zw 長いため省略 ## ・会社外AI勉強会の参加2会議(社内で取得できない生の知見を収集、社の技術分野へのアピール) 達成率250% https://lapras.com/person 【Sansan×エムスリー】自然言語処理勉強会 https://sansan.connpass.com/event/125652/ Machine learning graph pitch #1 https://machine-learning-pitch.connpass.com/event/130083/ Machine Learning Production Pitch #2 https://machine-learning-pitch.connpass.com/event/125115/ CounterFactual Machine Learning勉強会 #1 https://cfml.connpass.com/event/128714/ # チームへの還元 ## ・ドキュメント執筆 Qiita 3本(会社外での情報を公開。社の技術力アピール、社内で不足した知見を社外から取り入れる、世間に公開されることでの執筆内容の質を担保) 達成率100% 3本執筆(うち2本限定公開) 1. 最新機械学習モデル HistGradientBoostingTreeの性能調査 インプレッション 22,929 エンゲージメント総数 1,313 リンククリック数 627 Good数 100 https://user-images.githubusercontent.com/17031124/63648220-63b6e400-c767-11e9-86a7-8ee02e86513d.png https://qiita.com/r2en/items/8c02cadd584e09fd2554 2. 機械学習モデルと結果を解釈する (LIME: Local Interpretable Model-agnostic Explainations) https://qiita.com/r2en/private/df8ef8410d19d7d0bb9d 3. 機械学習モデルと結果を解釈する(SHAP: SHapley Additive exPlanations) https://qiita.com/r2en/private/cd3b5f87440b19806431 ## ・会社内AI勉強会の定例開催主導 達成率100% 遠藤進捗提出率100% 04/02 〜 08/20現在まで継続 実施勉強会数16回 https://github.com/whitetokyo/machine-learning-study-group/wiki # 2. ソフトウェアエンジニアリング 現サービスの実装(主にFAQ等の自然言語処理とレコメンド) ## ・機械学習技術プロトタイプの5個の実装(NLPやレコメンドの多種アルゴリズムから本サービスの問題に適切なものを探す) 達成率200% 機械学習解釈性 LIME, SHAP, Feature Importance, Pertial Dependence, Permucation Importance https://github.com/whitetokyo/machine-learning-study-group/tree/master/Endo/machine_learning_interpretability 推薦アルゴリズム PCA, NMF, NCF, FM https://github.com/whitetokyo/machine-learning-study-group/tree/master/Endo/clustering/unisys_poc/sentiment Google Cloud Natural Language APIを使用した自然言語処理分野における感情分析 https://github.com/whitetokyo/machine-learning-study-group/tree/master/Endo/clustering/unisys_poc/sentiment ## ・機械学習技術プロダクト1個の実装(プロトタイプ時選択された本サービスに適切だと思われたAI機能の本実装) (※運用上の判断により、本番に乗らない場合あり) 実装中につき達成率不明 Google Cloud Natural Language APIを使用した自然言語処理分野における感情分析 https://github.com/whitetokyo/machine-learning-study-group/tree/master/Endo/clustering/unisys_poc/sentiment 多方面の評価データの傾向から、人事評価を自動算出し、適切な人材配置を行う為の推薦 https://github.com/whitetokyo/machine-learning-study-group/tree/master/Endo/clustering/unisys_poc/sentiment 将来的なサービスに向けた挑戦的な実装 ## ・Kaggle 2コンペティション(構想前のサービスに対し、生存率分析によるターゲティング、客層推定、販売効率の最大化、レコメンド、満足度推定、最適経路、リソース配分の最適化、広告効率の最大化、需要予測、などの弊社現在未着手領域且つ、今後着手可能性の高い技術への先行的な実装) 達成率100% Bitcoin Historical Data https://www.kaggle.com/mczielinski/bitcoin-historical-data https://github.com/whitetokyo/machine-learning-study-group/tree/master/Endo/kaggle/bitcoin 時系列データの学習(応用分野として、文章対話の生成、音素・音声認識、映像認識、統計的機械学習がある) RNN(再帰型ニューラルネットワーク), LSTM, ARIMA(自己回帰和分移動平均モデル) Titanic: Machine Learning from Disaster https://www.kaggle.com/c/titanic 機械学習解釈可能性(アルゴリズムが予測に至るために用いるプロセスを人間がどれだけ簡単に理解できるかを表す)LIME, SHAP, Feature Importance, Pertial Dependence, Permucation Importance # 3. AIプロジェクト進行 現サービスの主導及び、構想段階サービスの主導 ・機械学習プロジェクトの問題の定式化 ・機械学習の有無の判断 ・システム設計 ・アルゴリズム、モデル、評価の選定 ・学習リソースの収集方法 ・効果検証 達成率200% プロジェクト進行ロードマップ作成 ~/Desktop/0825/poc_ml_project 推薦システムをPoCで受注した時にかかる開発工数のシュミレーション作成 https://255255255.backlog.com/projects/AI_RECOMMEND_SAMPLE