# 2020/02/07 AAAI 8:30 - 12:00 ## [FA1](https://aaai.org/Conferences/AAAI-20/aaai20tutorials/#fa1): AI in Precision Medicine: Towards Knowledge Empowered Intelligence over “Small” Data ### Presenter: Fei Wang(Associate Professor at Cornell University, Graduate School of Medical Science) - https://gradschool.weill.cornell.edu/faculty/fei-wang - https://scholar.google.com/citations?hl=en&user=FjCbjDYAAAAJ - 演者の代表作 - Patient Similarity Learning. - - [NSF EAGER Award](https://www.nsf.gov/awardsearch/showAward?AWD_ID=1650723&HistoricalAwards=false) from SCH on developing algorithms - NMRC Subaward on patient similarity and concussion - [AMIA TBI 2014 paper](http://astro.temple.edu/~tua87106/tbi14.pdf?cm_mc_uid=80787516868914601259403&cm_mc_sid_50200000=1477053377) on personalized treatment recommendation nominated for Marco Romani Award - [SDM 2011 paper ](https://pdfs.semanticscholar.org/f9b7/7a14efa2726ebb5061263ea3a31795276d96.pdf)on integrating multiple patient similarities selected as "Best of SDM" - Deep Learning in Health - [Winner of PPMI Data Challenge on Subtyping Parkinson's disease 2016](https://www.michaeljfox.org/foundation/publication-detail.html?id=625&category=7) - [ICDM 2016 paper](http://www.cs.uvm.edu/~icdm/Awards/BestPapers.shtml) on systematic study of the tradeoff between accuracy and runtime of deep learning models won Best Paper Runner-Up --------------- ## abstract and outline > **AI in Precision Medicine: Towards Knowledge Empowered Intelligence over "Small" Data** > > Artificial Intelligence (AI) technologies have demonstrated great promises in different areas of medicine in recent years, such as clinical decision support, drug discovery and development, healthcare insurance plan management, etc. Now we are in the era of precision medicine, with the goal of providing tailored treatment or management plans to individual patients. One big challenge of applying AI in precision medicine is "small data": typically we only have the data from a limited number of individuals (patients) to conduct our research. In this tutorial I will introduce the recent advances of knowledge empowered AI technologies that are particularly promising for precision medicine including knowledge integration, knowledge distillation and knowledge transfer, discuss the challenges and point out future directions. > > The outline of this model is as follows > > - Introduction (20 min) > > - - AI and big data > - Precision medicine and small data > - What can we do with limited data samples > > - Knowledge acquisition (40 min) > > - - Biomedical literature mining > - Knowledge graph construction > - Biomedical ontology/taxonomy mining > - Knowledge mining from other sources > > - Knowledge injection (30 min) > > - - Combination of knowledge graph and data-driven methods > - Bayesian methods > > - Knowledge Distillation (50 min) > > - - Interpretability: intrinsic vs. post-hoc > - Global explanation > - Local explanation > > - Knowledge Transfer (50 min) > > - - Multi-task learning > - Domain adaptation > - Meta-learning > > - Conclusions and discussions (20 min) > > - - Data quality > - Decision uncertainty > - Model stability > - Explanation reliability ### Abstract(和訳) - 人工知能(AI)技術は、近年、臨床意思決定支援、創薬および開発、医療保険計画管理など、医療のさまざまな分野で大きな将来性を示している - 個々の患者に合わせた治療または管理計画を提供することが目的とされ、様々な医療データに対してMLを使った研究がなされている - 医療に対してAIを適用する際の大きな課題の1つは「Small Data」 であることである。 - 通常、研究を行うには限られた数の個人(患者)からのデータしかないためである - このチュートリアルでは、知識の統合、知識の蒸留、知識の伝達など、精密医療に特に有望な知識を活用したAI技術の最近の進歩を紹介し、課題について議論し、将来の方向性を指摘している ### My motivation ### Knowledge acquisition (40 min) - 医療データは、個人差が大きいため、常にデータがうまく扱えているのかを注意する必要があ - Biomedical literature mining する際にグラフ構造を導入することが多い - Classifing Clinicall actonable genetic mutations(Nips2017 Competition)を例とする優勝者はグラフ構造を使用していたので使い方の参考になるかもね - biomedical では、data drivenアプローチでも知見獲得に注目されている - 統計検定では非効率的であるためMLの手法の適用が最近されている - 私達はbiomedicalな試薬試験データの整備から取り組んだベースラインモデルとしてBEATを使用し - 特徴量をうまく embedding できるから ### Sequence Representation - 製薬の場合でもEvent Sequential pattern mining が有効である - Event ベースは明らかに効果がわかるので薬の効果がわかりやすい - Eventベースでの分析方法の紹介 - シーケンシャルに扱う ### parkinson’s progression marker initiative(PPMI) - parkinson’s progression marker initiative(PPMI)データセットを使用して、パーキンソン病の進み具合をMLをつかって予想した例を紹介する #### methodology - 予測タスクは二種類 - どれくらい進んでいるか - パーキンソン病の種類の分類 - パーキンソン病患者から三ヶ月ごとに?バイオメーカの指標を取得したデータから、LSTM encoder -decoder modelを使用してクラスタリングを行った - 値のシークエンスをみたいからLSTMを使った - LSTMでモデリングし、モニタリングツールを作った - ヒストリートラッキングをすると、どういうポイントでクラスタリングでいるのかわかった(リーズニング的な感じ) - 医療的な知見とモデルのクラスタリングとが致しているかマッピングした - Nature Communication採択。Integrating biomedical researchー(2019)という論文で詳しく紹介している - https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6620318/ ### electronic health record (EHR) - EHRを使って病気との関連性を検討した事例を紹介する - 健康診断の結果とカルテが含まれているデータベースで300万人の情報が含まれている - 詳しくは https://www.healthit.gov/faq/what-electronic-health-record-ehr - 遺伝子情報から、単なるクラスタリングからBMIの傾向が予測できる?(リスニングミスった) - これもグラフ構造で書くことができる - 詳しくは論文読んで、といっているのに論文の略名もないのはなぜだ ## Knowledge Transfer - Multi-task learning, Domain adaptation, Meta-learningを事例に適応した例を紹介する - ヘルスケアデータはSmall data - 医療用画像データはたくさん手に入るけど、**なんらかの病気の患者のデータは倫理的プライバシーの観点より手に入りにくいので、スモールデータとしての扱いを考えないとMLの適用ができない** ### 医療画像での転移学習の適用例 - 一般の画像では、ラストレイヤーがたくさんのカテゴリーに分類されるけど、医用画像のらスレイヤーは分類カテゴリーがある程度決まっているからそのカテゴリ - 眼底画像の研究(これもCellに採択) - 画像にちゃんとアノテーションを行ってアテンションを与えたからCellに載ったよ - 皮膚がんクラスタリング - 皮膚がんの画像を130K使用して757種類のがんの種類をCNNで学習クラスタリングした - tSNE plotをするとうまくできていることがわかったけど、この予測モデルは誰が必要としているのか?医者は見れば判断がつくので、そのような観点も忘れてはいけない - 医用画像にとって良い訓練と悪い訓練モデルを判断するのは難しい ### meta learningを使用した例 ![](https://i.imgur.com/qIOp3nX.jpg) ### 脳情報系 - NNを使ったの脳のグラフニューラルネットワーク解析の紹介 ### AIのブラックボックス問題 - DLが何を判断根拠にしているのかわからない、それを利用するのはどうかという問題がある ### adversarial attack - 医用画像でもadversarial attackが問題になっている - 普通のadversarial attackの紹介(ドーナツなのに、馬だと予測されるように改変された画像) - adversarial attackを防止するためにはStalableなモデルを作る機構が大事 ### 参考文献紹介 - 演者が書いた解説記事の紹介 - ![](https://i.imgur.com/QHpbHfX.jpg) - スライドは後で演者のホームページに上げるそうだか演者のホームページリンクダウンしてる ### 感想 - 医療にAIを適用するときの障害は、ML全般で言われていること(データ少ない、スパース、ラベルの偏りなど)に加えて、プライバシーの問題がある - スモールデータになるのも倫理や、プライバシーの影響があるからだ。 - ただ医療は、他の分野と比べてドメイン知識が明文化されていることが大きなメリット。その知識と既存手法をうまく組み合わせてモデル構築することで、例えば症状の悪化するかどうかとか、予測モデルを作成することができる - モデルの良し悪しの評価は医学の知識と比較することで精度や分類結果を確かめている。 - チュートリアルの後半は事例紹介ばかりだった