# ACML 1日目 ## Deep Learning for Natural Language Processing and Computer Vision ### Yoshimasa Tsuruoka (University of Tokyo) - 最近のNLP+機械学習は、contextも扱えるようになってきて結構すごいよ - story generation - タスクによっては人を超えたといわれるものもある - いろんなEnbeddingの手法がある - Word2vec - FastText - Rare word problemに対処するために sub word概念を導入した - そもそもNeural networkとは - 一般的なNNの話 - RNNの説明(長め) - LSTM - 応用のひとつとして翻訳があり、めちゃくちゃ精度が良くてこれは驚きです - 現在の課題 - source→targetを生成したいが、sourceのcontextをひとつのベクトルで表現することが難しくて、attentionの概念が発明された - attention以外にもbidirectional LSTMで文脈を使ったりもする - attentionの延長でTransformerとか出てきたりしている - Positional Encoding (Encode position information) - Unsupervised NMT - subword vectorsをふたつの言語でシェアしてシェアドエンコーダ作る - ひとつはsourceに変換するデコーダ、もうひとつはtargetに変換するデコーダ(メモ:targetに変換するデコーダって教師なしでできるの???) - Pretraining method - BERT - 質疑応答 - Q. クラス分類(詳細不明)のために単語enbeddingしようとしているんだけど、一番いい言語モデルって何? - A. Pretrainされてる何かがいいのでは - Q. クラス分類だと似たドメインで学習したモデルの方がいいの? - A. 似たドメインの方がもちろんいいけどごにょごにょ - 徳久の考えたこと - OTのenbeddingでもPositional Encodingは必須ぽい - 徳久の単なる感想 - Unsupervised翻訳、すごそうだけど全然知らないので後で勉強する - 編集委員会で見る顔だけど、この人が鶴岡さんだということを初めて認識した(ダメ) ### Yoshitaka Ushiku (OMRON SINIC X) - 2011 DNN ⇒ 2012 CNN - AlexNet/ResNet/Region CNN/U-Net/PointNet - DANN/Adversarial Learning/ - Domain adaptationのいろんな研究の紹介 - 2Dの画像から3D Mesh画像を生成 - すごい使えそうだけど実際どうなんだろ - Unsupervised Domain Adaptation - 元は白黒画像なのをカラーにする - MCD(Maximum Classifier Discrepancy) - Classifierを別のドメインに適用する方法 - Semantic Segmentation - 実画像で地面との境界を分割するのをモデル化 - 通常手法だとCGを対象に境界を分割しようとしてもうまくいかない - MCD使うとCGを対象でもうまく地面との境界を分割可能 - 画像を言語で表現する - Youtubeなどに言語情報が付与された画像が日々投稿されていてデータはたくさんある - 写真にキャプションを付けるとかもできるようになった - いろんな言語でキャプションを付けられるようにとかなってきている - Vitual Dialog/Vision-and-Language navigation - Dataset - Office Dataset ## Deep Learning for Conversational AI(Yun-Nung (Vivian) Chen ) - Intelligent Assistantsがたくさん - Conversational Agents - Chit-Chat - Knowledge-grounded seq2seq models - Task-oriented - Steve Young2000{Language understanding/Dialogue Management/Natural Language Generation} - Domain Identification(どのデータベースから回答を探せばいいかを推定する) - State Tracking - Multi-Domain Dialogue State Tracking - Dialogue State Tracking Challenges(DSTC) - Planning-Deep Dyna-Q ⇒面白そうなので後から読む - Common sense for a dialogue ⇒★面白そうなので後から読む - 所感 - conversational dialogueをend-to-endでやる話は全然なくて、Domain recognitionとかにDeep Learningを使うという話 ## Text Representation Learning and Compositional Semantics - word/subword/sentence/text/world knowledge - 未知語があっても文全体を読むとなんとなくわかる - constrainted by network designを考えないといけない - LSTM/CNN/RNN/Tree-LSTM - Honourable Mentionsのページが参考になりそう - EMNLPでWSあります - Subcharacter embedding for Kanji
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up