# 2023年度津田塾大学 人工知能・機械学習 (演習付) 第6回講義 (2023-12-22) ## 本サイト(第6回講義)のリンク https://hackmd.io/U0lbYM6cQ9-VZ0QLDya9Ag ## 前回(第5回講義)のリンク https://hackmd.io/hreo3G38RlaQtnvjHEVTdQ ![QRCode6](https://hackmd.io/_uploads/Syw_NDzPT.png) ## 受講者の事前準備 - 講義でPCを使います。 - Google Colaboratoryで演習を行います (言語はPython)。 ## 講義内容 ###  機械学習基礎[2/2]教師なし学習  - 教師無し学習に注目し、クラスタリングや次元削減の手法を学ぶ。クラスタリング手法として、K-means、階層的クラスタリング、DBSCANなどを中心に紹介し、高次元データの可視化について主成分分析、MDS、ISOMap、t-SNEなどの次元削減手法を学ぶ。また、Pythonを使ったグラフ作成についても実例で紹介する。 ### 【講義資料】 - 以下のリンクで資料をDLして、使ってください。 - https://www.dropbox.com/scl/fi/qbx5c6pebvdbnz5t4bg2x/6.pdf?rlkey=d2f2pxub6h9ek4wg1oauv64p2&dl=0 ## 演習内容 ### クラスタリング・次元圧縮分析の実践 - 講義で学んだクラスタリング手法を使用して、基本的なクラスタモデルを実装し、データの生成から結果考察での一連の流れを体験する。また、横断的比較を通じて、クラスタリング手法の特性を理解していくことも目的とする。 - 次元圧縮法のPCA、ISOmap、t-SNEを使って、高次元データの分布を可視化し、解析手法の有用性を解明する。 ### 【演習資料】 - 以下のリンクでipynbファイルをDLして、使ってください。 https://colab.research.google.com/drive/1GyQBTIB3cHq0M1MaMlAnxbShijxBR4lB?usp=sharing ## 課題の提出について - DLした演習資料に必要な内容を記入して、コードと出力結果込みのipynbファイルを提出してください - 提出先: bantao@gmail.com - 期限: 12月31日正午まで - 以下のメール件名とファイル名にして送信してください - メール件名: 「(学籍番号)_(名前)_第6回講義課題」 - ファイル名: 「(学籍番号)_(名前)_TsudaAI20231222.ipynb」 ### 評価基準 - 提出されたコードまた書いた考察に基づいて、採点します。 - 課題3に対しては、ソースコードを修正し、結果をまとめで、考察を書いてください。 - できるだけ実行できるソースコードも添付してください。 - 課題の後に指定された場所に答え・考察を書いてください。 ### 一度提出したが編集して再提出したい場合 - 再提出であることがわかるように,以下のメール件名とファイル名にして送信してください.何回も再提出しても問題ないですが,何回目の再提出かわかるようにしてください. - メール件名: 「(学籍番号)_(名前)_第6回講義課題_再提出X回目」 - ファイル名: 「(学籍番号)_(名前)_TsudaAI20231222_再提出X回目.ipynb」 ### ipynbファイルのダウンロード方法 - Google Colabの「ファイル - ダウンロード - .ipynbをダウンロード」でipynbファイルをダウンロードできます - または,自分のgoogle driveにコピーしたのであれば,google driveもipynbファイルをダウンロードできます ## 参考資料 - 機械学習の全般をカーバーする講習資料, https://aabbdd.jp/notes/files/20200114-machine_learning_intro.pdf - Stanford CS229: Machine Learning Full Course taught by Andrew Ng, https://www.youtube.com/playlist?list=PLoROMvodv4rMiGQp3WXShtMGgzqpfVfbU - Python Machine Learning: Scikit-Learn Tutorial https://www.datacamp.com/tutorial/machine-learning-python - また、講習資料に入っているリンクなどを利用して、関連情報を調べましょう。