# AI及資料分析工程師
16週,每週三小時,共48小時,定價36000
[ AI free team](https://hahow.in/courses/60c1d33a8dd31844b56bfd54)
[上課前考試](https://docs.google.com/forms/d/e/1FAIpQLSf_PqY_7ZHQT9W3ui7YAGx_tCBz7cG-ZZeq4FlKd325KInvug/viewform)
[上課前問卷調查2](https://docs.google.com/forms/d/1yfEzYhhlKEa4K5eEXIFZoghU-fBNvWpCfZK_WI1z3ec/viewform?edit_requested=true)
- 專案實做 [線上松](https://g0v.hackmd.io/@jothon/jothonline/https%3A%2F%2Fg0v.hackmd.io%2F%40jothon%2Fjothonline)
- 黑客松或科技大擂台比賽分享
- AI專案管理
- 設計思考
## 目標學員
需程式及一些數學基礎,培養第二專長或轉職AI工程師者
## 課程目標
能與領域專家,定義AI專案,協助搜集資料,並能與管理人員溝通,實作及導入AI系統
## 進行方式
小班制上限30位學員採線上,前8週基礎課程完成指定2個kaggle專案 ,後8週專案實做,4-5人分組實做專題,每週小組專屬助教會議,第12週群體會議,期末專題評選發放獎金,
## 課程產出:期末專題(含有獎金競賽)
## 未來可參與黑客松專案,新AI專案或AI新創,
## [AI in Taiwan競賽 ](https://www.aiatw.org/post/ai_in_taiwan_preliminary)
- 第三波人工智慧簡介(3 hrs,沒限制)
- 人工智慧(AI)歷史沿革
- 圍棋軟體AlphaGO
- 機器學習vs深度學習
- AI學習方式
- 什麼是AI目能做的
- 什麼是AI目前不能做的
- 生活中的AI應用大觀園
- AI文化的影響與未來
- 人工智慧體驗(3 hrs,學過python)
- AI訓練流程介紹
- AI學習方式
- AI演算法簡介
- AI實作體驗
- 機器學習觀念(6 hrs,不用會寫程式)
- 機器學習訓練流程
- 資料處理概觀
- Linear Regression
- Logistic Regression
- SVM
- Decision Tree
- Ensemble Learning
- Others(PCA and K-means)
- 機器學習實作(6 hrs,需python基礎)
- 機率和統計
- 資料清洗與前處理
- 缺失值與離群值
- 正規化
- 資料探勘分析EDA
- 模型選擇與參數調校
- kaggle競賽實戰練習
蘇老師
深度學習:3沒有限制, 6,有限制([參考](https://docs.google.com/presentation/d/1JNZdtnDZxVDFy0MsIUrvfIbXGSjENG85dePBZuO4c18/edit?usp=sharing))
- 前言
- 深度學習的歷史(從 ImageNet 開始)
- 常見的應用領域(影像辨識、自然語言處理、語音辨識)
- 深度學習的優勢
- 常見方法(CNN、RNN、Transformer、BERT 等)
- 類神經網路(Artificial Neural Networks):從 Logistic Regression 到 Neural Networks
- Neural Networks 基本結構:Multilayer Perceptron
- 深度學習的訓練流程:以手寫數字辨識 MNIST 為例
- 定義網路架構
- 定義損失函數
- Stochastic Gradient Descent
- 訓練流程
- 推論(Inference)
- (plus)深度學習框架:PyTorch 簡介([參考](https://docs.google.com/presentation/d/1X0WcRVfcU9b9N_bw-K8ggKa0EkBNChvlrV7q8k64phg/edit?usp=sharing))
- 什麼是深度學習框架
- PyTorch 以及相關套件介紹(ex: torchvision)
- (plus)練習題:初探 PyTorch 與深度學習([參考](https://colab.research.google.com/drive/1yCQyn2zxvLo9qEz9kLhrJrQjtJO5BWze?usp=sharing))
影像CNN:6,沒有限制 6,有限制([參考](https://docs.google.com/presentation/d/1IRIwCSDe5JCOg8UkNCBSsnXgOBoon00W7LSoIw9FRKM/edit?usp=sharing))
- 影像辨識簡介
- 什麼是影像辨識
- 影像辨識的應用
- 影像辨識的困難之處
- 卷積神經網路(Convolutional Neural Networks, CNN)
- Fully-Connected Layer 的缺點
- 影像的特性
- Convolution 運算
- Convolutional Layer
- Convolutional Neural Networks
- CNN 常見的組合元素
- Activation Function 的選擇
- 其他的 Layer
- 優化器(Optimizer)的選擇
- CNN 在實務中的使用方式
- 常見的 CNN 架構
- 遷移學習(Transfer Learning)
- Data Augmentation
- 影像辨識與 CNN
- 影像分類(Image Classification)
- 物件偵測(Object Detection)
- 語意分割(Semantic Segmentation)
- 實例分割(Instance Segmentation)
- Transformer 與影像辨識
- 建立影像辨識應用
- 常用的套件介紹(ex: OpenCV)
- 常見的影像辨識應用流程
- 常見的影片辨識應用流程
- (Plus)練習題:CNN 與與影像分類
- (Plus)練習題:影像辨識應用
NLP:6,沒有限制 6,有限制([參考](https://docs.google.com/presentation/d/1sSdiesN72m9J2CB6I7bC1emBCeD-t3KM04ITZgB-EtY/edit?usp=sharing))
- 自然語言處理(Natural Language Processing, NLP)簡介
- 什麼是自然語言
- 什麼是自然語言處理
- 自然語言處理的應用
- 自然語言處理的困難之處
- 自然語言處理的基本功夫
- 斷詞(Word Segmentation)
- 詞性標記(Part-of-Speech Tagging, POS Tagging)
- 命名實體辨識(Named Entity Recognition, NER)
- 常用的套件(ex: spaCy)
- 賦予詞彙意義:Word Embedding
- 機器表達詞的方法
- 計算詞的相似度:Cosine Similarity
- Word Embedding 的分類
- Word Embedding 的訓練方法(以 word2vec 為例)
- Word Embedding 的應用方式
- 相關套件簡介
- 自然語言處理的常見任務
- 自然語言理解(Natural Language Understanding, NLU)
- 自然語言生成(Natural Language Generation, NLG)
- NLU + NLG
- 自然語言處理的常見模型
- Recurrent Neural Networks
- Seq2Seq
- Transformer
- BERT
- GPT
- 當代自然語言處理技術的幾個課題
- 資料巨獸
- 可解釋性問題
- 資料的偏見
- 缺乏常識與推理能力
- (Plus)練習題:自然語言處理基礎功(一)([參考](https://colab.research.google.com/drive/1Lx0TGICigEai9myTfVxkE-e9MOsoaYzR))
- (Plus)練習題:自然語言處理基礎功(二)([參考](https://colab.research.google.com/drive/1PzZS6w7-nNWizwT_sxLRg_64WaPu0VKx))
- (Plus)練習題:自然語言處理應用:文本分類([參考](https://colab.research.google.com/drive/1MEFv3BXQutUNOiPO8OvEnpTU4ZKOgZ6R))
- (Plus)練習題:自然語言處理任務:閱讀理解([參考](https://colab.research.google.com/drive/1I9q5Zy8nUdyPFGdyp6H4Wkg7MTQiQznt))
# git版本管控
python:6 語法([參考](https://docs.google.com/presentation/d/17DD1CN73xMRkgTAXrAv4O5HikOT36Vd9-vgp05nUqf4/edit?usp=sharing)),6 資料分析numpy,pandas([參考](https://docs.google.com/presentation/d/11zUCMAQMne8cC2zO3PW2ziYOhRMO-jWmkA7HIlDXHzU/edit?usp=sharing)),6:應用
專案實做: 18小時,每次3小時6次 學生自己找題目為主
- 前言:Python 的歷史與簡介
- Python 基礎語法
- 基本資料結構:list、tuple、set
- 字串 string
- 字典 dict
- 流程控制:if、while、for
- 函式 function
- module & package
- 常用 Python 內建套件介紹
- 例外處理
- 類別與物件導向程式設計
- 套件:numpy
- 套件:matplotlib
- 套件:pandas
- [練習題參考一](https://colab.research.google.com/drive/1FHxzPInVNYI2DJqboSGUKY3lfQTIQEjn?usp=sharing)
- [練習題參考二](https://colab.research.google.com/drive/1L1OmJsmPXhIJXdYd-ppi6UV93GAJPfSI?usp=sharing)
- [練習題參考三](https://colab.research.google.com/drive/1AWz0sJ-fcTL0WlgOVgylD4TSk_q5HunH?usp=sharing)
另搭配
[開放原始碼專案](https://hackmd.io/1OJIUkFLQm65DmSjE74d7Q)
參考資料
[機器學習及深度學習入門](https://colab.research.google.com/drive/1SYz9IT02c8Ub8b3s03sVqs3l-f76D_jx)
[推薦系統](https://colab.research.google.com/drive/1UvTK0OIjoDlLBEPEudK-8w221vlXPoUK#scrollTo=0H7qQ4GF0hH_)
[PYTHON基礎](https://drive.google.com/file/d/1QcanAQ1PCHQEzTQS0IKGdyQbrdw-WlCP/view?usp=sharing)
[PYTHON EDA](https://colab.research.google.com/drive/1XdUZkpTYZ6z7XqN8b_wu_t-zf8wMcw2W)
[PYTHON MATPLOTLIB](https://colab.research.google.com/drive/1majbkalVjXCXxeR0PGAotFV54jjX00xL?usp=sharing)
[Mathematics of Machine Learning](https://www.youtube.com/watch?v=8onB7rPG4Pk&t=3s)
熟domain know how,
AI及資料分析工程師:有興趣寫程式,project base
數學:模型設計
統計:資料分析
產品化或系統開發:專案落地,法規