明道中學高中部資訊類專題第一次簡報

{%hackmd 0I99hcNpQaqK3I5yYc5B2A %} # 明道中學高中部資訊類專題第一次簡報 ---- # Re:0 從零開始的AI底層實作 --- # 緣起 **(創新時勢)** ---- ## 人工智慧? ## 機器學習? ## 神經網路?  ---- ## 這些詞是否耳熟能詳?  ----  ## 當企業口中的喊著AI的口號 ![](https://i.imgur.com/X43xYRM.png =400x)  ---- ## 這笑話感覺是那些傳產大老闆搞出來的對吧?  ---- 目前在台灣的AI產業大多是靠著現成API在做缺乏自己的在底層優化的技術力  ---- ## 在資電圈流傳著這樣的話 ## AI工程師其實只是Tensorflow參數調整工人 ---- 最大也最讓人不願面對的對比中國... 他們積極發展底層，已經發明了許多強大的算法   ---- ## 所以我們要...  ---- ## 自己幹出底層 --- #### 研究規劃 **(整體架構(含比較分析))** ---- # 計畫規劃 ---- ## 研究方法 - 探討底層的構成 - 使用Rust做出可以運作的模型 - 應用層面的延伸   ---- ## 研究流程 ![](https://i.imgur.com/saQhBI7.png=1500x)  ---- 比較|程式語言|實踐方法|學習方向| -|-|-|- Tensorflow|python|利用API|實作方法自幹的|rust|依原理重頭寫|理論實踐 ---- ## 工作分配  組員 | 工作分配 | 專長 -|-|- 陳茗祐 91XJ30 | 研發筆記、專案管理、寫``code`` | 裝墊邱繼叡 91XC13 | 讀筆記、寫``code``、文書處理 | 滑水謝侑哲 91XC39 | 讀筆記、寫``code``、文書處理 | 真的很弱    --- ## 文獻探討 **預期結果(含研究過程說明影片)** ---- ### 捌、參考文獻 - 高中生也看得懂機器學習的數學基礎 - 學AI真簡單(I)：初探機器學習-從認識AI到Kaggle競賽 - 學AI真簡單(II)：動手做深度學習-揭開神經網路的面紗 - 再強一點：用Go語言完成六個大型專案 - C++程式設計第三版 - [build artificial neural network scratch part 1](https://www.kdnuggets.com/2019/11/build-artificial-neural-network-scratch-part-1.html) - [機器/深度學習-基礎數學(二):梯度下降法(gradient descent) | by Tommy Huang | Medium](https://chih-sheng-huang821.medium.com/%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92-%E5%9F%BA%E7%A4%8E%E6%95%B8%E5%AD%B8-%E4%BA%8C-%E6%A2%AF%E5%BA%A6%E4%B8%8B%E9%99%8D%E6%B3%95-gradient-descent-406e1fd001f) ---- - [機器/深度學習-基礎數學(三):梯度最佳解相關算法(gradient descent optimization algorithms) | by Tommy Huang | Medium](https://chih-sheng-huang821.medium.com/%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92-%E5%9F%BA%E7%A4%8E%E6%95%B8%E5%AD%B8-%E4%B8%89-%E6%A2%AF%E5%BA%A6%E6%9C%80%E4%BD%B3%E8%A7%A3%E7%9B%B8%E9%97%9C%E7%AE%97%E6%B3%95-gradient-descent-optimization-algorithms-b61ed1478bd7) - [自动微分(Automatic Differentiation)简介_CarlXie-CSDN博客_自动微分](https://blog.csdn.net/aws3217150/article/details/70214422) - [Backpropagation | Brilliant Math & Science Wiki](https://brilliant.org/wiki/backpropagation/) - [Backpropagation](http://galaxy.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html) - [[機器學習ML NOTE]SGD, Momentum, AdaGrad, Adam Optimizer | by GGWithRabitLIFE | 雞雞與兔兔的工程世界 | Medium](https://medium.com/%E9%9B%9E%E9%9B%9E%E8%88%87%E5%85%94%E5%85%94%E7%9A%84%E5%B7%A5%E7%A8%8B%E4%B8%96%E7%95%8C/%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92ml-note-sgd-momentum-adagrad-adam-optimizer-f20568c968db) ---- - [backpropagation - Error function in Artificial Neural Network trained using backpropogation - Stack Overflow](https://stackoverflow.com/questions/22601258/error-function-in-artificial-neural-network-trained-using-backpropogation) - [自動微分](http://fancyerii.github.io/books/autodiff/) - [梯度](https://www.youtube.com/watch?v=npkl19rcpdY) - [方向導數](https://www.youtube.com/watch?v=-DumtBiW4HE) - [Machine Learning Foundations (機器學習基石) - YouTube](https://www.youtube.com/playlist?list=PLXVfgk9fNX2I7tB6oIINGBmW50rrmFTqf) - [Backpropagation calculus | Chapter 4, Deep learning](https://www.youtube.com/watch?v=tIeHLnjs5U8) - [為什麼需要反向傳播(裡面有圖解)](https://allen108108.github.io/blog/2020/06/01/%E7%82%BA%E4%BB%80%E9%BA%BC%E9%9C%80%E8%A6%81%E5%8F%8D%E5%90%91%E5%82%B3%E6%92%AD%20_%20Why%20Backpropagation%20_/) - [Kohonen Networks]() ---- - [NVIDIA DOCUMENTATION CENTER](https://docs.nvidia.com/) - [Rust 程式設計語言](https://rust-lang.tw/book-tw/) - [syn example](https://github.com/dtolnay/syn/tree/3418c8434539542b1325ebc375cb2cd7560f5277/examples/trace-var) - [python實作微分樹(建樹) ](https://towardsdatascience.com/build-your-own-automatic-differentiation-program-6ecd585eec2a) --- ## 警告接下來的內容會有點難，但也只要中學畢業程度的數學知識就夠了  --- ### 神經元運作方式  ---- ![](https://i.imgur.com/9Fiukoi.png) **由於figma(繪圖工具)不支援中文，所以只有英文**  ---- ![](https://i.imgur.com/mQq5rUN.png)  ---- ![](https://i.imgur.com/IAlwPwp.png)  ---- ![](https://i.imgur.com/v7TKgJL.png)  ---- ![](https://i.imgur.com/j9qD8UV.png)  ---- ![](https://i.imgur.com/oLcdS09.png)  **為了避免超出中學範圍，這裡省略了激勵函數** --- ## 自動微分  ---- ### 加法 ![](https://i.imgur.com/Or4hubh.png) **由於figma(繪圖工具)不支援中文，所以只有英文**  ---- ### 乘法 ![](https://i.imgur.com/1jFmkpz.png)  ---- ### 前向模式以$f(w_1,w_2,w_3)=(w_1+w_2)*w_3$為例  ---- #### 預覽 ![](https://i.imgur.com/lr6H8oI.png)  ---- #### 1. 算出節點值 ![](https://i.imgur.com/Aqnct0O.png)  ---- #### 2. 算出邊權 ![](https://i.imgur.com/wNtwIUn.png)  ---- ### 後向模式  ---- #### 直接DFS到葉節點 ![](https://i.imgur.com/xVzFgEO.png)  ---- 然後``product``(連乘) $$\frac{dw_1}{df(x)}=1*3=3$$  --- ## 矩陣化  ---- ### 單層神經元 ![](https://i.imgur.com/oLcdS09.png)  ---- $$ ( \begin{bmatrix} x & y \end{bmatrix} * \begin{bmatrix} W_{1-1} & W_{1-2} \\ W_{2-1} & W_{2-2} \end{bmatrix} + \begin{bmatrix} c & d \end{bmatrix} )* \begin{bmatrix} 1 \\ 1 \end{bmatrix}= f(x) $$ $$ ( \begin{bmatrix} x & y \end{bmatrix} * \begin{bmatrix} W_{1} & W_{2} \\ W_{3} & W_{4} \end{bmatrix} + \begin{bmatrix} c & d \end{bmatrix} )* \begin{bmatrix} 1 \\ 1 \end{bmatrix}= f(x) $$ **為了避免超出中學範圍，這裡省略了矩陣微分**  --- ## 張量(``tensor``) 不是tensorflow ---- ### 因為matrix是在vector裡放vector，會造成取值要2倍的時間 ---- ### 將matrix拉平，變成tensor --- ## 捲積層 ---- 本質上就是放大特徵主要有三層 ---- ### 捲積核先看看捲積核長怎樣  ![](https://i.imgur.com/YCR7GYp.png) 它是一個針對某個特性放大的，計算核心 ---- 實際是利用與捲積核的計算，改變原圖 ![](https://i.imgur.com/D4bBzWE.png) 以這張圖來說，就是針對橫線部分放大他的特性 ---- 總步驟是這樣 ![](https://i.imgur.com/37zTRpK.png =700x) 所以最後出來的圖大小會跟原本差不多但特性更明顯 ---- ### 池化層用來將資料簡化，讓運算更快聽起來很難，但上個圖就好懂了 ---- 這是平均池化 ![](https://i.imgur.com/vWtvOT9.png) 也有其他不同的池化方式，像是: 最大化池化(最常見的) ---- ### 全連接層就是攤平圖，變成X丟進神經元  --- ## 目前實作成果 ----  ### Matrix ```rust= #[derive(Debug, PartialEq, Clone)] struct Matrix<T> where T: Copy, { shape: [usize; 2], data: Tensor<T>, } ``` ---- ```rust= // iter by row // it is non-consum iterator // faster than col iter // 0 1 2 // 3 4 5 // 6 7 8 // 9 10 11 pub fn into_row_iter<'a>(&'a self) -> impl Iterator<Item = &T> + 'a { self.data.iter() } ``` ---- ```rust= // iter by col // it is non-consum iterator // 0 4 8 // 1 5 9 // 2 6 10 // 3 7 11 pub fn into_col_iter<'a>(&'a self) -> impl Iterator<Item = &T> + 'a { // 第1直排到第N直排的迭代器 (0..self.shape[1]) // flat_map 用來攤平 ex: [[1,2],[3,4],[5,6]] -> [1,2,3,4,5,6] // step_by(self.shape[1]) 跳直的 , take()用來取迭代器，相對的原本迭代器裡的那個iter會被刪掉 , b的值會來自前面的(0..self.shape[1]) , 也就是第 0,1,2項的迭代器,是flat_map自己抓的 .flat_map(move |b| (b..).step_by(self.shape[1]).take(self.shape[0])) // map用來取迭代器的值 , map會自己抓上面flat_map跳到的位置n .map(move |n| self.data.iter().nth(n).unwrap()) } ``` ---- ```rust= impl_ops_all!(+[<K, T> where T: Add<K> + Copy,K: Copy,<T as Add<K>>::Output: Copy] (left:Matrix<T>, right:Matrix<K>)->Matrix<<T as Add<K>>::Output>{ // !for debug if cfg!(debug_assertions) { assert_eq!(left.shape, right.shape) } Matrix { shape: left.shape.clone(), data: &left.data + &right.data, } } ); ``` ---- ```rust= #[macro_export] macro_rules! mat { ($elem:expr; $r:expr, $c:expr) => ( $crate::matrix::Matrix::new($elem, [$r, $c]) ); ($($x:expr),+ $(,)?;$r:expr, $c:expr) => ( $crate::matrix::Matrix::from(($crate::ten![$($x),+], [$r, $c])) ); } ``` ---- {%youtube 9Ti9qf0zdFI%} [影片音樂版權標示在影片簡介](https://youtu.be/9Ti9qf0zdFI) --- ## 目標 ---- - 學習深度學習的基礎原理 - 學習rust ---- ## 發展可能 **未來發展** ---- - 手寫數字辨識 ![](https://i.imgur.com/uQ52Tkf.png) ---- ~~打敗Tensorflow~~  --- # END --- 理論整理資料; 理論整理資料-->學習rust,IDE等; 學習rust,IDE等-->建構出基本的ANN模型; 建構出基本的ANN模型合併已建構的完成的部分-->變成可運作之CNN神經網路; 變成可運作之CNN神經網路-->優化及加蓋; 優化及加蓋-->測試不同的優化結果; --> ---