--- title: Exponential Data Growth (林俊諺) tags: Session TWO --- ## 摩爾定律 - Did you know that 90% of the world's data has been created only in last two years? - 由英特爾(Intel)創始人之一戈登·摩爾提出 - IC上可容納的電晶體數目,約每隔18個月便會增加一倍,性能也將提升一倍。 - 為一種以倍數增長的觀測 ![image alt](https://i.imgur.com/hkSCguI.png) ## CPU & GPU & DPU ### CPU - 一條指令在CPU中執行的過程是: - 讀取到指令後,通過指令總線送到控制器中進行譯碼。 - 並發出相應的操作控制信號。 - 然後運算器按照操作指令對數據進行計算。 - 並通過數據總線將得到的數據存入數據緩存器。 - CPU需要大量的空間去放置存儲單元和控制邏輯,相比之下計算能力只佔據了很小的一部分 - 傳統上,應用程式被安裝,保持相對靜態,很少更新,並使用一套固定的計算,存儲和網路元素來應付較小的數據(結構化數據)。 但在過去數十年裡,因為數據量飛速增長(摩爾定律有提到),特別是非結構化數據增長,造成組織、資訊架構和數據中心基礎設施帶來了新的壓力。 - 總結:就像是蓋了十個籃球場卻只有3個人來使用 #### 淺談結構化資料與非結構化資料 ### 結構化資料 - 先有結構,再有資料。 - 查詢資料快速,使用的存儲空間少。 - 拓展新的欄位比較麻煩,在資料交換上的規定也比較嚴格。 - SQL 、 Excel ### 非結構化資料 - 非結構化資料指的是未經整理過的資料,也就是資料的本質。常見的文字、圖片、音樂、影片、PDF、網頁等…,都屬於非結構化資料。 ![image alt](https://i1.wp.com/daxpowerbi.com/wp-content/uploads/2018/04/%E9%9D%9E%E7%B5%90%E6%A7%8B%E5%8C%96%E8%B3%87%E6%96%99_%E7%B6%B2%E9%A0%81%E7%88%AC%E8%9F%B2.jpg?resize=1160%2C277&ssl=1 ) [淺談結構化資料與非結構化資料](https://daxpowerbi.com/%E7%B5%90%E6%A7%8B%E5%8C%96%E8%B3%87%E6%96%99/) ### GPU - GPU 這種處理器則是由許多更小也更專業的核心所組成。 核心協力運作時效能強大,能夠將處理工作分配給許多核心處理。 - 為了加速特定的 3D 彩現工作而開發的。隨著時間過去,這些原本只具備特定功能的引擎變得可程式化且更靈活。雖然它們的主要功能還是遊戲影像以及現金熱門遊戲中愈來愈逼真的視覺效果, GPU 現在已經與過去不同,可以用作更為通用的**平行處理器**並支援各式各樣的用程式。 [CPU vs GPU](https://youtu.be/-P28LKWTzrI) ### DPU - CPU 用於通用計算,GPU 用於加速計算,DPU 在資料中心裡移動資料並進行資料處裡。 - 簡單來說DPU能在傳輸的過程中處理資料,能縮短整體的時間。 #### pizza processing - CPU-Centric - order pizza(call or use Pizza application) - PE1:準備原料 ex.起司、番茄醬 - PE1:放進烤箱 - PE1:裝盒子並準備寄送 - Network(外送員) - PE2:拿到pizza - Data-Centric - If pizza shop be like this… ![image alt](https://i.imgur.com/hqIPU0J.jpg)