[Deployment] AI模型部署相關筆記

NVIDIA Jetson 平台部署相關筆記

機器學習編譯（machine learning compilation， MLC）是指，將機器學習演算法從開發階段，通過變換和優化演算法，使其變成部署狀態。

開發形式
- 是指我們在開發機器學習模型時使用的形式。典型的開發形式包括用 PyTorch、TensorFlow 或 JAX 等通用框架編寫的模型描述，以及與之相關的權重。
部署形式
- 是指執行機器學習應用程式所需的形式。它通常涉及機器學習模型的每個步驟的支撐代碼、管理資源（例如記憶體）的控制器，以及與應用程式開發環境的介面（例如用於 android 應用程式的 java API）。

Image Not Showing Possible Reasons

Machine Learning Compiler

關於深度學習模型部屬理論的系統化課程
ps:課程開設者陳天奇是著名機器學習演算法 XGBoost、深度學習編譯器 TVM 等的作者

內有關於深度學習與推理系統的完整介紹，簡單明瞭，推薦!

推理(Inference) 對於訓練(Training)而言的推理,即模型前向計算,也就是對於給出的輸入數據計算得到模型的輸出結果;相對預測(Prediction)的推理,是統計學領域的範疇。
部署(Deployment) . 訓練得到的模型主要目的還是為了更有效地解決實際中的問題,因此部署是一個非常重要的階段。模型部署的課題也非常多,包括但不僅限於:移植、壓縮、加速等。
服務化(Serving) 模型的部署方式是多樣的:封裝成一個SDK,集成到APP或者服務中;封裝成一個web服務,對外暴露接口(HTTP(S),RPC等協議)。

前顯易懂的快速入門文章、很多業界實務經驗，推薦搭配chenzomi12/DeepLearningSystem/推理系統課程一起看完可以快速系統性掌握業界概況