--- title: 2023年「資訊科技產業專案設計」作業 3 --- # 2023年「資訊科技產業專案設計」作業 3 ## 工作職缺 ## NLP Engineer ### 職缺描述 * 基於影像之物件(物件)偵測/辨識演算法設計與開發、深度學習模型訓練、開發與設計。 * 開發圖像合成系統 Image、Video Generation。 * 開發Midi音樂創作系統 Music Score、Music sheet、Generation。 * 開發3Dpointcloud 物件辨識系統 3D Point Cloud Object/Orientation Detection。 * 開發3D 動畫合成系統 3D Animation Generation。 * 設計實驗以提高模型預測準確性 。 * 開發資料前處理功能 (標示、轉格式)。 * 調查研究新技術或新模型並撰寫相關文件、開立研發時程控管進度。 ### 職務需求 * 對深度學習具有高度熱忱。 * 精通git、docker 使用。 * 深度學習演算法研究與設計,熟悉深度神經網路的常用模型(CNN、RNN、RCNN、VGGNet、ResNet、GCN、GAN等)。 * 熟悉 python、Tensorflow、Pytorch、TFLite、Classification、OpenCV。 * 熟悉 雲端部屬、Machine Learning Model Cloud Deployment、Production Scaling TensorRT、Triton ## NVIDIA : Developer Technology Engineer Intern – AI ### 職缺描述 * Study and develop cutting-edge techniques in deep learning, graphs, machine learning, and data analytics, and perform in-depth analysis and optimization to ensure the best possible performance on current and next-generation GPU architectures. * Work directly with key customers to understand the current and future problems they are solving and provide the best AI solutions using GPUs. * Collaborate closely with the architecture, research, libraries, tools, and system software teams at NVIDIA to influence the design of next-generation architectures, software platforms, and programming models. ### 職務需求 * BS degree from university in an engineering or computer science related discipline (MS or PhD preferred). * Experience with CUDA or OpenCL programming. * Knowledge in a specific domain is a plus, such as NLP and LLM. * Good communication and organization skills, with a logical approach to problem solving, good time management, and task prioritization skills. ## MEDIATEK : AI Algorithm Engineer ### 職缺描述 * 深度學習、機器視覺演算法的開發及對應的加速硬體規劃。 * IC硬體驗證及驅動程式編程。 * 基於IC硬體的AI平台開發。 ### 職務需求 * 至少熟悉一種常用的深度學習架構, 例如Caffe, TensorFlow, Pytorch等 * 熟悉深度學習, 機器視覺, 數位影像方面的理論及技術 * 熟悉C/C++/Python/Matlab至少一種 ## 專業上匹配程度評估 ### 自我評估 * 具備 Machine Learning 相關背景和實作經驗 * project是做machine learning相關內容 * 對Docker等應用開發能力尚缺乏 * 還要學習並精通多種的深度學習架構 * 有關影像視覺方面的能力要補强 * 無 github opensouce 經驗與貢獻 ## 模擬面試 > 👨‍⚖️ : interviewer > 👩 : interviewee 👨‍⚖️ :您好,歡迎您來參與這場面試。首先,請你自我介紹一下。 👩 :您好我是XXX,目前就讀國立成功大學資訊工程研究所,預計2025年8月畢業。研究領域為人工智慧與機器學習,目前剛接了一個計劃是要對假訊息進行偵測並阻斷。除了研究以外,我平常也喜歡留意AI技術在其他領域的發展,跟實驗室同學也會討論彼此的研究和看法。 👨‍⚖️ :好的,你剛剛有提到機器學習,針對這個主題,請你解釋一下機器學習和深度學習的區別。 👩 :機器學習是一種人工智慧的子領域,它關注如何使用數據和統計技術來使計算機系統學習,從而改進其性能。他的目標是開發模型,這些模型可以從數據中學習模式,並用這些模式做出預測或做出決策。而深度學習是機器學習的一個分支,它專注於使用Deep Neural Networks來模擬和解決複雜的非線性問題。深度學習的特點是它的神經網絡擁有多個隱藏層,這使得它能夠自動從數據中學習特徵。 👨‍⚖️ :請問你可以解釋CNN的工作原理嗎? 👩 :卷積是CNN的核心操作,它使用filter在輸入圖像上滑動,對每個局部區域進行加權求和。這有助於捕捉圖像中的局部特徵,例如邊緣、紋理等等。通常,在卷積之後會應用non-linear Activation Function,如ReLU以引入非non-linear的特性。在經過多個卷積和池化層後,最終的特徵圖被展平,然後鏈接到Fully Connected Layer進行分類或回歸操作。 👨‍⚖️ :什麼是overfitting?你會如何防止它? 👩 :Overfitting是指機器學習模型在訓練數據上表現很好,但在新的、未見過的數據上表現不佳的現象。 過擬合的原因: 1.模型複雜度過高: 如果模型的複雜度過高,它可能會學到訓練數據中的雜訊,而不是數據的真正模式。 訓練數據不足: 缺乏代表性和多樣性的訓練數據可能導致模型無法很好地泛化到新數據。 防止過擬合的方法: 1.使用更多的數據: 提供更多的訓練數據,以確保模型學到更一般化的模式而不是僅僅記住特定的樣本。 2.簡化模型: 減少模型的複雜度,可以通過減少神經網絡的層數、神經元數量,或者使用正規化技術(如L1或L2正規化)。 3.交叉驗證: 使用交叉驗證來評估模型的性能。這可以幫助確保模型在不同的數據子集上都表現良好,而不僅僅是在單一訓練集上。 4.提前停止: 在訓練過程中,監控模型在驗證集上的性能。一旦性能達到一個頂點並開始下降,就停止訓練,以避免overfitting。 5.使用 Dropout: Dropout是一種正規化技術,它在訓練過程中隨機丟棄一些神經元,以減少模型overfitting的風險。