# question ###### tags: `Lecture3` # please ask some question 1.為什麼 analytic gradient可以使loss function達到low loss? 2.加L1或L2實際上是改變model的什麼部分? 3.assignment1 linear svm.py 檔案中,推導gradient向量化之後的表示形式(vectorized那個函數),著實不太理解, 感恩 1.analytic gradient用來求取梯度;藉由gradient descent沿著梯度反方向調節W,找到使loss function最小化的W 2.係數收縮程度不同,用L1亦得到0解