# 6.1
- mô hình x - z - y
+ X: input
+ B: các đặc trưng dùng để so khớp
+ Z: embbeding.
+ P: Dự đoán
+ $\hat{Y}$: kết quả sau khi dự đoán
- file nhúng (Z) càng tốt thì dự đoán càng đúng $\hat{Y}$ càng giống với $Y$ thực tế
- B là các đặc trưng để so khớp với X trích xuất ra được Z, có thể là các filter, WE, filter,...
# 6.2
- AI as prediction machines : x -> y ($f$ là function đúng ko a?)
- Feature extraction: dạng trích xuất, biến các dữ liệu thô thành các dữ liệu có thể sử dụng vào các mục đích khác nhau, hình ảnh là 1 bức hình lớn có nhiều thứ và nhiễu, ta trích ra các dữ liệu dùng cho việc dự đoán: **X -> Feature extraction -> B**
- concept embedding space: là 1 không gian mà dữ liệu có thể được nhúng vào sau khi đã giảm kích thước, Ví dụ: miếng thịt là dữ liệu, nước chấm là không gian nhúng, miếng thịt sau khi nhúng vào nước chấm sẽ cho ra miếng thịt có các hương vị khác nhau dựa vào chất lượng nước chấm khác nhau. Dữ liệu sau khi qua Embedding space đều khác với dữ liệu đầu vào.
- Regression là dạng dự đoán có giám sát, giúp ta tìm ra các biến có giá trị tương quan với nhau, từ đó có thể vẽ 1 đường thẳng hoặc đường cong trung bình đi qua tất cả các điểm. Sao cho khoảng các từ các điểm tới đường trung bình ngắn nhất.
- Classìication là dạng dự đoán có giám sát, dùng để phân loại đầu vào thành các nhóm mà ta đã cho trước.
- Clustering là dạng dự đoán không có giám sát, nó dựa vào khoảng các giữa input và các dữ liệu khác để phân loại.
- 4 popular similarity measures: (tích chấm 2 điểm, , convolution, distance, angle
+ dot product: np.dot của 2 điểm giá trị càng lớn thì càng giống nhau
+ convolution (tích chập): so khớp giữa filter và bức ảnh, xong trượt liên tục
+ distance: khoảng cách giữa 2 điểm
+ angle: tinhs góc, cos/(|a||b|), càng về 1 thì càng giống nhau, 0 là vông góc, khác nhau. **Em chưa rõ có phải cái này ko?**
- Linear predictors general form