# Mục lục https://drive.google.com/drive/folders/1DIE9e6TLL8Iz8BacyBnmzZu-8O2MN70I ## Chương 2 Image Noise Edges and Contour Representation Edge Detection ## Chương 3 4 Corner Detection Harris Detector ## Chương 5 SIFT The Taylor Series Expansion Thresholding Keypoint Computing the Principal Curvatures Assigning an Orientation Keypoint Descriptor Histogram of Gradients ## Chương 6 Distance Measures ### Gobal feature Color Histogram vs Correlogram Color moment Local Binary Pattern ## Chương 7 8 Homography transformation Direct linear transform (DLT) RANSAC Particle Filter Resample calculation Adaptive Template Background Detection (used when camera is always fixed at the same place and object is moving.) Discrete Kalman Filter 2D Ball Tracking Mean-Shift Tracking Object Modeling Target Candidate # Computer Vision ![image](https://hackmd.io/_uploads/S1Dly9gpa.png =x300) ![image](https://hackmd.io/_uploads/HymXkaR6T.png) Thuật toán nội suy(Interpolation) nhanh hơn transposed convolution. ## Detector ### Harris Detector https://viblo.asia/p/ung-dung-thuat-toan-harris-corner-detector-trong-bai-toan-noi-anh-phan-i-ByEZkyME5Q0 Dựa vào sự biến đổi cường độ sáng tại một vùng lân cận được phát biểu như sau: một vùng nhỏ xung quanh các đặc trưng sẽ có 1 sự thay đổi lớn về cường độ sáng nếu một window dịch chuyển 1 đoạn (u,v) từ điểm (x,y) theo bất kì hướng nào. điều này cho thấy sự thay đổi đột ngột trong cấu trúc của ảnh và chỉ ra sự xuất hiện của một góc. Thuật toán Harris corner detector chủ yếu bao gồm các bước sau: 1. Tính toán gradient của ảnh bằng cách sử dụng bộ lọc Sobel hoặc bộ lọc tương tự để tìm đạo hàm theo x và y. 1. Tính toán ma trận độ đàn hồi (structure tensor) của ảnh bằng cách sử dụng gradient tính được. 1. Sử dụng ma trận độ đàn hồi để tính toán một chỉ số (corner response function) mô tả mức độ góc tại mỗi điểm ảnh. 1. Áp dụng một ngưỡng và một thuật toán non-maximum suppression để lọc và chọn ra các điểm góc có độ tin cậy cao. ![image](https://hackmd.io/_uploads/r10EgclTa.png =x300) * W: Cửa sổ w có thể coi = 1 để cho đơn giản trong việc tính toán nhưng để chuẩn xác hơn cho kết quả đầu ra ta có thể coi đây như một mặt nạ Gauss(3x3, 5x5, ...) * I(x, y): Cường độ sáng tại điểm x, y ![image](https://hackmd.io/_uploads/rJv6zclaa.png =x250) Đạo hàm điểm ảnh chỉ đơn giản là lấy điểm sau trừ điểm đầu ( biến thiên) thấy ở các vị trí đổi màu thì có sự thay đổi nên tại điểm đó sẽ có giá trị là cho điểm đó màu trắng. ### DOG Approximating the Laplacian with a difference of Gaussians: ![image](https://hackmd.io/_uploads/HJW2nslaa.png =x250) Sử dụng phương pháp DOG detector, các cạnh và đặc điểm trong ảnh có thể được phát hiện bằng cách xác định các điểm cực trị (extrema) của ảnh DOG, nơi các cạnh và đặc điểm nổi bật nhất xuất hiện. Các điểm cực trị này thường đại diện cho các điểm cực đại (điểm cao nhất) và cực tiểu (điểm thấp nhất) của đạo hàm bậc hai của ảnh DOG. ![image](https://hackmd.io/_uploads/rkXjDigaa.png =x150) ## Scale Invariant Feature Transform (SIFT) Week 5 https://viblo.asia/p/sift-scale-invariant-feature-transform-huan-luyen-mo-hinh-cho-cac-bai-toan-phan-loai-924lJqJaZPM * Looking for features (locations) that are stable (invariant) across all possible scale changes: **The Gaussian Function** Với đầu vào là một hình ảnh >>> SIFT >>> các keypoint. Mỗi đối tượng trong hình ảnh sẽ cho ra rất nhiều các keypoint khác nhau, để ta phân biệt được các keypoint này với nhau sẽ thông qua một vector 128 chiều hay còn gọi là descriptor. Các descriptor này sẽ được dùng để nhận dạng đối tượng trong ảnh, hay dùng cho các bài toán classication. ![image](https://hackmd.io/_uploads/B1AZeTgaT.png) Đặc điểm : * Các keypoint sẽ ít bị phụ thuộc bởi cường độ sáng, nhiễu, góc xoay của ảnh do các descriptor được tạo ra từ gradients do đó nó đã bất biến với các thay đổi về độ sáng (ví dụ: thêm 10 vào tất cả các pixel hình ảnh sẽ mang lại cùng một mô tả chính xác). * Nhanh và hiệu quả, tốc độ xử lý gần như với thời gian thực (realtime) * Có thể xử lý khi xoay ảnh ## Histogram of Gradients Toàn vật thì detect được, còn khi vật bị che thì k detect được. ![image](https://hackmd.io/_uploads/BycCfAg6T.png =x400) ![image](https://hackmd.io/_uploads/B1i2GCxpT.png) ## Neuron ### Centernet https://viblo.asia/p/centernet-keypoint-triplets-for-object-detection-huong-di-moi-trong-bai-toan-object-detection-RnB5pW2rlPG ## Tham khảo https://drive.google.com/drive/folders/1DIE9e6TLL8Iz8BacyBnmzZu-8O2MN70I