---
title: Task 1 - Image recognition
tags: Hand-on coding and doing
---
## Mô tả
Bài toán nhận dạng ảnh là bài toán cơ sở trong hướng nghiên cứu của Computer vision và cũng là nơi phát triển và thử nghiệm nhiều thuật toán và mô hình, phương pháp Deeplearning hiện đại. Nhận diện ảnh là bài toán nhằm phân loại ảnh đầu vào vào một trong số một tập các nhãn khả năng.
---
## Yêu cầu
Task 1 hand on này được đề ra với 3 mục đích:
- Bước đầu tập thử nghiệm cài đặt, huấn luyện các mô hình Deep learning cho nhiệm vụ nền tảng.
- Trong quá trình cài đặt, coding, người đọc review và đọc các kiến trúc nền tảng của Computer vision.
- Tạo được code base với pytorch, đồng thời so sánh các mô hình, các cách huấn luyện và các độ đo của bài toán phân loại. Tiền đề để hand on tiếp các bài toán khác sâu hơn, và theo ý thích.
---
## Đề bài
Nhận diện các loại hoa, sử dụng bộ dữ liệu Flower của Kaggle
[Flowers dataset](https://www.kaggle.com/alxmamaev/flowers-recognition).
Đầu tiên, cài đặt mô hình VGG16, Inceptionv1, Resnet18 bằng pytorch và đánh giá độ chính xác của các mô hình trên.
**Tài liệu tham khảo**
**Papers**
[VGG](https://arxiv.org/abs/1409.1556)
[Inceptionv1](https://arxiv.org/abs/1409.4842)
[Resnet](https://arxiv.org/abs/1512.03385)
**Blogs**
https://medium.com/@14prakash/understanding-and-implementing-architectures-of-resnet-and-resnext-for-state-of-the-art-image-cf51669e1624
https://cv-tricks.com/cnn/understand-resnet-alexnet-vgg-inception/
**Code**
[Begin with pytorch](https://github.com/udacity/deep-learning-v2-pytorch) Đọc phần Introduce to pytorch trước là được
[Model zoo](https://github.com/rasbt/deeplearning-models/tree/master/pytorch_ipynb/cnn)
**Paper notes and paper road-map** *Bonus thôi, chưa cần vội*
[Paper notes](https://github.com/dennybritz/deeplearning-papernotes)
[Paper road map 1](https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap)