# AI Final project - Report
Họ và tên:
. Trần Thiên Phú - 11CTRN
. Nguyễn Mạnh Kha - 11CTRN
## Mục tiêu của project
### Vấn đề muốn giải quyết:
- Đưa ra gợi ý về món ăn cũng như cách làm món ăn ứng với mong muốn của người về thể loại món ăn
### AI sẽ giải quyết vấn đề trên như thế nào:
- Dùng phương pháp Hybrid Model (trong trường hợp chúng em sử dụng là model LightFM) để xử lí và đưa ra recommend dựa vào các features và tương tác (rating) của users với items.
### Scope of work:
- Có thể đưa ra được những gợi ý món ăn phù hợp với yêu cầu người dùng
### Khi hoàn thành Project em sẽ học được:
- Các thao tác cơ bản về RecSys, hiệu quả của các Hybrid model so với phương pháp khác.
- Khả năng tìm kiếm thông tin, đọc hiểu các thông tin và tìm hiểu được code trên internet (stackoverflow, github, etc.)
- Khả năng xoay sở khi gặp vấn đề về code.
- Cách làm việc hiệu quả và hợp lí.
- Cách phối hợp làm việc với người chung nhóm.
## Schedule:
### 20th 2021 - 27th March 2021
- Phú & Kha: bắt đầu lên ý tưởng hướng muốn đi của project. Chốt 27th March 2021
### 28th March - 3rd April
- Phú & Kha: tìm hiểu thêm về RecSys, quyết định dataset sẽ dùng.
- Phú: tìm hiểu code và các loại RecSys.
- Kha: tìm một số datasets trên mạng
### 4rd April - 11st April
- Phú & Kha: làm việc chung với nhau ở trường, bàn với nhau về cách xử lí dataset, về lý thuyết LightFM.
- Phú: tìm hiểu cách xử lí Dataset, bắt đầu đọc dữ liệu và xử lí căn bản: import vào GG Colab, đọc, sắp xếp dữ liệu.
- Kha: Hỗ trợ coding, kiểm tra lỗi trong code, lên ý tưởng về Features Embedding.
### 12nd April - 19th April
- Phú & Kha: soạn câu hỏi để hỏi CoTAI, được tư vấn
- Phú: bắt đầu khởi tạo LightFM và chạy thử với các embedding và interactions hiện có
- Kha: bắt đầu lên ý tưởng Presentation
### 20th April - 27th April:
- Phú & Kha: cùng nhau bàn lại để tối ưu mô hình.
- Phú: tìm hiểu tại sao AUC score của mô hình trên tập test thấp
- Kha: tiếp tục làm bài thuyết trình
### 28th April - 15th May:
- Phú & Kha: Hoàn thành dự án
- Phú: viết code lấy recommend cho user, tạo user để test khả năng recommend của mô hình.
- Kha: viết rating cho các user tự tạo. Hoàn thành bài thuyết trình. Sắp xếp trang gg colab đẹp hơn
## Sơ lược về dataset, thuật toán, mô hình AI em đang sử dụng.
- Dataset: [Link to dataset](https://www.kaggle.com/shuyangli94/food-com-recipes-and-user-interactions)
- Dataset này bao gồm các file csv, nội dung về food.
- Dataset bao gồm 2 file raw và 2 file preprocess (của recipe và user interactions)
- Dataset có chia sẵn tập train và tập test nhưng sau khi gọi hàm đánh giá của model LightFM thì phát hiện có sự trùng một số giá trị nên chúng em sử dụng tập train để split thành test và train.
- Model: Sử dụng LightFM
## Kết quả nhóm em đã đạt được:
{%youtube S8bRRi40MYM%}
- Mục tiêu tiếp theo: tạo được trang web có thể phục vụ cho mọi người và cải thiện được khả năng recommend một cách tốt nhất, có thể giảm bớt được lượng dataset quá nhiều và thu nhỏ phạm vi mô hình
{"metaMigratedAt":"2023-06-15T20:09:29.642Z","metaMigratedFrom":"Content","title":"AI Final project - Report","breaks":true,"contributors":"[{\"id\":\"f8a7e250-5553-40c9-a34c-4f6ee10a722c\",\"add\":1437,\"del\":580},{\"id\":\"44666f25-df8c-48a2-b367-286278bd273f\",\"add\":2177,\"del\":25}]"}