[SGS] 추천 시스템 개발기
===
###### tags: `20211213`
[TOC]
### Cold User Issue - 처음 사용한 유저에게 뭘 추천해줄 것인가
-
### CBF
- 상품을 얼마나 사용할 것인가?
- 총 1000개의 상품
-> 스니커즈(450), 의류(250), 패션 잡화(200), 라이프(80), 테크(20)
- 데이터 크롤링 - 이번주 안에 완성해야함
- 크롤링에 대한 계획을 세우기 - 완기햄이 수요일 (옥지 투더문)
### CF (Product indexed recommendation)
- 유저데이터를 몇명이나 만들 것인가? (최소 100회 이상의 활동)
- 1000개 목표
#### CF를 위해 유저데이터를 만들기
> 유저 어떻게 만들까?
- 구매했는지 (3점)
- 찜 (2점)
- 클릭(상품) (1점)
- 살짝 보류) 검색 키워드, 머문 시간(클라이언트에서 페이지에 머문 시간을 어떻게 체크할 것인가)
### RMSE란?
추천시스템의 정확성이란..?
어떤 추천 시스템이 정확하다면 실제 계산한 선호도 예측치와 실제 선호도와 가까워야 한다.
추천시스템의 정확도를 계산하기 위해 total data set에서 일부를 train set, test set으로 나눈다.
train set을 이용해 계산한 선호도 예측치가 실제 test set과 얼마나 일치하는지 비교해서 그 차이를 정확도로 본다.
가장 보편적으로 많이 사용하는 지표인 RMSE(Root Mean Squared Error, 값들의 차이의 제곱 한것의 평균의 제곱)를 사용할 예정이다.