# 210826 멘토링
## 진행
- 이론적으로 배운 것을 코딩으로 하는 것을 조금 막힌다.
- 각각의 과정에 대한 이해는 충분하나, 과정들이 이어지는 부분이 코드로 어떻게 구현된는지 어려움..
## 앞으로의 진행방향
- 데이터 Label이 잘못 작성되어 있는 부분을 어떻게 해결해야 할까요??
- DF(Anonmaly Detection?)
- weakly supervised learning
- 외부 데이터를 추가적으로 활용하는 방안
- Data class imbalance의 경우, sampling 기법을 사용해서 완화시켜야 함..(BalanceClassSampler??)
- 본질적인 방안은 데이터 풀 자체를 늘리는 것이 방법
- Data augmentation
- model을 고려해서 model끼리도 비교해봐야 함
- 데이터셋에 따른 model testing을 해 볼 것
- 거의 랭킹이 높은 모델이 성능이 잘 나오긴 함
- training을 어느정도까지 시키는가
- 30 epoch
- check point를 두어서 validation loss가 떨어졌을 때만 저장
- 리더보드 성능에 스트레스 받지 않기.. 그저 동기부여로 활용할 것
## 다음 주 팀플 진행
- 소규모 팀을 만들어서 진행해보자
- 병렬화 해서 task를 나누어서 진행
### 멘토님 서포트 가능 시간
- 화,수,목 제외하고 금,토,일,월 오후 및 저녁 시간