# 210826 멘토링 ## 진행 - 이론적으로 배운 것을 코딩으로 하는 것을 조금 막힌다. - 각각의 과정에 대한 이해는 충분하나, 과정들이 이어지는 부분이 코드로 어떻게 구현된는지 어려움.. ## 앞으로의 진행방향 - 데이터 Label이 잘못 작성되어 있는 부분을 어떻게 해결해야 할까요?? - DF(Anonmaly Detection?) - weakly supervised learning - 외부 데이터를 추가적으로 활용하는 방안 - Data class imbalance의 경우, sampling 기법을 사용해서 완화시켜야 함..(BalanceClassSampler??) - 본질적인 방안은 데이터 풀 자체를 늘리는 것이 방법 - Data augmentation - model을 고려해서 model끼리도 비교해봐야 함 - 데이터셋에 따른 model testing을 해 볼 것 - 거의 랭킹이 높은 모델이 성능이 잘 나오긴 함 - training을 어느정도까지 시키는가 - 30 epoch - check point를 두어서 validation loss가 떨어졌을 때만 저장 - 리더보드 성능에 스트레스 받지 않기.. 그저 동기부여로 활용할 것 ## 다음 주 팀플 진행 - 소규모 팀을 만들어서 진행해보자 - 병렬화 해서 task를 나누어서 진행 ### 멘토님 서포트 가능 시간 - 화,수,목 제외하고 금,토,일,월 오후 및 저녁 시간