10.13 피어세션

# 10.13 피어세션 ###### tags: `peer-session` ## 해야 할것 나누기 * 10.12 피어세션에 있는 내용을 github project에 assign 달아서 정리 ### feature - wandb (송민재) - Config Parser () - Search Model () - Hyperparameter Search () - Auto Hyperparameter Tune(RayTune, Optuna) (나요한, 한진) - shell script () - Top-N retriever (송민재) - 현재 머신러닝기반 모델 - 다른 방법론을 사용해볼 수 있음(딥러닝 포함) - 신뢰가능한 evalset () - EDA할 수 있게 데이터셋을 CSV으로 다시 정리(백재형, 이호영) - baseline 코드 리팩토링(정찬미) - prepare_validation_features, prepare_train_features 함수가 너무 많이 겹침. 수정할 때 두번씩 해야 하는게 너무 귀찮아요. - eval이 마지막에 딱 한번만 수행해요 ㅜㅜ - 코드 분석 - retriver 검증방법, 검증셋만들기 (송민재) - ### 기법 - EDA - Data Augmentation - Model Customization - Ensemble - Domain Adaptataion - Data Augmentation: 벡터 상 유사하지만 semantic하게 반대의 문장을 섞기. - GPT3 - DataAug추가 - ## 진행한 일 ### Wandb 추가 ## 강의 토론 요한님이 말씀하시길 어려운 것이 없다. Generation-based MRC ## 기타 토의 탑 K가 오르면 점수가 상승 -> retriever가 중요하다!! 리더가 좋아도 리트리버가 안좋으면 제출성능을 신뢰할 수 없다. 민재님 발견: inference할 때 리트리버 불러와서 거기에서 QA task을 수행.