# 10.13 피어세션
###### tags: `peer-session`
## 해야 할것 나누기
* 10.12 피어세션에 있는 내용을 github project에 assign 달아서 정리
### feature
- wandb (송민재)
- Config Parser ()
- Search Model ()
- Hyperparameter Search ()
- Auto Hyperparameter Tune(RayTune, Optuna) (나요한, 한진)
- shell script ()
- Top-N retriever (송민재)
- 현재 머신러닝기반 모델
- 다른 방법론을 사용해볼 수 있음(딥러닝 포함)
- 신뢰가능한 evalset ()
- EDA할 수 있게 데이터셋을 CSV으로 다시 정리(백재형, 이호영)
- baseline 코드 리팩토링(정찬미)
- prepare_validation_features, prepare_train_features 함수가 너무 많이 겹침. 수정할 때 두번씩 해야 하는게 너무 귀찮아요.
- eval이 마지막에 딱 한번만 수행해요 ㅜㅜ
- 코드 분석
- retriver 검증방법, 검증셋만들기 (송민재)
-
### 기법
- EDA
- Data Augmentation
- Model Customization
- Ensemble
- Domain Adaptataion
- Data Augmentation: 벡터 상 유사하지만 semantic하게 반대의 문장을 섞기.
- GPT3 - DataAug추가
-
## 진행한 일
### Wandb 추가
## 강의 토론
요한님이 말씀하시길 어려운 것이 없다.
Generation-based MRC
## 기타 토의
탑 K가 오르면 점수가 상승 -> retriever가 중요하다!! 리더가 좋아도 리트리버가 안좋으면 제출성능을 신뢰할 수 없다.
민재님 발견: inference할 때 리트리버 불러와서 거기에서 QA task을 수행.