# '21. 10. 12 NLP 10조 피어세션 정리'
## 깃허브 잘쓰기
최수홍:
베이스라인 코드를 만들고 브랜치를 이용해서 관리하기
데이터베이스 agumentation 된 데이터를 버전을 사용해서 관리
## 목표
김범찬: EDA 빡세게 하기
## 실험툴
wandb 사용해서 결과 서로 공유하기
## mrc 전략
1. 답변의 길이에 따라 long/short 구분
2. 표와 리스트의 경우 고려
3. eda가 효과적일 수 있음
4. 배깅이나 부스팅 활용가능여부: 데이터셋이 정확히 long인지 short인지 몰라서 데이터 여부에 따라서 전략이 달라질 것 또한 표와 리스트인 경우 따로 모델을 만드는 것도 좋을것
5. short의 경우 전략 출제 오류가 있음 => 없애기 or 아니면??샘플이 적기에
6. long의 경우 소제목을 활용하는 경우가 많음
7. 모델선택: 국내 모델은 공유가 안되어있기에 따른 해외 커뮤니티 참조 cnn기반??