# '21. 10. 12 NLP 10조 피어세션 정리' ## 깃허브 잘쓰기 최수홍: 베이스라인 코드를 만들고 브랜치를 이용해서 관리하기 데이터베이스 agumentation 된 데이터를 버전을 사용해서 관리 ## 목표 김범찬: EDA 빡세게 하기 ## 실험툴 wandb 사용해서 결과 서로 공유하기 ## mrc 전략 1. 답변의 길이에 따라 long/short 구분 2. 표와 리스트의 경우 고려 3. eda가 효과적일 수 있음 4. 배깅이나 부스팅 활용가능여부: 데이터셋이 정확히 long인지 short인지 몰라서 데이터 여부에 따라서 전략이 달라질 것 또한 표와 리스트인 경우 따로 모델을 만드는 것도 좋을것 5. short의 경우 전략 출제 오류가 있음 => 없애기 or 아니면??샘플이 적기에 6. long의 경우 소제목을 활용하는 경우가 많음 7. 모델선택: 국내 모델은 공유가 안되어있기에 따른 해외 커뮤니티 참조 cnn기반??