# 10.21 피어 세션 ###### tags: `peer-session` ## 백재형 - 자연어처리 전처리 지옥 - 특수문자를 제거했을 시 start index에 영향이 가지 않을까? -> 전처리 코드 확인해보기. - DPR을 활용하여서 성능 향상을 확인해보아야함 - 잘린 문서들이 몇개인지 파악해보는 것도 필요 -> 서들이 몇개인지 파악해보는 것도 필요 -> 같은 title의 문서ㅇㅣ 몇개인지 파악해보기 ## 나요한 - Dense_embedding - PyTorch 기반으로 class를 만들어서 학습시키는 중 - batch size가 늘어나면 걸리는 시간이 너무 길어진다. - 학습 시간이 너무 길어지는 것이 해결되지 않는다면 huggingface로 넘어가겠다. ## 송민재 - DPR이 죽어가는 중 ㅜㅜ - 학습이 잘 안된다. - CPR이 필요하다... ## 한진 - 코드 리팩토링 검증 - back translation을 사용한 data augmentation - API 사용 횟수 늘리기 => 모두의 힘을 보내줘.. ## 홍석진 - 전처리 - 동일한 제목을 가진 문서들을 확인했음 - 어떻게 전처리를 해야 할지 고민 중 ## 정찬미 - FAISS Baseline code와 연결함 - sparse embedding + FAISS - wiki data로 학습해보기 ## 250 - 강의 정리 중 - special mission 진행 중 - DrQA 논문 정독하면서 다른 further reading 탐색 중 - Reader 공부 병행하기