# 10.21 피어 세션
###### tags: `peer-session`
## 백재형
- 자연어처리 전처리 지옥
- 특수문자를 제거했을 시 start index에 영향이 가지 않을까? -> 전처리 코드 확인해보기.
- DPR을 활용하여서 성능 향상을 확인해보아야함
- 잘린 문서들이 몇개인지 파악해보는 것도 필요 -> 서들이 몇개인지 파악해보는 것도 필요 -> 같은 title의 문서ㅇㅣ 몇개인지 파악해보기
## 나요한
- Dense_embedding
- PyTorch 기반으로 class를 만들어서 학습시키는 중
- batch size가 늘어나면 걸리는 시간이 너무 길어진다.
- 학습 시간이 너무 길어지는 것이 해결되지 않는다면 huggingface로 넘어가겠다.
## 송민재
- DPR이 죽어가는 중 ㅜㅜ
- 학습이 잘 안된다.
- CPR이 필요하다...
## 한진
- 코드 리팩토링 검증
- back translation을 사용한 data augmentation
- API 사용 횟수 늘리기 => 모두의 힘을 보내줘..
## 홍석진
- 전처리
- 동일한 제목을 가진 문서들을 확인했음
- 어떻게 전처리를 해야 할지 고민 중
## 정찬미
- FAISS
Baseline code와 연결함
- sparse embedding + FAISS
- wiki data로 학습해보기
## 250
- 강의 정리 중
- special mission 진행 중
- DrQA 논문 정독하면서 다른 further reading 탐색 중
- Reader 공부 병행하기