# 10.22 피어 세션
###### tags: `peer-session`
## 송민재
- Pre-trained DPR (koDPR)
Pre-trained된 QA 모델이기 때문에 대회에는 사용할 수 없다.
-> multi-lingual dpr을 fine-tuning해볼 계획
## 나요한
- Dense embedding 소요시간 30분으로 줄임
- top-k similarity
## 백재형
- DPR
validation question, validation passage 맞추기 성능
epoch=1, batch size=2
top k=50 일때 0.95의 정확도를 보인다.
## 정찬미
- Sparse embedding + FAISS
top k, cluster 개수에 따라서 성능이 많이 달라짐
강의 실습, special mission에서 제공한 코드로 실험 진행 중
## 한진
- Backtranlation Using NER
이름을 잘 인식 못하는 것 같음, 이름이 나뉘어져서 tokenize가 된다.
데이터 보충이 된다면 issue에 올릴 예정
## 홍석진
- Elastic Search
- 오류해결 중!
## 이호영
- reader쪽 탐구중
# 다음 주 진행사항
> 작성기한(토요일까지
> Reader관련 논문/페이지여야함
## ODQA reader 탐구
[코쿼드2 리더보드 링크](https://korquad.github.io/)
코쿼드2는 wiki article 전체에 대한 MRC
코쿼드1은 passage인듯 -> 우리 과제랑 더 맞을 수도 있어요. 우리 과제랑 더 맞을 수도 있어요. 우리 과제랑 더 맞을 수도 있어요. 우리 과제랑 더 맞을 수도 있어요.
## 다음주 연구 방향
- 송민재
- 주로 어떤 모델들이 쓰이는지 탐구
- HuggingFace Models에 한국어 모델이 뭐있는지 보고 논문 한페이지 요약
- 백재형
- koSQuAD 리더보드의 SOTA 모델 리더 살펴보기(샘숭 SDSnet 논문?)
- RAG huggingface에서 뜯어보기
- 이호영
- Retriever 진행 과정 확인하고 정리
- Reader 논문 3가지 각 논문마다 3줄 요약해보기
- 홍석진
- elastic 망할 놈 어케할지 고민중..
- Reader 부분 강의 다시 듣기
- 나요한
- 주말동안 허깅페이스 DPR기반 bert-base finetuning
- 다음주 리더 RAG진행
- 정찬미
- 논문 요약 및 발표 :
- (주말) faiss 실험 마무리
- 한진
- Reader 논문 찾아서 정리
- DPR 코드 분석
- Reader, DPR 합쳐보기
- 마스터 세션 다시 듣고 정리해보기