# 10.22 피어 세션 ###### tags: `peer-session` ## 송민재 - Pre-trained DPR (koDPR) Pre-trained된 QA 모델이기 때문에 대회에는 사용할 수 없다. -> multi-lingual dpr을 fine-tuning해볼 계획 ## 나요한 - Dense embedding 소요시간 30분으로 줄임 - top-k similarity ## 백재형 - DPR validation question, validation passage 맞추기 성능 epoch=1, batch size=2 top k=50 일때 0.95의 정확도를 보인다. ## 정찬미 - Sparse embedding + FAISS top k, cluster 개수에 따라서 성능이 많이 달라짐 강의 실습, special mission에서 제공한 코드로 실험 진행 중 ## 한진 - Backtranlation Using NER 이름을 잘 인식 못하는 것 같음, 이름이 나뉘어져서 tokenize가 된다. 데이터 보충이 된다면 issue에 올릴 예정 ## 홍석진 - Elastic Search - 오류해결 중! ## 이호영 - reader쪽 탐구중 # 다음 주 진행사항 > 작성기한(토요일까지 > Reader관련 논문/페이지여야함 ## ODQA reader 탐구 [코쿼드2 리더보드 링크](https://korquad.github.io/) 코쿼드2는 wiki article 전체에 대한 MRC 코쿼드1은 passage인듯 -> 우리 과제랑 더 맞을 수도 있어요. 우리 과제랑 더 맞을 수도 있어요. 우리 과제랑 더 맞을 수도 있어요. 우리 과제랑 더 맞을 수도 있어요. ## 다음주 연구 방향 - 송민재 - 주로 어떤 모델들이 쓰이는지 탐구 - HuggingFace Models에 한국어 모델이 뭐있는지 보고 논문 한페이지 요약 - 백재형 - koSQuAD 리더보드의 SOTA 모델 리더 살펴보기(샘숭 SDSnet 논문?) - RAG huggingface에서 뜯어보기 - 이호영 - Retriever 진행 과정 확인하고 정리 - Reader 논문 3가지 각 논문마다 3줄 요약해보기 - 홍석진 - elastic 망할 놈 어케할지 고민중.. - Reader 부분 강의 다시 듣기 - 나요한 - 주말동안 허깅페이스 DPR기반 bert-base finetuning - 다음주 리더 RAG진행 - 정찬미 - 논문 요약 및 발표 : - (주말) faiss 실험 마무리 - 한진 - Reader 논문 찾아서 정리 - DPR 코드 분석 - Reader, DPR 합쳐보기 - 마스터 세션 다시 듣고 정리해보기