--- tags: '피어세션' --- 211015 피어세션 === - 기록자 : - 오늘의 한마디 진행 해야 될 것 --- - TodoList 리마인더 질문 정리 --- - 지문과 질문을 넣었을 때, 정답을 유추한다. 피어세션 진행 --- - TMI 타임 - 카카오톡 프로필 사진 변경 일화.. - 게임 이야기 - 요새는 다들 게임을 잘 안하는 것 같다.. - 운동 이야기 - 팔굽혀펴기 200개 챌린지 - 필라테스 - 런닝머신 20분, 사이클 20분, 웨이트 부위별 - 한 손으로 푸쉬업..ㄷㄷ - 주식 이야기 - 적은 돈으로 시작하는 것도 추천 - 어렵다.. - Todo list 점검 - 석민님: 6,7강 학습 후 스페셜미션 중. AIhub에서 서버를 신청해서 오늘 답변을 받음 - 동규님: Augmentation 적용해보고 수업 오후에 들을 예정. back translation 통한 aumentation 방법 & pororo lib 통해서 질문 생성 하는 방법 찾음 - 은진님: 강의 수강 & Further reading 위주로 논문 탐색 - 재혁님: 강의, 실습 완료. 스페션 0, 1번만. 오픈도메인QnA에서 Retrieval 이 어떻게 쓰이는지 논문을 노션에 정리. - 태현님: 오전에 개인일. 알고리즘 문제 풀이. 마스터클래스 이후 7강을 듣는 중. 커리큘럼러닝 방법론 조사예정 - 채원님: 6,7강 강의 수강. 오후에 논문 기반 방법론 조사 예정. 유튜브 동영상을 보면서 홈트레이닝 - 종현님: QA 관련 논문 읽음. 질문 생성하는 모델 관련 방법론 찾아봄. 아직 논문을 읽어도 이해하지 못하는 부분이 많음. 오후에 6,7강 강의 들을 예정 - Data Augmentation - 질문 생성 모델(동일한 답에 의미가 같은 질문 생성) - 생각보다 성능이 좋음 - 지문에 정답단어가 여러개 있는 경우 효과가 좋음 - back translation (지문 생성) - answer를 마킹을 해서 변하지 않도록 하고 설정하면 효과가 좋을 것으로 예상됨 - 문장에 noise를 섞기 - 각각의 data augmentation의 효과를 보기 위해서 나누어서 실험 후 결과가 좋은 것만 반영할 생각 - negative sampling - 필요성에 대한 생각 (https://wikidocs.net/69141) - wor2vec에서 필요한 word에 초점을 맞춰서 학습하기 위해 관련없는 word는 업데이트 하지 않도록 유도 - 논문을 통한 조사 - [정리 링크](https://opalescent-ground-d34.notion.site/Day-4-6a0c3e1858594071b60062e870fca5c0) - back translation이 효과가 좋은 것 같음 - negative sampling이 생각보다 좋은 결과를 보여줌 - 생성 모델의 효과를 볼 수 있는 방법 고려 - 방법론 - retrieval - dense - hybrid - sparse - 셋 중 어떠한 것이 최고라 할 수 없고 섞어 쓰거나 task에 맞는 것을 찾아서 써야 함 내일 까지 계획 --- - Augmentation - backtranslation, 질문 생성 - 동의어 바꾸는 방법, 질문 만드는 방법 적용해서 data 만드는 것을 목표 - negative sampling 조사 - 방법론 조사 - 역할 분담 하여 관련 내용 조사 - Generation - Retrieval - Extraction - Curriculum Learning - 리펙토링 - baseline code 모듈화 진행