---
tags: '피어세션'
---
211122 피어세션
===
- 기록자 :
- 오늘의 한마디
진행 해야 될 것
---
- TodoList 리마인더
- 논문리뷰 무엇을 할까? => Don't stop pretraining 으로 결정.
- Don't stop pretraining 논문 리뷰 일정 정하기.
질문 정리
---
피어세션 진행
---
- [PALM 기반 한국어 T5 개선: 기계독해 및 텍스트 요약으로의 응용](https://www.koreascience.or.kr/article/CFKO202130060739838.pdf)
데이콘에 활용할 모델 탐색 중 유력한 후보.
전북대에서 학습시켰고 곧 공개될 예정
- Todo 공유
- 석민님: 1, 2강 수강, 데이콘 관련 공부, 이전 데이콘 문서 요약 대회 데이터 구함, gas와 energy 분야 문서들을 모아보았다.(pretrain에 활용할 예정, 전처리 필요)
- 동규님: 1, 2, 3강 듣고 4강 듣는 중, 김장 돕고 피어세션 참여
- 종현님: 1, 2강 수강, 1강 학습정리 완료, 페가수스 논문 읽고 공부 중, 석민님이 주신 링크 볼 예정
- 은진님: 1강, 2강 강의 수강 후 학습정리, 3강까지 다 들을 예정
- 채원님: 저녁에 2강까지 수강할 예정, Don't stop pretraining 논문 공부할 예정
- 태현님: 아프지마요 ㅠ, 1강 앞부분 보고있음, Don't stop pretraining 논문도 저녁에 볼 예정.
- 카카오브레인 패스파인더 코테 후기
- 투포인터 문제 나온거 같음..
- rest API 한 문제
- 기초적인 문제들이 나온 것 같음
- 최종 프로젝트를 위한 일정 관리
- 오전 경량화 대회 및 강의에 집중
- 오후 최종 프로젝트 준비
- Don't stop pre-training 논문 리뷰
- 수요일에 다같이 읽어온 내용 토론해보기
- 논문 읽으면서 질문도 생각해오기
- 학습계획
- 1,2강(월)
- 3강, 4강(화)
- 5강(수)
- 스페셜(목, 금)
- 최종프로젝트 역할 분담
- (1) 서비스/시스템 기획, (2) Back-end 개발, (3) Frond-end 개발, (4) ML 경량화, (5) 번역 모델 본
- 프로젝트가 ML-based 프로젝트이므로, (4), (5)번 역할을 반씩 나누고, (1), (2), (3) 번 역할을 분배해서, 캠퍼 한 명당 (4-5), (1-3) 중 하나씩 총 2개의 역할을 맡게된다면 이상적일 것 같습니다.
- 틀을 먼저 구현하기?
- 관련된 UI -> 템플릿찾기
- 서비스/시스템 기획
- 우선 우리가 만들고 싶은 게 뭔지 정의하기
- 채팅
- 노션으로 진행
- 번역 모델 코드
- https://github.com/huggingface/transformers/tree/master/examples/pytorch/translation
내일 까지 계획
---
- UI 템플릿
- 다국어 모델 공부
- (input, output) 확인
- etc
- 데이터셋 수집
- wmt
- 앞으로의 일정 계획
- 17일 까지 대부분을 완성하는 것을 목표
- 하나의 번역 모델 완성을 12월 3일까지 하는 것을 목표
- 1주차: 경량화 수업 들으면서 데이터셋 구하기, 다국어 모델 만들기
- 2주차: 학습한 모델 성능 올리기
- 3주차: 모델 경량화 작업
- 4주차: 모델과 연결 및 서비스 차원의 기능 구현