--- tags: '피어세션' --- 210929 피어세션 === - 오늘의 한마디 진행 해야 될 것 --- - TodoList 리마인더 - 코딩테스트의 관하여 - 시간복잡도와 공간복잡도 - 효율성 체크에 대해, 기업의 코테 체크 방식 - leetcode의 토론게시판 활용하는 것 추천 - 3강 실습 - 4강 실습 질문 정리 --- - 어떻게 대회 진행 코드를 분석하고 학습을 시작하는가? - 코딩하는 습관을 바꾸어 보자! (동규님) - 가장 쉬운 것 부터 따라 쳐보기 - 허깅페이스 Tutorial Notion 참고하여 순서대로 공부하기 - Special token이 자동으로 입력되는가? - 자동으로 CLS, SEP 등이 입력되면서 문장 구분 됨 - sequence를 truncation 처리 설명 오류 - https://www.boostcourse.org/boostcampaitech2/forum/102555 - pipline()으로 model을 불러와서 특정 task에 대해 추론해줄 때, tokenizer와 관련된 내용은 없는데 어떻게 tokenizer가 정의되어 있는가? - pipline이라는 메소드 안에 처리 과정이 포함되어 있지 않을까? - hugging face를 참조해 보았을 때, model과 tokenizer는 동시에 올라가는 것 같다 - 자세한 내부동작은 문서를 찾아봐야겠다.. - BERT 언어학습 모델에서 데이터 구축을 할 때, max_num_tokens 기준으로 랜덤하게 문장을 자르게 되는데 이는 의미 손실이 없는건가? - 왜 학습 효과가 어떤 과정으로 있는것인가? 피어세션 진행 --- - TodoList 리마인더 - 석민 - 4강 강의, 실습 - 한국어 임베딩 책, 유튜브를 봐버렸다.. - 태현 - 4강 강의정리, 실습 - 오후에 대회코드 분석예정 - 동규 - 4,5강 실습 - Further Reading을 보며 자료 탐색 - 종현 - BERT 논문, BERT 톺아보기 - HuggingFace 둘러보기 - 채원 - 치과치료 - 4강 강의만 듣고 실습은 아직 자세히 보지않음 - 오후에 '딥러닝을 이용한 자연어처리 입문' 책 참고하여 학습 예정 - 재혁 - 운동 후 알고리즘 - 4강 강의 수강 후 3강 실습 복습 - 재혁님 롯데마트 기획 면접에 관한 고민 - VScode에서 Jupyternotebook처럼 쓰기 - #%% 입력해서 사용 - ipykernel 설치해서 사용 - 3강 실습 리뷰 - attention mask => 스페셜이 아닌 pad토큰만 처리 - add_tokens / add_special_tokens를 통해 원하는 token을 추가해서 실험 가능 - pipeline에 모델을 불러오는 기능이 있다. - 4강 실습 리뷰 - 문장 관계 학습 모델 내일 까지 계획 --- - 회의록 관리자 설정해보는 것이 어떤가? - 회의록 기록을 주도해줄 1명 - 나머지 자율적으로 기록 도와주기 - 공동으로 사용할 baseline 코드 github에 공유하기 - 멘토링 질문하기