---
tags: '피어세션'
---
210928 피어세션
===
- **오늘의 한마디**
- 롯데리아 치킨버거 1+1 먹으러가야지
진행 해야 될 것
---
- 데일리 스크럼
- 알고리즘 리뷰
- 대회 진행상황 공유
- 2강 실습코드2개, 스페셜미션1개 리뷰 (강의 내용과 함께)
- 3강 실습코드2개 리뷰 (강의 내용과 함께)
피어세션 진행
---
- 맥도날드 별로 : 태현님
- 스크럼
- 재혁님
- 2, 3강 실습보고 깃헙에서 스타수 많은 RE 모델
- 채원님
- 2강 실습 코드 발표준비, 저녁에 운동 도전!
- 종현님
- FastText further 리딩 논문 리뷰 영상 보고 좀더 조사, 딥러닝을 이용한 자연어처리 입문 책 보면서 학습 정리.
- 스피어만 상관계수를 이용해 임베딩 성능을 워드 투 벡과 평가하던데 스피어만에 대해 잘 몰라서 좀 더 공부를 해봐야할것 같다.
- 실습 과제 마무리. + 3강 강의 + RE 태스크 조금 조사.
- 태현님
- 2,3강 실습강의 + 스페셜미션
- 저녁에는 자소서랑 RE 태스크 조사하며 시간보낼 계획입니다!
- 동규님
- 오전: 공부자료 정리 및 Further Question 학습 => 노션에ㅋ 정리.
- 정규표현식 학습, 클루 자료
- 석민님
- 2강 스페셜미션 - 시각화에서 시간 많이 까먹음 ㅠㅠ cheat sheet 봐가면서 풀었어요!
- 3강 강의듣고 준비 , (심리학)기저율에 대하여...
- 2강 실습: 채원님
- 정규표현식 패턴 이야기
- (?=) : 조건문이 필요할때, 한번씩 학습
- r을 왜쓸까?
- 개행 문자 (\t, \n) 처리
- “r”이나 “R” 접두사가 있으면, \ 뒤에 있는 문자는 문자열에 변화 없이 그대로 남아 있게 되고, 모든 \ 또한 문자열에 남아 있게 된다. 예를 들어, 리터럴 문자열 r”\n”은 \와 소문자 n 2개의 문자로 구성된다. 따옴표 문자열 역시 \가 있으면 이스케이프 처리될 수 있지만, \는 여전히 문자열에 남아 있게 된다. 예를 들어 r”\"”의 경우 \와 “ 두 개로 구성된 유효한 문자열이다. r”\“는 유효하지 않다(raw string은 홀수 개의 \로 끝날 수 없다). 특별히, raw string은 한 개의 \로 끝날 수 없다(\는 다음에 오는, 즉 문자열의 끝을 알리는 따옴표를 이스케이프 처리하므로). newline이 다음에 오는 한 개의 \는 문자열의 일부로서 두 개의 문자로 취급되지, 개행으로 처리되지 않는다.
- 워드피스 : https://wikidocs.net/22592
- 2강 스페셜미션: 태현님
- 자소, 음절, 단어, 띄어쓰기, 의미단위로 나누고 각 사용처?
질문 정리
---
*Further Question*
- 텍스트 정제라는 것이 정말 필요할까요?
- 어쩌라는거야? 싶으시죠? ☺️☺️
- 실제로 우리가 웹이나 메신저를 통해 사용하는 언어는 '정제 되지 않은 언어' 입니다.
해당 데이터가 적용되는 방향에 따라 정제가 필요할 수도, 필요하지 않을 수도 있습니다.
오히려 더욱 어려운 데이터로 학습한 모델의 성능이 좋을 수도 있죠 ☺️
- micro F1, macro F1 차이?
## 토의
- wordPiece의 의미 (BPE와의 차이)
- https://wikidocs.net/22592
- 일반 BERT_base보다 BERT_entity를 사용했을 때의 성능향상 이유
- https://en.wikipedia.org/wiki/Entity_linking (Challenges in entity linking)
내일 까지 계획
---
- 3강 실습 리뷰
- 4강 전부 수강, 실습 2개
- RE Task에 대해서 좀 더 알아보기