# 10.29 멘토링
###### tags: `mentoring`
### 1.영어 SOTA모델을 활용하는 법
- Vocab에 있는 단어를 번역을 통해 변경
-
### 2. 위키코퍼스 데이터를 생성해보세요
- wiki데이터를 genertion을 하는 방법
- query와 answer도 generation 가능
### 3. Bert-Base기반의 한국어모델을 활용
- 모델들을 활용해 QA태스크에 finetuning해보세요.
- [HanBERT](https://twoblockai.com/2020/01/22/hanbert%EB%A5%BC-%EA%B3%B5%EA%B0%9C%ED%95%A9%EB%8B%88%EB%8B%A4/)
- [한국어 언어모델](https://littlefoxdiary.tistory.com/81)
### 4. 기존에 좋다고 알려진 한국어 모델이 다 안돌아가면 현업에서는 어떻게 하니ㅏ요
- 실제 풀려는 task에 대한 데이터가 없을 경우가 있어요. 코퍼스를 만들던가, 풀려는 task라는 corpus을 가지고 있는 데이터에 mapping 하세여. 그치만 대부분은 human knowledge로 mapping 했을 거시다.
### 전처리
- 표? list? 이런것들 다 버려도 되나요?
- 해봐야 합니다 히히ㅣ히히히
- 표 빼보고 LB 점수 확인해보고
- list 빼보고 LB 점수 확인해보고
- 표, 리스트 등 전처리 결과가 종류에 맞게 나오게 확장성 있게 코드를 짜면 좋을 것 같습니다.
### 멘탈: 노력해도 성과가 없어요.
- 실험에서 성능 성과가 안나오더라도 어떤 실험인지 기록을 남겨두기
- 실패한 실험이라도 언젠가 쓰인다는 생각을 가지기
- 앙상블에라도 쓸 수 있을거라는 희망을 가지기...
- 6개월 동안 성능의 성장이 안나올 수도 있음 예???
- 실험을 썼던거 다시 쓰고 예전에 만든거 다시 쓰고 그런경우가 많아서 언젠가 다쓴다.
- 이 회사 평생 다닐꺼 아니다!는 마음 가짐
- 이 방법이 안된다는 것을 알았다는 것도 성장이다
- 그냥 놀기
- 완전 task을 바꿔서 살펴보기. 다른 과제 해보기. 인사이트 얻기.