# 10.29 멘토링 ###### tags: `mentoring` ### 1.영어 SOTA모델을 활용하는 법 - Vocab에 있는 단어를 번역을 통해 변경 - ### 2. 위키코퍼스 데이터를 생성해보세요 - wiki데이터를 genertion을 하는 방법 - query와 answer도 generation 가능 ### 3. Bert-Base기반의 한국어모델을 활용 - 모델들을 활용해 QA태스크에 finetuning해보세요. - [HanBERT](https://twoblockai.com/2020/01/22/hanbert%EB%A5%BC-%EA%B3%B5%EA%B0%9C%ED%95%A9%EB%8B%88%EB%8B%A4/) - [한국어 언어모델](https://littlefoxdiary.tistory.com/81) ### 4. 기존에 좋다고 알려진 한국어 모델이 다 안돌아가면 현업에서는 어떻게 하니ㅏ요 - 실제 풀려는 task에 대한 데이터가 없을 경우가 있어요. 코퍼스를 만들던가, 풀려는 task라는 corpus을 가지고 있는 데이터에 mapping 하세여. 그치만 대부분은 human knowledge로 mapping 했을 거시다. ### 전처리 - 표? list? 이런것들 다 버려도 되나요? - 해봐야 합니다 히히ㅣ히히히 - 표 빼보고 LB 점수 확인해보고 - list 빼보고 LB 점수 확인해보고 - 표, 리스트 등 전처리 결과가 종류에 맞게 나오게 확장성 있게 코드를 짜면 좋을 것 같습니다. ### 멘탈: 노력해도 성과가 없어요. - 실험에서 성능 성과가 안나오더라도 어떤 실험인지 기록을 남겨두기 - 실패한 실험이라도 언젠가 쓰인다는 생각을 가지기 - 앙상블에라도 쓸 수 있을거라는 희망을 가지기... - 6개월 동안 성능의 성장이 안나올 수도 있음 예??? - 실험을 썼던거 다시 쓰고 예전에 만든거 다시 쓰고 그런경우가 많아서 언젠가 다쓴다. - 이 회사 평생 다닐꺼 아니다!는 마음 가짐 - 이 방법이 안된다는 것을 알았다는 것도 성장이다 - 그냥 놀기 - 완전 task을 바꿔서 살펴보기. 다른 과제 해보기. 인사이트 얻기.