# 10.15 멘토링 [![hackmd-github-sync-badge](https://hackmd.io/bIinvMyyS_6ik-mDWUa5WA/badge)](https://hackmd.io/team/NLPStudy?nav=overview) ###### tags: `mentoring` --- ### 1. 정확한 답을 찾는 EM Metric에서 생성모델을 써보는게 올바른 접근일까요? - SOTA인 RAG 모델은 generation을 쓰고 있는데.... A. 시도는 좋다, 결과 추론을 꼭 해볼 것 --- ### 2. 아래와 같은 데이터 셋일 때, 멘토님께서는 question을 Back Translation 하는 시도를 해보실 건가요? ```json={ 'title': ['미국 상원', '인사조직관리'], 'context': ['미국 상의원 또는 미국 상원(United States Senate)은 양원제인 미국 의회의....하원....', '근대적 경영학' 또는 '고전적 경영학'에서 현대적 경영학으로 전환되는 시기는 1950년대...'] 'question': ['대통령을 포함한 미국의 행정부 견제권을 갖는 국가 기관은?', '현대적 인사조직관리의 시발점이 된 책은?'], 'id': ['mrc-1-000067', 'mrc-0-004397'], 'answers': [ {'answer_start': [235], 'text': ['하원']}, {'answer_start': [212], 'text': ['《경영의 실제》']} ], 'document_id': [18293, 51638], '__index_level_0__': [42, 2873] } ``` A. 당연히 해보자! 데이터가 적고 시도할 때 리스크가 적기 때문에 실험해볼 가치가 있다. --- ### 3. 공공데이터인턴에 대한 솔직한 후기가 궁금합니다.. A. 케이스별로 다르다. 엑셀.. 흠.. 안열리지않을까.. A. 본인이 하는거에 따라 다르다. 어딜가든 열심히 하자. --- ### 4. 저희가 수행한 Task들을 포트폴리오에 활용해보고 싶은데 어떤부분을 어필해야할까요? A. 수행했던 대회해서 시도해본, 아쉬운 것을 잘 정리해보자 블로그에 정리하는 것을 매우 추천! --- ### 5. 강의쪽으로 활동하시게 된 계기가 궁금합니다! A.돈벌려고 시도를 했는데, 알려주는거를 좋아합니다. 알려주려고 하면, 그 알려주기를 위해 더 열심히 공부해야함. 강의를 반복해서 하는건 돈받으면서 복습하는 것 A. 내가 하고싶은 공부를 못할 수 있다. 강의도 다른 곳으로 가기 위한 중간지점, 자기관리 스트레스 --- ### 6. 최종 출력에서 특수문자를 어떻게 포함하는지 궁금합니다. ```json "mrc-0-002177": "\"수박\"을 의미하는 라틴어인 \"citrullus(수박속)\"", "mrc-0-003223": "스페우시포스(Σπεύσιππος, Speusippos)" "mrc-0-000668": "\\",, ``` (Σπεύσιππος, Speusippos)이런 단어는 저희가 사용하는 vocab에는 없을 것 같은데 어떻게 이것 까지 포함해서 정답으로 포함해서 예측하는지 궁급합니다. ### 7. 다른 언어까지 고려하기는 힘들것