# 12월 13일 피어세션 ###### tags: `peer-session` ## 모더레이터: 이호영 ### 재형님의 점심 menu: 팥죽 지난 주는 코코볼을 많이 먹었음 ### 구해줘 홈즈 ver.요한 ### 강의 진행사항 #### 석진 - 3.1 FastAPI까지 #### 요한 - 3.1 FastAPI 완료 #### 한진 - 2.5 완료 ### 최종 프로젝트 진행 사항 #### 호영 - valid accuracy가 0.83 - 경제, 기업, IT/과학을 1로 라벨링, 나머지는 0으로 라벨링 - 종합 뉴스를 테스트 데이터로 사용해서 실험 결과 확인해보는 중 - 왜 KoBERT를 사용하였는가? - 다른 모델과의 성능 비교 - 라이센스 확인 ![](https://i.imgur.com/tgM8GqK.png) ##### 결과분석 - #### 100 - 다트 - passage 단위로 쪼갬 - EDA 해보고 추가적인 전처리만 용도에 따라 진행하면 될 것 같음. #### 석진 - 다트 2 - 기업 목록은 추림 - 어느 범위까지 뽑아낼지 정해야 함(못정해서 clean column도 일단 안버림) #### 요한 - 뉴스 - 이메일, 특수문자 제거 -> ver 1.1 huggingface 업로드 완료 - NER + BM25 시도중 - 입력 Window 설정 필요 - 출력 길이가 잘리는 문제 - Class를 간소화 - KLUE-NER?