# 12월 3일 피어세션 ###### tags: `peer-session` # 최종 프로젝트 진행 ## DART #### 데이터 수집 - 재형 - 표 데이터 빼내기 #### 데이터 전처리 - 석진, 호영 - feature 어떤 데이터, 실제 데이터 쓸모 없는것 전처리 ## NEWS #### 뉴스 데이터 Cleansing - 찬미, 한진 - 불용어 블랙 리스트 제작 - 기업기반 화이트리스트 적용 - 사전기반 불용어 블랙 리스트 적용 #### 데이터 제작 툴 구현 - 민재 - 주식 관련 뉴스데이터 선정을 위한 Labeling 툴 개발 ## 모델 #### 모델 및 템플릿 선정 - 요한 - 수집된 데이터에 대한 모델 적용 방법 및 전처리 방향 고민 - 관련 뉴스 분류기 -> TextClassification https://github.com/brightmart/text_classificationhttps://github.com/brightmart/text_classification - 의미있는 단어 -> BM25 - 서빙