# NLP ### 고문서 기계번역 프로젝트 > 경북대학교 [ABR Lab.](http://abr.knu.ac.kr/) / 2017.05 ~ 2018.11 (1년 7개월) ![](https://i.imgur.com/SY1ZVmj.png =640x480) - 고문서 분석결과를 제공하는 디지털 라키비움 프로젝트에 참여하여, **OCR 시스템의 번역 모델 개발**을 담당하였습니다. - 특정 지명, 인명, 관직명과 같은 고유명사 단어에서 발생하는 OOV(Out-Of-Vocabulary) 문제 해결을 위해, 파이썬 정규 표현식을 사용하여 문장에서 한자와 한글이 병기 처리된 고유명사를 추출하여 토큰화에 활용하였습니다. - 고유명사 단어와 문자 임베딩을 함께 학습하여, BLEU 스코어 47% 개선하였습니다. **Code** : [link](https://bitbucket.org/hossay/nmt/src/master/); **Notion** : [link](https://checker-zinnia-239.notion.site/Translation-of-Traditional-Korean-Literature-5a30861d1b38407fada709f2efe29def); **논문 성과** <iframe src="https://drive.google.com/file/d/1xwkXIBzFP3ZPVUW-OMwjyJGaU0MQxCk_/preview" width="50%" height="250" allow="autoplay"></iframe> <iframe src="https://drive.google.com/file/d/1rrWPCTvxcIYUdwtfOHfbVEiK5-7cKBP4/preview" width="50%" height="250" allow="autoplay"></iframe> <br> ### BERT 기반 NER API 서버 개발 > 경북대학교 [ABR Lab.](http://abr.knu.ac.kr/) / 2018.11.07 ~ 2018.11.11 (4일) ![](https://i.imgur.com/2YgiijF.gif) - 사용자의 채팅에서 **장소, 인물 등의 엔티티를 인식**해서 구글 지도 혹은 위키피디아에서 검색해주는 서비스를 개발하였습니다. - BERT 기반 NER 모델을 사용하여 대화에서 장소, 유명인, 영화 제목 등의 엔티티를 추출하였습니다. - 서빙 API는 파이썬 Flask로 구현하였으며, BERT 모델의 추론 결과를 앱 클라이언트에 제공하였습니다. - 안드로이드 어플 개발자에게 API를 제공하여 채팅 어플을 구현하였고 이를 CES2019에서 전시 했습니다. **Code** : [link](https://bitbucket.org/hossay/dnc_context/src/master/) <br> ### Retrieval 기반 개그 챗봇 > 경북대학교 [ABR Lab.](http://abr.knu.ac.kr/) / 2018.10 ~ 2018.11 (2개월) ![](https://i.imgur.com/Az90Fxr.gif =x320) - Google Dialogflow를 사용하여 저만의 챗봇을 빌드하기 위해 진행한 사이드 프로젝트입니다. - 한국어 대화 스크립트 데이터를 구축하여 Bidirectional RNN 기반의 챗봇 모델을 빌드했습니다. - 사용자 intent에 대응되는 case를 분류하여 대응되는 문장(아재개그 퀴즈, 잡담 등)을 반환하는 **retrieval 기반 챗봇**을 구현하였습니다. - **Google Dialogflow의 webhook 기능**을 활용하여 Flask로 구현된 챗봇 API 서버와 google 어시스턴트를 연동하였습니다.