# NLP
### 고문서 기계번역 프로젝트
> 경북대학교 [ABR Lab.](http://abr.knu.ac.kr/) / 2017.05 ~ 2018.11 (1년 7개월)

- 고문서 분석결과를 제공하는 디지털 라키비움 프로젝트에 참여하여, **OCR 시스템의 번역 모델 개발**을 담당하였습니다.
- 특정 지명, 인명, 관직명과 같은 고유명사 단어에서 발생하는 OOV(Out-Of-Vocabulary) 문제 해결을 위해, 파이썬 정규 표현식을 사용하여 문장에서 한자와 한글이 병기 처리된 고유명사를 추출하여 토큰화에 활용하였습니다.
- 고유명사 단어와 문자 임베딩을 함께 학습하여, BLEU 스코어 47% 개선하였습니다.
**Code** : [link](https://bitbucket.org/hossay/nmt/src/master/); **Notion** : [link](https://checker-zinnia-239.notion.site/Translation-of-Traditional-Korean-Literature-5a30861d1b38407fada709f2efe29def);
**논문 성과**
<iframe src="https://drive.google.com/file/d/1xwkXIBzFP3ZPVUW-OMwjyJGaU0MQxCk_/preview" width="50%" height="250" allow="autoplay"></iframe>
<iframe src="https://drive.google.com/file/d/1rrWPCTvxcIYUdwtfOHfbVEiK5-7cKBP4/preview" width="50%" height="250" allow="autoplay"></iframe>
<br>
### BERT 기반 NER API 서버 개발
> 경북대학교 [ABR Lab.](http://abr.knu.ac.kr/) / 2018.11.07 ~ 2018.11.11 (4일)

- 사용자의 채팅에서 **장소, 인물 등의 엔티티를 인식**해서 구글 지도 혹은 위키피디아에서 검색해주는 서비스를 개발하였습니다.
- BERT 기반 NER 모델을 사용하여 대화에서 장소, 유명인, 영화 제목 등의 엔티티를 추출하였습니다.
- 서빙 API는 파이썬 Flask로 구현하였으며, BERT 모델의 추론 결과를 앱 클라이언트에 제공하였습니다.
- 안드로이드 어플 개발자에게 API를 제공하여 채팅 어플을 구현하였고 이를 CES2019에서 전시 했습니다.
**Code** : [link](https://bitbucket.org/hossay/dnc_context/src/master/)
<br>
### Retrieval 기반 개그 챗봇
> 경북대학교 [ABR Lab.](http://abr.knu.ac.kr/) / 2018.10 ~ 2018.11 (2개월)

- Google Dialogflow를 사용하여 저만의 챗봇을 빌드하기 위해 진행한 사이드 프로젝트입니다.
- 한국어 대화 스크립트 데이터를 구축하여 Bidirectional RNN 기반의 챗봇 모델을 빌드했습니다.
- 사용자 intent에 대응되는 case를 분류하여 대응되는 문장(아재개그 퀴즈, 잡담 등)을 반환하는 **retrieval 기반 챗봇**을 구현하였습니다.
- **Google Dialogflow의 webhook 기능**을 활용하여 Flask로 구현된 챗봇 API 서버와 google 어시스턴트를 연동하였습니다.