---
tags: '피어세션'
---
211209 피어세션
===
- 기록자 :
- 오늘의 한마디
진행 해야 될 것
---
- TodoList 리마인더
질문 정리
---
피어세션 진행
---
- 멘토링
- 자기소개
- 질문
- AI Engineer에게 중요한 역량은?
- 빠르게 습득, 공부습관, 기본기, 시간관리, 판단련, 문제정의능력
- 4개월 동안 느낀 나의 장점/강점은?
- 남은 기간 어떻게 취업 준비할지 계획 공유
- 멘토링 시간 어떻게 활용할지?
- 중국어-영어: 데이터 1500만개
- 필터링 방법
- 길이 짧은 문장 제거
- 모델 학습
- 영어-한국어부터 시작: 종현님 서버에서 돌리는중
- 경량화 작업
- Weight Distilllation 논문으로 -> 코드도 있음
- Knowledge Distillation 중에 Layer마다 Distill하는 방법이 있는데, 이와 Weight Distillation과의 차이는 무엇인가?
- 여기서 Selective 논문도 적용할 수 있을 것 같음
- Pruning
- Github Issue
- 채원님: 영어
- 종현님: 한국어
- 동규님: 중국어
- MLFlow 강의 듣기
- Linux에서 GPU, CPU monitoring
- GPU: gpustat -i
- pip install gpustat
- CPU: bottom github 검색해서 확인
- 프로세스 확인 및 kill할때 편함
- tmux
- apt install tmux
- tmux new -s 세션이름
- tmux attach -t 세션이름
- link: https://responsible-crush-a60.notion.site/tmux-eb34d34c2b4e4527aa4d4739a67648de
- du -h --max-depth=1
- 윈도우: mobaXterm
- 프로젝트 피드백 세션
- 기획 보다는 기술적 디테일
- 모델 개발과 기술적 이슈를 해결하기 위해 어떤 점들을 고려하였는지가 wow 포인트가 될 수 있다
- 기획 단계의 어필은 서비스 이용 단계에서 있을 수 있는 문제들을 정의하고, 이를 기술적으로 어떻게 풀어냈는지
- 모델의 요구사항을 한번 정리해주면 좋을 듯. -> 감안을 했는지가 중요.
- 프로젝트에 대한 감각을 어느정도 느낄 수 있는지도 중요하다. 프로젝트의 타임라인이라던가, 각을 재보고 시작을 했는지 등등. 이러한 내용이 잘 드러나도록 발표를 하는 것도 좋은 방법.
- 자연어 생성 태스크는 발화되는 문장이 윤리적 이슈가 있는지, 개인정보 문제가 있는지의 이슈는 늘 따라온다. 이를 고려해주는 것도 좋은 방법.
- 사용자의 피드백을 어떻게 받을 것인지도 하나의 아이디어, 데이터가 어떻게 흐르는지, 어떤 데이터가 생성될 수 있는지 고민해라.
-
내일 까지 계획
---