--- tags: '피어세션' --- 211209 피어세션 === - 기록자 : - 오늘의 한마디 진행 해야 될 것 --- - TodoList 리마인더 질문 정리 --- 피어세션 진행 --- - 멘토링 - 자기소개 - 질문 - AI Engineer에게 중요한 역량은? - 빠르게 습득, 공부습관, 기본기, 시간관리, 판단련, 문제정의능력 - 4개월 동안 느낀 나의 장점/강점은? - 남은 기간 어떻게 취업 준비할지 계획 공유 - 멘토링 시간 어떻게 활용할지? - 중국어-영어: 데이터 1500만개 - 필터링 방법 - 길이 짧은 문장 제거 - 모델 학습 - 영어-한국어부터 시작: 종현님 서버에서 돌리는중 - 경량화 작업 - Weight Distilllation 논문으로 -> 코드도 있음 - Knowledge Distillation 중에 Layer마다 Distill하는 방법이 있는데, 이와 Weight Distillation과의 차이는 무엇인가? - 여기서 Selective 논문도 적용할 수 있을 것 같음 - Pruning - Github Issue - 채원님: 영어 - 종현님: 한국어 - 동규님: 중국어 - MLFlow 강의 듣기 - Linux에서 GPU, CPU monitoring - GPU: gpustat -i - pip install gpustat - CPU: bottom github 검색해서 확인 - 프로세스 확인 및 kill할때 편함 - tmux - apt install tmux - tmux new -s 세션이름 - tmux attach -t 세션이름 - link: https://responsible-crush-a60.notion.site/tmux-eb34d34c2b4e4527aa4d4739a67648de - du -h --max-depth=1 - 윈도우: mobaXterm - 프로젝트 피드백 세션 - 기획 보다는 기술적 디테일 - 모델 개발과 기술적 이슈를 해결하기 위해 어떤 점들을 고려하였는지가 wow 포인트가 될 수 있다 - 기획 단계의 어필은 서비스 이용 단계에서 있을 수 있는 문제들을 정의하고, 이를 기술적으로 어떻게 풀어냈는지 - 모델의 요구사항을 한번 정리해주면 좋을 듯. -> 감안을 했는지가 중요. - 프로젝트에 대한 감각을 어느정도 느낄 수 있는지도 중요하다. 프로젝트의 타임라인이라던가, 각을 재보고 시작을 했는지 등등. 이러한 내용이 잘 드러나도록 발표를 하는 것도 좋은 방법. - 자연어 생성 태스크는 발화되는 문장이 윤리적 이슈가 있는지, 개인정보 문제가 있는지의 이슈는 늘 따라온다. 이를 고려해주는 것도 좋은 방법. - 사용자의 피드백을 어떻게 받을 것인지도 하나의 아이디어, 데이터가 어떻게 흐르는지, 어떤 데이터가 생성될 수 있는지 고민해라. - 내일 까지 계획 ---