tags: 연대강의

평가관련

  • 성적평가: 절대평가
    • 팀평가
      • 팀 프로젝트 완성도
      • 개인 기여도
        • 코드
        • 개발문서
        • 커뮤니케이션(Issue, Project 진도관리 등)
        • 발표
      • 발표형식 (6/22)
        • 25분 발표, 5분 QnA
        • R마크다운 문서
        • 참여자 모두 돌아가면서 발표
      • 팀별 발표내용은 녹화 후 편집하여 강의 웹사이트에 공개 예정
    • 개인평가
      • Datacamp 수료증 갯수
        • 학생들마다 이수해야 되는 과목수가 차이남은 인정함.
        • 최종 개인별 대쉬보드 화면 캡쳐 후 전자우편 송부
        • 이수한 과목 각 자격증 pdf 파일로 변환 후 압축하여 전자우편 송부
      • https://statkclee.github.io/ds-intro-2020/ 강의 사이트에 pull 요청
        • 이력서(한글): HTML 웹사이트, Github repo
        • 데이터 과학 블로그: HTML 웹사이트, Github repo, 블로그 게시건수는 월 1회 기준 최소 4개 이상 되어야 합니다.

6월 15일

프로젝트

Team CASA

  • 마무리 작업
    • 최종 모델링 완료 (K-prototype + ARIMA)
    • 발표자료 문서화

코뿔소

사응일간

  • 대시보드 제작 완료
    • 예측과 이상치 탐색 두 종류로 제작
  • 모델링 데이터 수정(완료, Catboost)
    • NA handling, regression vs classification 고민중
  • md 파일, 발표 자료 제작 중

https://statkclee.github.io/model/model-anomaly.html

골든타임

  • 제언 파트에 활용할 행정구역별 인구 자료 확인, 시각화
  • 대쉬보드 제작 중, 파이썬 코드 Rmd 파일 정리

범주형 자료

범주형 자료를 잘 다뤘으면 좋았을 경험이나 사례를 혹시 가지고 계시면 아래 적어주세요. 아니면 지금 프로젝트에서 범주형 자료 사용할 경우가 있는지도

  • 범주형 변수 중에 순서가 있는 범주형 변수를 다루는 부분을 어떻게 처리할지가 어려운 것 같습니다.

  • 이번 프로젝트에서도 범주형 데이터가 꽤 있는데 이 부분을 다룰 때 고민을 많이 했습니다.

  • 설문조사 실시 후 기술통계 이외에 검정이나 시각화 등 다른 의미있는 결과를 내기 어려웠습니다.

  • 설문조사 자료를 접할 기회가 있었는데 그전까지는 범주형 자료를 다뤄본 경험이 없어서 상당히 까다로웠습니다

  • 순서형 변수와 비순서형 변수를 동시에 갖는 설문조사 데이터를 다뤘는데, 이들을 종합하여 분석하는 것이 까다로웠습니다.

  • 타겟이 범주형인 경우 박스플랏 외에 다양한 시각화 방법을 찾기 힘들었습니다.

  • 모델링에 있어서 범주형 자료의 사용이 제한적인 경우가 있었습니다.

  • 사실상 모든 것이 데이터화되고 있는 사회이기 때문에 잘 다루는것이 무조건 이득인 것 같습니다.

https://statkclee.github.io/finance/stat-fe-r.html

Select a repo