owned this note
owned this note
Published
Linked with GitHub
###### tags: `연대강의`
# 4월 20일
1. [Casa](https://github.com/whoareyouwhoami/ProjectCasa):
1) 시계열 분석 방법으로 아파트 거래가 예측
- 예상 이슈: 매매 행위가 자주 일어나지 않기 때문에 아파트 하나당 거래량이 많지 않고, 시계열 간 공백이 생기는 문제가 발생
- 해결 방안: 비지도학습을 통해 샘플 확보
2) 비지도학습을 통해 서울 내 다른 지역의 데이터와 유사한 샘플을 수집
- 예상 이슈: 같은 달에 여러 샘플이 중첩되어 나타나는 문제.
- 해결 방안: 여러 개의 대표값을 기준으로 각각 다른 모델링을 적용하여 사용자에게 다양한 정보를 제공
3) 컨셉 수정
- ‘특정 시기의 아파트 가격’을 정확하게 예측하는 것 대신, 아파트를 구매하려는 고객에게 판단 기준을 제공하는 컨셉으로 수정
- 라이브러리 대신 쉘에서 이루어진 컨셉으로 수정
4) 데이터 수집 확대₩
- 역세권 및 가장 가까운 역을 찾기 위해 지하철 좌표 정보 크롤링
5) 역할 분배
- 모델링 및 아키텍쳐 설계: 양정열, 조유림
- Raw Data 크롤링/서버/DB관리: 주용우
- 기타 데이터 크롤링/전처리: 이형선
3. [골든타임](https://github.com/twg12/IntroToDataScience_5):
1) 주제 : 위치 데이터를 통해 병원(특히 대형종합병원)이 부족한 지역 분석
2) 개요 : 국내 의료시설 분포 파악;
특징 추출 및 의사 결정 트리를 활용한 응급실사각지대 분석예측; 의료 사각지대 시각화
4) 수집할 데이터
1) [응급 의료 데이터 포털](https://www.e-gen.or.kr/egen/main.do)
1) 응급실 위치 데이터
2) 병원, 약국
3) 자동심장충격기(AED) 위치
5) 구현 방안
1) 수집한 위치 기반 데이터 바탕으로 응급 시설이 부족한 지역 시각화
2) 의료 사각지대의 기준 설정
3) 설정한 알고리즘, 데이터 기반으로 현재 위치의 안정성 검토 예정.
현재 github에 datapipeline baseline 구축 중 (80%)
https://github.com/twg12/IntroToDataScience_5 (branch: develop에 merge )
5. [코뿔소](https://github.com/statkwon/rhino):
- 주제 : 서울시 수소차 충전소 입지 선정
- 개요 : 최근 심각해진 미세먼지 등의 환경 문제에 대한 대책으로 수소차의 생산 및 보급 이슈가 주목받고 있다.이와 관련하여 서울시는 현대차가 수소전기차 보급 활성화를 위한 MOU를 체결하는 등의 노력을 기울이고 있다. 다만, 수소차 충전소 인프라 형성이 아직 미흡한 탓에 보급에 다소 어려움을 겪고 있는 실정이다. 환경부와 국토교통부 등의 관련 부처에서는 2040년까지 총 1200기의 충전소를 설치할 예정이다. 이에 대해 지역, 사회별 변수들을 고려하여 서울 시내의 적합한 수소차 충전소 입지를 선정하는 것을 목표로 한다.
- 세부 일정
① 수소차 및 수소전기차 개념 정리(환경부 발표 자료, 관련 논문 등 참고), 관련 데이터 찾기
② 변수 선정(27일 수업 후 회의)
③ 데이터 클렌징
7. [사응일간](https://github.com/YooGunWook/1nurse4stat) :
- 프로젝트에 필요한 데이터 크롤링 진행중입니다.
- 현재 개발된 크롤러 : 가온차트, 유투브, 구글 트렌드 데이터 크롤러
- 음원 순위 예측에 관련된 논문 리서치 하고 있습니다.
- 주제에 맞게 데이터 변환 논의 진행중.
- 조원별 현재 역할
- 오태환 : 구글트렌드, 네이버 트랜드 크롤링
- 유건욱 : 가온차트, 멜론, 지니 등 음원차트 사이트 크롤링
- 강동원 : 유투브 데이터 크롤링
- 백원희, 이청파 : 관련 논문 리서치
# 프로젝트 저장소 및 개인 저장소
1. [이광춘, blog](https://github.com/statkclee/myblog)
1. Casa: [이형선](https://github.com/traceofpassion/SunnyBlog), [양정열](https://github.com/passionyang16/blog), [김채형](https://github.com/cheris8/IntroductiontoDataScience.git), [주용우](https://github.com/whoareyouwhoami/ProjectTea.git), [조유림](https://github.com/whdbfla6/myblog)
1. Emergency Cost: [손지현](https://github.com/twg12/jhs_introds), [이시우](https://github.com/SeewooLi/BLOG), 서아론, [박경재](https://github.com/Hankpkj/myblog), [정윤호](https://github.com/YoonHoJeong/data_science_blog), [조병준](https://github.com/joahn-lab/myblog.git)
1. 코뿔소: [서경덕](https://github.com/Gyeongdeok/myblog), [손지우](https://github.com/SonJiwoo/blog), [이재상](https://github.com/jaesanglee95/jayblog), [이현탁](https://github.com/11aw1iet/myblog.git), [정권상](https://github.com/statkwon/myblog)
1. 사응일간: **[오태환](https://github.com/dhxoghks95/Ohtaihwan)** [강동원](https://github.com/dw3624/Noname) [백원희](https://github.com/Wonhee-baek/blog) [유건욱](https://github.com/YooGunWook/DataScience_blog) [이청파](https://github.com/leechungpa/blog)
## 작업방법
1. 본인 GitHub 계정에 저장소를 하나 만든다. (blog)
2. 로컬 컴퓨터에 연결: git clone git@github.com:statkclee/myblog.git
3. RStudio에 프로젝트를 만들어서 연결시킨다.
4. Hackmd에 반영한다.
# 블로그 제작
GitHub 저장소와 개인블로그 작성 (blogdown)
- https://statkclee.github.io/comp_document/
- https://statkclee.github.io/comp_document/ds-blogdown.html
1. RStudio IDE에서 blogdown 팩키지 설치
1. 휴고 설치: blogdown::install_hugo(force = TRUE)
1. blogdown::new_site()
1. www.netlify.com 계정
*** Please tell me who you are. 오류가 있으신 분!!!
- git commit 단계에서...
- git config --global user.email "mina@gmail.com"
- git config --global user.name "이광춘"
1. git add -A
2. git commit -m"첫번째 커밋"
3. git push