# [12/23] Data Science - Statistics ###### tags: `여천` `레벨 1` `데이터 과학` 1. 온라인 공유 : https://bit.ly/3hMVgQm 1. 강의자료: X - http://aispiration.com/statistics/ - https://rpubs.com/statkclee/shiny # 참여 ## 강사 강사 : 이광춘 ## 수강생 1. 신용중 1. 문보국 1. 송승혁 1. 이인해 1. 이헌상 1. 신용주 1. 이준영 1. 한규운 1. 신진우 1. 윤영조 ## 교육일정 - 오전: 10:00 ~ 12:00 - 점심 - 오후: 13:00 ~ 15:00 # 자료명칭 대한 기본지식 - 행렬(Matrix): 데이터셋(Dataframe): 테이블(Table) - 행(Row): 관측점 (Observation): 레코드(Record) - 칼럼/열(Column): 변수(Variable): ??? # Master Algorithm https://aispiration.com/ai-lab/master-algorithm.html - Varchar: character --> 범주형(factor) # chatGPT - 처음 듣는다:xXxxxx - 언론을 통해 들어 대략 알고 있다: - 써봤다: ## 데이터셋 MNIST 데이터셋: https://aispiration.com/deep-learning/r-keras-mnist.html !pip3 install -U scikit-learn ``` # Import the necessary libraries import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression # Load the iris dataset iris = datasets.load_iris() # Split the data into features and labels X = iris.data y = iris.target # Split the data into training and test sets X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) # Create a logistic regression model model = LogisticRegression() # Train the model on the training data model.fit(X_train, y_train) # Evaluate the model on the test data score = model.score(X_test, y_test) # Print the accuracy of the model print("Accuracy:", score) ``` Accuracy: 0.9666666666666667 - [x] 이광춘: ex) sklearn 설치 실패 - [ ] 신용중 - [x] 문보국 - [x] 송승혁 - [ ] 이인해 - [x] 이헌상 - [x] 신용주 - [x] 이준영 - [ ] 한규운 - [x] 신진우 - [ ] 윤영조 ## 간단한 여론조사 chatGPT를 간단히 써본 후에 든 다음 중 하나를 고르세요. x 꽃표를 해주세요. - chatGPT가 데이터 과학자를 대신할 것이기 때문에 나는 더이상 데이터 과학 학업을 포기한다: Xxxx - chatGPT가 데이터 과학자 업무 생산에 큰 기여를 할 것이기 때문에 나는 더욱 데이터 과학 업무에 전념할 것이다: XXxx # 들어보거나 아시는 분포를 적어주세요 소스코드: https://github.com/statkclee/shiny-apps