# [12/23] Data Science - Statistics
###### tags: `여천` `레벨 1` `데이터 과학`
1. 온라인 공유 : https://bit.ly/3hMVgQm
1. 강의자료: X
- http://aispiration.com/statistics/
- https://rpubs.com/statkclee/shiny
# 참여
## 강사
강사 : 이광춘
## 수강생
1. 신용중
1. 문보국
1. 송승혁
1. 이인해
1. 이헌상
1. 신용주
1. 이준영
1. 한규운
1. 신진우
1. 윤영조
## 교육일정
- 오전: 10:00 ~ 12:00
- 점심
- 오후: 13:00 ~ 15:00
# 자료명칭 대한 기본지식
- 행렬(Matrix): 데이터셋(Dataframe): 테이블(Table)
- 행(Row): 관측점 (Observation): 레코드(Record)
- 칼럼/열(Column): 변수(Variable): ???
# Master Algorithm
https://aispiration.com/ai-lab/master-algorithm.html
- Varchar: character --> 범주형(factor)
# chatGPT
- 처음 듣는다:xXxxxx
- 언론을 통해 들어 대략 알고 있다:
- 써봤다:
## 데이터셋
MNIST 데이터셋: https://aispiration.com/deep-learning/r-keras-mnist.html
!pip3 install -U scikit-learn
```
# Import the necessary libraries
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
# Load the iris dataset
iris = datasets.load_iris()
# Split the data into features and labels
X = iris.data
y = iris.target
# Split the data into training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# Create a logistic regression model
model = LogisticRegression()
# Train the model on the training data
model.fit(X_train, y_train)
# Evaluate the model on the test data
score = model.score(X_test, y_test)
# Print the accuracy of the model
print("Accuracy:", score)
```
Accuracy: 0.9666666666666667
- [x] 이광춘: ex) sklearn 설치 실패
- [ ] 신용중
- [x] 문보국
- [x] 송승혁
- [ ] 이인해
- [x] 이헌상
- [x] 신용주
- [x] 이준영
- [ ] 한규운
- [x] 신진우
- [ ] 윤영조
## 간단한 여론조사
chatGPT를 간단히 써본 후에 든 다음 중 하나를 고르세요. x 꽃표를 해주세요.
- chatGPT가 데이터 과학자를 대신할 것이기 때문에 나는 더이상 데이터 과학 학업을 포기한다: Xxxx
- chatGPT가 데이터 과학자 업무 생산에 큰 기여를 할 것이기 때문에 나는 더욱 데이터 과학 업무에 전념할 것이다: XXxx
# 들어보거나 아시는 분포를 적어주세요
소스코드: https://github.com/statkclee/shiny-apps