본문 바로가기

파이썬18

(P)제18강(01)_t 검정(파이썬) - ttest_ind() : SAS, R 비교 파이썬으로 해 보는 t 검정입니다. 통계분석용으로 많이 사용되는 scipy 패키지를 이용합니다. 아나콘다를 설치하면 scipy가 자동으로 설치됩니다. scipy 패키지에서 통계분석 모듈인 stats를 불러오고, 그중 독립적인 두 집단 검정인 ttest_ind를 이용합니다. (참고적으로 SAS에서는 PROC TTEST; R에서는 패키지 {stats}의 t.test( )를 이용합니다.) 이렇게 R과 파이썬을 사용하는 방법이 유사합니다. R은 통계분석용으로 많이 사용되고 있고 파이썬은 분석용 솔루션을 개발하는데 많이 사용됩니다. >>> from scipy.stats import ttest_ind # 패키지 scipy의 stats 모듈에서 ttest_ind함수를 불러옴 x1 = [60,66,72,78,84,80.. 2021. 12. 18.
(p1)제02강(01)_로지스틱회귀모형- sklearn-iris 사이킷런(sklearn)을 이용한 로지스틱 회귀모형의 예제입니다. 데이터는 사이킷런에 들어있는 iris 데이터를 사용하였습니다. [전체 프로그램] import pandas as pd from sklearn.datasets import load_iris iris = load_iris() X= pd.DataFrame(iris.data,columns=iris.feature_names) y= pd.Series(iris.target) from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X,y, train_size=0.7, test_size=0.3, random_state=1234.. 2021. 12. 16.
(P)제05강(09)_UCI Irvine Machine Learning Reposi.. 이용 UCI Irvine Machine Learning Repository 이용하여 버섯데이터(mushroom.csv) 와 붓꽃데이터(iris.csv) 불러오기 UCI Irvine Machine Learning Repository 에 가시면 머신러닝 실습을 위한 수많은 데이터들을 볼 수 있습니다. ## (7.1) mushroom 버섯데이터 불러오기 import urllib.request as req local = "mush.csv" url="https://archive.ics.uci.edu/ml/machine-learning-databases/mushroom/agaricus-lepiota.data" req.urlretrieve(url,local) UCI Machine Learning Repository 화면입.. 2021. 12. 13.
(P)제05강_손글씨 파일 읽어오기 - sklearn, MNIST [출처] 오래 되어 기억이 가물가물 합니다. 찾아서 추가하도록 하겠습니다. ^^^ import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_digits # c:> pip show scikit-learn # Location d:\Anaconda3\Lib\site-packages # d:\Anaconda3\Lib\site-packages\sklearn\datasets digits = load_digits() from sklearn.preprocessing import scale data = scale(digits.data) def print_digits(images,y,max_n=10): fig = plt.figu.. 2020. 12. 18.
(P)제05강_파이썬으로 SAS 파일불러오기 파이썬에서 SAS 파일을 읽어 들이는 방법은 매우 간단합니다. R에서는 install.packages("sas7bdat") library(sas7bdat) sas_r 2020. 12. 14.
(P)제05강_파이썬 iris 데이터 이용하기 파이썬에서 seaborn 라이브러리에 내장된 데이터를 불러오면 됩니다. R패키지는 함수와 샘플데이터, 샘플프로그램들을 포함하고 있습니다. R에서는 library(패키지이름) 명령문으로 샘플데이터를 사용할 수 있습니다. iris 데이터는 R 패키지 datasets에 포함되어 있습니다. 파이썬에서는 seborn 라이브러리에서 load_datset( ) 를 이용하여 데이터를 불러올 수 있습니다. import seaborn as sns iris = sns.load_dataset('iris') iris.head(6) 타이타닉 데이터를 불러오려면 titanic = sns.load_dataset('titanic') titanic.head(6) 그럼 seaborn에서 어떤 데이터가 내장되어 있는가?를 보려면 sns.g.. 2020. 12. 14.