목록전체 글 (44)
kang's study
주성분 분석 (PCA)¶ 차원 축소¶ 벡터의 차원을 줄임= 특성의 개수를 줄임¶ 차원이란? 다차원 배열에서 차원은 배열의 축 개수 1차원 배열(벡터)에서 차원은 원소의 개수 주성분 분석은 데이터가 가장 많이 퍼져있는 방향을 찾는다¶ 가장 잘 표현하는 벡터를 찾는게 주성분이다.¶ 두번 째 주성분은 수직으로 찾는다.¶ PCA 클래스¶ In [19]: # !wget https://bit.ly/fruits_300_data -O fruits_300.npy In [20]: import numpy as np fruits = np.load('fruits_300_data') fruits_2d = fruits.reshape(-1, 100*100) In [21]: from sklearn.decomposition import..

k-평균¶ KMeans 클래스¶ In [1]: # !wget https://bit.ly/fruits_300_data -O fruits_300.npy In [2]: import numpy as np fruits = np.load('fruits_300_data') # 2차원 배열로 만든다. (샘플개수, 너비×높이) fruits_2d = fruits.reshape(-1, 100*100) 모델 훈련¶ In [3]: from sklearn.cluster import KMeans km = KMeans(n_clusters = 3, random_state = 42) # 10번 수행 n_iter km.fit(fruits_2d) # 타깃이 없다 Out[3]: KMeans(n_clusters=3, random_state=4..

비지도 학습 (군집, 차원축소)¶ 타깃 값이 없다.¶ 군집 알고리즘¶ 비슷한 샘플끼리 그룹으로 모으기¶ 과일 사진 데이터 준비하기¶ In [1]: #코랩에서 리눅스 셀 명령 !wget https://bit.ly/fruits_300_data -O fruits_300.npy 'wget'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다. In [1]: import numpy as np import matplotlib.pyplot as plt In [2]: # colab # fruits = np.load('fruits_300.npy') fruits = np.load('fruits_300_data') In [3]: print(fruits.shape) # 첫 번째 차원 : 300..