-
비지도 학습 TOP NEW
비지도 학습 6-1 군집 알고리즘 주제: 비지도 학습과 군집 알고리즘에 대한 이해 목차 1. 비지도 학습이란? 2. 비지도 학습을 이용한 데이터 분류 비지도 학습이란? 비지도 학습이란 별도의 타겟 데이터 없이 특징만을 가지고 데이터를 학습하는 것 입니다. 비지도 학습을 이용한 데이터 분류 데이터 준비 비지도 학습을 이용한 데이터 분류를 진행하기 위해 과일 데이터를 준비하였습니다. import numpy as np import matplotlib.pyplot as plt !wget https://bit.ly/fruits_300 -O fruits_300.npy fruits... Read More
-
트리 알고리즘 TOP NEW
트리 알고리즘 5-1 결정 트리 주제: 결정트리를 이용한 와인 분류 목차 1. 로지스틱 회귀를 이용한 와인 분류 2. 결정 트리란? 3. 결정 트리를 이용한 와인 분류 로지스틱 회귀를 이용한 와인 분류 # 데이터 수집 import pandas as pd wine = pd.read_csv('https://bit.ly/wine-date') # 데이터 정보 알아보기 wine.head() head 메서드를 이용하면 처음 5개의 샘플을 확인할 수 있습니다. 표를 통해서 특성값에는 알코올 도수, 당도, ph가 있으며 이진 분류 문제라는 것을 알 수 있습니다. # 데이... Read More
-
다양한 분류 알고리즘 TOP NEW
다양한 분류 알고리즘 4-1 로지스틱 회귀 주제: 로지스틱 회귀를 이용한 분류 목차 1. knn을 이용한 확률 분류 2. 로지스틱 회귀란? 3. 로지스틱 회귀를 이용한 이진 분류 4. 로지스틱 회귀를 이용한 다중 분류 knn을 이용한 확률 분류 knn을 사용하여 도미와 빙어 분류를 진행하겠습니다. 초반의 데이터 준비 및 모델 학습은 이전과 같은 과정이므로 설명은 생략하도록 하겠습니다. # 데이터 준비 import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv') fish.head() # 데이터 특성 확인... Read More
-
회귀 알고리즘과 모델 규제 TOP NEW
회귀 알고리즘과 모델 규제 3-1 K-최근접 이웃 회귀 주제: 농어의 길이를 이용한 무게 예측 목차 1. 데이터 처리 2. 학습및 평가 3. 과대적합과 과소적합 데이터 처리 농어의 길이를 이용해 농어의 무게를 예측해야 하므로 다음은 농어의 길이 데이터와 무게 데이터를 가져왔습니다. import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0... Read More
-
k-최근접 이웃을 활용한 머신러닝 TOP NEW
k-최근접 이웃을 활용한 머신러닝 1-3 마켓과 머신러닝 주제: 두 종류의 생선을 분류하는 머신러닝 목차 1. 데이터 수집 2. 데이터 시각화 3. 머신러닝 모델 선정 4. 학습과 예측 5. knn모델에 관하여 데이터 수집 분류하고자하는 생선의 종류는 도미와 빙어가 있습니다. 다음은 도미와 빙어의 길이, 무게에 관한 데이터입니다. #도미 데이터 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.... Read More
-
데이터 탐색과 시각화에 관하여 TOP NEW
데이터 탐색과 시각화에 관하여 (1) 탐색적 데이터 분석 — 탐색적 데이터 분석이란 가공되지 않은 데이터를 있는 그대로 탐색하고 분석하는 기법입니다. 이 과정의 목적은 다음과 같습니다. 데이터의 형태와 척도 확인 (데이터의 형태는 구조, 타입, 차원, 형식등을 의미함/ 데이터의 척도는 속성을 의미함) 데이터의 평균, 분산, 분포, 패턴 등 특성 파악 데이터의 결측값 혹은 이상치 파악 변수간 관계 파악 다음은 라이브러리를 활용하여 EDA를 진행하였습니다. import seaborn as sns import matplotlib.pyplot as plt import pandas as pd sns.... Read More