지도학습

· 머신러닝
지도학습의 분류 학습으로 머신러닝 Decision Tree 모델을 배우다. 학습목표 Decision Tree 알고리즘 이해 Label Encoding, One-hot Encoding을 이해 교차 검증 기법을 이해 Encoding이란 범주형 데이터, 즉 문자 데이터를 수치형 데이터로 변환하는 것이다. 반대로 수치형 데이터를 범주형 데이터로 변환하는 것은 Binning이다. 교차 검증 기법은 모든 데이터를 나눠서 학습하고 검증하는 방법이라고 알고 있으면 된다. 1. Decision Tree(결정 트리) 모델 Decision Tree(결정트리) 모델은 위의 예시(그림 1)를 보면 이해하기 쉽다. 첫 번째로 모든 데이터를 잘 분류할 수 있게 질문을 한다. 그 질문에 맞게 데이터를 분류하고 또 질문해서 분류를 하..
· 머신러닝
KNN 모델을 지도학습의 분류로 학습시켜 Iris 붓꽃 품종 분류 실습하다. 전 글에서 다뤘던 지도학습의 7단계 과정으로 Iris 붓꽃 품종 분류를 하고 일반화, 과대적합, 과소적합 개념들과 문제데이터, 정답데이터를 분리하고 각각의 데이터를 훈련데이터, 평가데이터를 비율에 맞춰서 나눠야 하는데 기존에 사용했던 인덱싱의 문제점을 설명하고 새롭게 train_test_split( ) 함수를 사용해서 나누는 방법도 설명하겠다. 1. 문제 정의 머신러닝 모델 학습의 목표를 구상하는 서류작성 단계?로 생각하기 목표 : 붓꽃의 품종을 구분하는 머신러닝 모델 만들기 사용할 학습 방법 : 지도학습 - 분류 2. 데이터 수집 sklearn에서 기본적으로 제공하는 Iris 데이터셋을 사용하기 때문에 딱히 csv파일을 읽는다..
· 머신러닝
sklearn.neighbors 모델을 만들고 지도학습시켜서 머신러닝 실습을 하다. 머신러닝의 학습 단계는 7단계로 구성되어 있다. 각 단계를 설명하면서 실습도 함께 진행하려고 한다. 문제 정의 데이터 만들기 데이터 전처리 탐색적 데이터 분석 (EDA) 모델 생성(선택) 및 하이퍼 파라미터 정의 (튜닝) 모델 학습 정확도 평가 1. 문제 정의 학습단계 중 1단계인 문제정의에 대해 설명하겠다. 문제 정의 단계는 문서작성하는 단계와 비슷하다. 목적 : 머신러닝을 통해서 어떤 문제를 해결할 것인지? -> 비만을 판단하는 모델 만들기 학습 선택 : 지도학습 vs 비지도학습 vs 강화학습 -> 지도학습 지도학습에서 분류 vs 회귀 -> 분류 (저체중, 정상, 과체중, 비만 등) 결론 : 비만을 판단하는 모델 만들..
· 머신러닝
머신러닝의 정의, 학습 종류를 배우다. 1. 머신러닝 머신러닝 : 2D, 표 형태의 데이터에서 규칙을 찾아내는 과정 사용하는 데이터를 기반으로 학습 또는 성능 향상을 지원하는데에 초점을 둔다. 2. 머신러닝 학습 종류 머신러닝의 학습 종류를 알기 전에 머신러닝에서 사용되는 X, y에 대해서 알아보자. 대소문자 구별 X는 문제데이터, 특성, feature, 독립변수, 속성과 같은 의미를 지닌다.y는 정답데이터, target, Label, 종속변수과 같은 의미를 지닌다.X는 테스트, y는 검증하는 데이터라고 생각하면 편하다. 1. 지도 학습 문제와 정답을 주고 학습시킨다. 사람이 직접 데이터에 개입하므로 정확도가 높은 데이터를 사용할 수 있다. 대신 사람이 직접 해야하기때문에 인건비 문제가 있고, 데이터 양..
이뮨01
'지도학습' 태그의 글 목록