본문 바로가기
👩🏻‍💻TECH/머신러닝

지도학습과 비지도학습

by Alicia03 2024. 10. 17.

👀모든 포스팅은 직접 이미지와 글을 작성하고 있습니다. 사용하실 때는 꼭 링크와 출처를 남겨주세요

 

머신러닝은 기계가 규칙을 학습해서 사람이 매번 하기에는 복잡하거나 어려운 일들을 대신 해주는 기술이다. 여기에는 대표적으로 지도학습과 비지도학습 두 가지 방식이 있는데, 오늘은 각각의 정의와 특징을 다뤄보고자 한다. 

지도학습(Supervised Learning)

지도학습은 답(올바른 출력)이 있는 훈련 데이터를 학습하는 방식이다.

 

도학습은 말 그대로 지도를 해주는 학습이다. 틀렸다 맞았다를 판단할 수 있는 데이터가 포함되어 있는 훈련데이터를 통해 기계는 특정 경우에만 올바른 답이 나오는 규칙을 학습한다. 

 

지도학습에는 KNN, 선형회귀, 로지스틱 회귀, 서포트 벡터 머신, 결정 트리, 랜덤 포레스트, 신경망이 있다. 

실제로 위의 모델을 생성할 때는 아래와 같이 X,y를 구분해서 넣어주고 여기서 답에 해당하는 부분은 종속변수인 y이다.

## 독립변수(X)와 종속변수(y) 나눠주기
X = train[train.columns[:-1]]
y = train['target']

## train 데이터를 train과 test 데이터셋으로 나눠주기 
X_train, X_test, y_train, y_test = train_test_split(X, y, train_size =0.25, random_state=20)

비지도학습

비지도학습은 따로 답이 정해지지 않은 훈련 데이터를 학습하는 방식이다. 

 

비지도학습은 지도학습과는 달리 따로 답이 없는 데이터를 기반으로 규칙을 학습힌다. 데이터를 기반으로 특징을 스스로 파악하면서 규칙을 만들어 나가는 것이 비지도 학습이다. 

 

비지도학습에는 차원축소(PCA, t-SNE) Clustering(군집화)가 있다.

아래에서 보이는 것과 같이 따로 답이 존재하지 않고 데이터셋을 기반으로 특정한 규칙을 생성해 산출물을 만들어 낸다. 

# 차원축소 PCA
pca = PCA(n_components=7)

X_pca = pca.fit_transform(X_scaled)

 

 

 

참고문헌

IBM | 지도학습이란 무엇인가요?

 

지도 학습이란 무엇인가요? | IBM

'지도 머신 러닝'이라고도 하는 지도 학습은 머신 러닝과 인공 지능의 하위 범주입니다.

www.ibm.com

코딩 스뮤 | 머신러닝의 종류: 지도학습과 비지도학습 

 

머신러닝의 종류: 지도학습과 비지도학습

머신러닝의 종류: 지도학습과 비지도학습 1. 머신러닝 시스템의 종류 데이터에 레이블(label)의 유무, 학습하는 동안 감독 형태/정보량으로 구분 기준을 둘 경우 머신러닝은 크게 지도학습과 비지

codingsmu.tistory.com