01. 지도 학습과 비지도 학습의 구분

 

📌 지도학습 : 정답을 알려주고 학습하기에 입력과 정답 쌍이 필요.


🔍 회귀 : 출력이 연속적인 값
      ▸연속적인 값은 두 값 사이에 무한히 많은 다른 값들이 존재하는 경우를 뜻함.
      ▸ex ) 키, 몸무게, 시간 , 온도 등

🔍  분류 : 출력이 이산적인 값으로 이진분류다중분류로 나뉜다.
     ▸이산적인 값은 서로 떨어져 있는 값들을 뜻함.
     ▸ex ) 학생 수, 자동차 대수, 시험점수, 물건의 갯수 등
     ▸이진 분류 : 두 개의 카테고리중 하나로 데이터를 분류하는 문제를 뜻함 ( 맞다 / 아니다 , 있다 / 없다 등 )
     ▸다중 분류 : 세 개 이상의 카테고리중 하나로 데이터를 분류하는 문제를 뜻함 ( 1번 / 2번 / 3번 등 )

 

 

📌 비지도학습 : 정답을 알려주지 않고 자율적으로 학습하는 것


🔍 군집화 :  군집화는 데이터가 어떤 라벨이나 정답 없이 비슷한 특성 을 가진 그룹으로 묶는 작업.
     ▸군집화의 주요 목적은 데이터를 이해하고, 비슷한 특성을 가진 데이터 포인트들을 묶어서 패턴을 발견하는 것

     ▸ex ) 고객 세분화, 뉴스 기사 클러스터링, 이미지 세그멘테이션 등

 


02. 지도 학습

지도학습 예제

 

 

이미 정답 ( 레이블이 되어 있는 데이터 ) 을 알고 있는 상태에서 훈련 데이터 ( 학습데이터 ) 를 이용하여 학습 시키는 방식.
이와 같은 학습법은 시험 성적 예측이나 주가 예측, 스팸 메일 분류 등에 활용이 가능하다.

지도학습의 주요 기본 알고리즘은 선형 회귀 , 다항 회귀, 의사결정 트리, K-최근접 이웃 이 있다.

 


03. 비지도 학습 (군집화)

하나하나 정답을 주지 않더라도 데이터의 특성을 파악하여 컴퓨터 알고리즘 적용에 따라 비슷한 사진끼리 묶어주는 학습 방식.

이와 같은 학습법은 비슷한 뉴스를 클리핑 하거나, 광고에서 사용하는 타겟군의 구성을 구축하는데 사용하기도 하며, 비슷한 단어를 묶는 군집화에서도 사용한다.

비지도 학습의 주요 기본 알고리즘은 K-평균(K-Means) 등이 있다.

🔍군집화 외에 차원축소나 연관 규칙 학습 등도 비지도 학습에 포함 된다.