01. 머신러닝이란?

  • 정의: 데이터를 통해 학습하고, 학습한 내용을 바탕으로 예측하거나 결정을 내리는 AI 기술.
  • 예시: 이메일 스팸 필터링, 영화 추천 시스템 등.

 

02. 머신러닝의 세부 유형

📌 지도학습

  • 정답이 포함된 데이터를 사용하여 학습하는 방법. ( 입력-정답 쌍이 필요 )
    고양이와 강아지 사진에 각각 "고양이", "강아지" 라고 라벨을 붙여 컴퓨터에게 가르쳐 주면, 추 후 컴퓨터에게 해당 내용을 물어 보았을 때 학습된 결과 데이터를 기반으로 "고양이"와 "강아지"를 분류 할 수 있음
  • 🔍 사진 분류, 주택 가격 예측, 스팸 이메일 필터링

📌 비지도학습

  • 정답이 없는 데이터를 사용하여 패턴을 찾는 방법.
    여러 사람의 취향을 분석하여 비슷한 취향을 가진 사람들끼리 그룹을 만들어 분류 할 수 있음.
  • 🔍 고객 세분화, 뉴스기사 그룹화, 상품 추천 시스템

📌 강화학습

  • 컴퓨터가 어떤 환경에서 행동을 하며, 그 행동에 대한 보상이나 벌칙을 통해 학습하는 방법. 
  • 🔍 게임 AI, 자율 주행 로봇

 


 

03. 머신러닝의 주요 기법

📌 회귀 분석 모델

  • 정의 : 데이터에서 패턴을 찾아내어 결과를 예측하는 방법( 숫자로 된 값을 예측 ) 으로 예를 들어 집의 크기와 가격 데이터를 통해 새로운 집의 가격을 예측 할 수 있다.
  • 🔍 주택 가격 예측, 내일의 기온이나 주식 가격을 예측 등

📌 분류 모델

  • 정의 : 입력 데이터를 보고 그것이 어떤 그룹에 속하는지 예측하는 방법이며, 이메일이 스팸인지 아닌지, 사진이 강아지인지 고양이인지 분류 할 수 있다.
  • 🔍 스팸메일 필터링, 암 진단 등

📌 의사결정 나무

  • 정의 : 여러가지 질문을 통해 데이터를 분류하는 방법이며, 특정 답변을 통해 고객을 분류 할 수 있다. 
  • 🔍 아키네이터 게임, 고객 이탈 예측, 질병 진단 등

📌 랜덤 포레스트

  • 정의 : 여러 나무를 만들어서 각각의 예측 결과를 모아 최종 결정을 내리는 방법이며, 이렇게 하면 더 정확한 예측이 가능하다 의사결정 나무에서 좀 더 들어가는 개념이라고 볼 수 있다.

📌 K-최근접 이웃

  • 정의 : 새로운 데이터가 들어왔을 때, 가장 가까운 데이터를 보고 그 데이터를 어떻게 분류할지 결정한다, 예를 들어 주변 친구들이 좋아하는 음식을 기반으로 새로운 친구의 취향을 예측 할 수 있다.
  • 🔍 추천 시스템, 이미지 분류 등

📌 클러스터링

  • 정의 : 데이터의 패턴을 찾아서 비슷한 것끼리 그룹을 만드는 방법이며 예를 들어, 고객들을 나이와 구매 습관에 따라 그룹으로 나눌 수 있다.
  • 🔍 추천 시스템, 이미지 분류 등

📌 서포트 벡터머신

  • 정의 : 데이터 포인트들을 분리하는 최적의 경계를 찾는 방법.
  • 🔍 이미지 인식, 텍스트 분류 등