본문 바로가기
카테고리 없음

인공지능 기초 정리

by KwonSoonBin 2022. 2. 15.

엘**에서 인공지능을 배운지 5달 정도가 다 되어간다. 당시에 힘들게 공부해서 겨우 이해하는 수준까지 만들어놨기에 더 잊기전에 기록해 보려고 한다. 

 

※학원 자료와 구글링에서 얻은 자료를 모아 작성했습니다.

출처 네이버블로그, 클릭 시 이동

 

인공지능 > 머신러닝 > 딥러닝 순서이다. 잊지말자.

 

 

머신러닝의 학습 방법은 학습 형태에 따라 3가지로 나눌 수 있다.

 

1. 지도학습(Supervised Learning)

- AI에게 문제와 답을 동시에 주고 학습(Labeld data)시켜 규칙(함수)를 찾고, 새롭게 들어오는 데이터에 대한 결과를 예측하는 학습 방법.

지도학습 예시

  • 비지도 학습보다 더 단순하고 일반적이다
  • 사람인 관여자가 답을 알고 있는 상태에서 AI를 훈련하고자 할 때 사용한다
  • 사용하여 데이터를 분류하고 처리한다
  • 레이블이 지정된 데이터 즉, 분류된 데이터를 사용한다

ex) 라벨링(정답) 되어 있는 개와 고양이 사진을 학습 시킨다. 특징(함수)을 찾아 다음 사진을 예측한다.

 

대표적인 지도학습 방법으로는 회귀(Regression)분류(Classification)가 있다.

 

회귀(Regression)

  • 선형(Linear)회귀, 릿지(Ridge)회귀, 라쏘(Lasso)회귀가 대표적

분류(Classification)

  • KNN, 나이브베이즈, SVM(support Vector Machine)이 대표적

2. 비지도 학습(Unsupervised Learning)

- 지도학습과 달리 정답을 알려주지 않고 예측하는 방법으로, 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아 비슷한 데이터들끼리 군집화 하여 예측하는 방법이다.

비지도학습 예시

 

ex)

동물 사진을 비지도학습 시킬 때, 각 사진이 무슨 동물인지 정답(label)을 알려주지 않았기 때문에 

이 동물이 '무엇'이라고 기계가 정의는 할 수 없지만 비슷한 단위로 군집화 해준다.

다리가 4개인 고양이와 호랑이를 한 분류로 묶고, 

다리가 4개지만 목이 긴 기린은 다른 분류로,

다리가 얇고 몸통이 둥그런 병아리는 또 다른 분류로 나누어 놓을 것이다.


 

 

 가장 이해하기 힘들었던 강화학습이다

 

3. 강화학습(Reinforcement Learning)

- 강화(Reinforcement)는 시행착오(Trial and Error)를 통해 학습하는 방법 중 하나를 의미한다. 이러한 강화를 바탕으로 강화학습은 실수와 보상을 통해 학습을 하여 목표를 찾아가는 알고리즘.

강화학습 예시
강화학습 진행과정 예시

에이전트(Agent),  환경(Enviroment),  행동(Action), 보상(Reword)의 개념으로 이해 가능하다.

학습을 수행할 주체인 에이전트와 에이전트가 활동할 환경이 주어지면, 환경에서 에이전트의 행동을 관찰하여 행동에 따른 보상을 주는 방식으로 에이전트의 행동이 더 나은 방향으로 개선되도록 하는 학습 방법이다. 알파고가 강화학습의 예이다.

 

  • 환경(Environment)에 대한 사전지식이 없는 상태로 학습을 진행한다.
  • 보상을 통하여 학습을 한다.
  • 컴퓨터가 선택한 행동(Action)에 대한 환경의 반응에 따라 보상이 주어진다.
  • 행동의 결과로 나타나는 것이 보상이며 이것을 통하여 학습을 진행한다.
  • 보상을 최대한 많이 얻도록 하는 행동을 유도하도록 학습을 진행한다.

 

 

 

 

 

 

 

머신러닝 학습 방법 3가지, 클릭 시 이동

 

출처

출처

출처

출처

댓글