본문 바로가기
머신러닝(ML)

머신러닝과 딥러닝(알고리즘 종류)

by KwonSoonBin 2022. 4. 6.

인공지능>머신러닝>딥러닝

서로 다른 각각의 개념이 아니라 인공지능이 포괄적인 개념으로, 딥러닝, 머신러닝 등은 

학습모델을 제공하여 데이터 분류하는데 사용이 주로 되는 기술입니다 



1. 머신러닝(ML)

 인공지능의 여러 분야 중 하나,

스팸메일 필터링, 이미지 분류, 기계번역 기술 등 약한 AI를 구현하는데 쓰이는 게 머신러닝(기계학습)

머신러닝은 컴퓨터에게 인간이 먼저 다양한 정보를 가르치고 그것을 학습한 결과에 따라 컴퓨터가 새로운 것을 예측하는 것

 

머신러닝의 알고리즘

1. 지도 학습(supervised learning) - 정답이 있는 데이터를 활용해 데이터를 학습시키는 방법

종류: 분류(Classification), 회귀(Regression) 

  • K-최근접 이웃(k-Nearest Neighbors)
  • 선형 회귀(Linear Regression)
  • 로지스틱 회귀(Logistic Regression)
  • 서포트 벡터 머신(SVM, Support Vector Machine)
  • 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest)
  • 신경망(Neural Network)

2. 비지도 학습(unsupervised learning) - 정답이 없는 데이터를 군집화하여 새로운 데이터 결과를 예측하는 방법

종류: 클러스터링, k-means 

  • 군집(Clustering)
    - K-평균(k-Means)
    - 계층 군집 분석(HCA, Hierarchical Cluster Analysis)
    - 기댓값 최대화(Expectation Maximization)

  • 시각화(Visualization)와 차원 축소(Dimensionality Reduction)
    - 주성분 분석(PCA, Principal Component Analysis)
    - 커널 PCA(Kernel PCA)
    - 지역적 선형 임베딩(LLE, Locally-Linear Embedding)
    - t-SNE(t-distributed Stochastic Neighbor Embedding)

  • 연관 규칙 학습(Association Rule Learning)
    - 어프라이어리(Apriori)
    - 이클렛(Eclat)

3. 준지도 학습(semi supervised)

  • 지도 학습과 비지도 학습의 중간에 해당하는 기술로, 명확한 정답이 존재하나 정답이 있는 데이터를 구하기 힘들 때 사용
  • 대부분의 준지도 학습 알고리즘은 지도 학습과 비지도 학습의 조합으로 이루어져 있다.

4. 강화 학습(Reinforcement learning)

  • 주어진 환경에서 어떤 행동을 취하고 이로부터 어떤 보상을 얻으면서 학습을 진행
  • 개념: 에이전트, 환경, 상태, 행동, 보상

 

강화 학습은 매우 다른 종류의 알고리즘이다. 여기서는 학습하는 시스템을 에이전트(Agent)라고 부르며 환경(Environment)을 관찰해서 행동(Action)을 실행하고 보상(Reward)을 받는다. 시간이 지나면서 가장 큰 보상을 얻기 위해 정책(Policy)이라고 부르는 최상의 전략을 스스로 학습한다. 정책은 주어진 상황에서 에이전트가 어떻게 행동해야 하는지를 판단한다.


 

2. 딥러닝(DL)

 다양한 머신러닝의 알고리즘 중 (ANN)인공신경망을 기반으로 하는 방법들을 통틀어 딥러닝이라고 한다.

딥러닝의 경우는 인간이 데이터를 분류해서 전달해주는 작업이 생략되고 스스로 학습하는 컴퓨터입니다. 

딥러닝은 머신러닝의 한 분야지만 조금 더 나아간 것을 말한다. 한마디로 스스로 학습하는 컴퓨터 입니다.

 

‘딥러닝’은 인간이 가르치지 않아도 스스로 학습하고 미래 상황을 예측하는 것이다.

 

딥러닝의 알고리즘

1. CNN(Convolutional Neural Network)합성곱 신경망

출처 : 이미지 클릭

  • 인간의 시신경 구조(퍼셉트론)를 모방한 기술 , 다중 레이어로 구성되어 있다.
  • 주로이미지를 인식하기위해 패턴을 찾는데 특히 유용하다.
  • 데이터를 직접 학습하고 패턴을 사용해 이미지를 분류한다
  • 자율주행자동차, 얼굴인식과 같은 객체인식이나 computer vision이 필요한 분야에 많이 사용되고 있다
  • 이미지의 공간정보를 유지한채 학습을 하게하는 모델

 

2. RNN(Recurrent Neural Network)순환신경망

출처 : 이미지 클릭

  • 순차적 정보가 담긴 데이터에서 규칙적인 패턴을 인식하고 추상화된 정보를 추출할 수 있다.
  • 텍스트, 음성, 음악, 영상 등 순차적 데이터를 다루는데 적합하다.
  • 베니싱 그레디언트 문제가 있어 패턴 학습을 못하는 경우가 있다.
  • 이를 개선하기 위해 LSTM(Long Short Term Memory)가 개발되었다.
  • LSTM으로 RNN문제가 어느정도 해결되어 자동 작곡, 작사, 저술, 주가 예측 등 다양한 분야에 적용되고 있다.
  • 1회의 데이터가 아니라 과거의 데이터도 학습에 이용하는 방식
  • 순서를 가지는 정보(sequence)에 사용

3. GAN(Generative Adversarial Network)생성 대립 신경망 

출처 : 이미지 클릭

  • 비지도 학습 방법으로 학습된 패턴을 이용해 이미지나 음성을 생성할 수 있다.
  • DCGAN(Deep Convolution GAN)은 불안정한 GAN 구조를 개선해 새로운 의미를 가진 이미지를 생성할 수 있다.

 

4. RL(Reinforcement Learning)강화학습

출처 : 이미지 클릭

  • 행동심리학에서 영감을 받았다.
  • 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 생동 순서를 선택하는 방법
  • 구글의 딥마인드에서 개발한 관계형 네트워크는 관계형 추론을 지원한다.
  • 물리적 사물, 문장, 추상적인 아이디어들 사이에 관계를 파악해, 논리적 추론을 할 수 있다.

 

 

 

출처:
https://truman.tistory.com/170
 https://webzero.tistory.com/1458 

댓글