Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

AI와 데이터 사이언스의 이론과 실전

AI와 머신러닝의 핵심 개념 정리 본문

인공지능

AI와 머신러닝의 핵심 개념 정리

큐트아리 2023. 11. 16. 12:28

인공지능(AI)과 머신러닝(ML)은 현대 기술의 중심에 자리하고 있으며, 그 발전은 우리의 일상 생활에 혁명을 일으키고 있습니다. 이러한 기술들은 데이터의 홍수와 현실 세계의 복잡성에 효과적으로 대응할 수 있는 강력한 도구로 자리매김하고 있습니다.

이 글에서는 AI와 머신러닝의 기본 개념부터 깊이있는 이해를 위한 핵심 원리들을 다뤄보겠습니다. 개발자에 의한 AI와 데이터에 의한 AI의 차이부터 시작하여, 머신러닝의 주요 개념들과 학습 방법, 그리고 딥러닝의 원리까지 다양한 주제를 다룰 것입니다.

초보자부터 중급자까지, 누구나 쉽게 따라올 수 있도록 구성된 이 글은 AI와 머신러닝에 대한 기본적인 이해를 갖고자 하는 분들에게 도움이 될 것입니다. 함께 시작해봅시다.

1. 인공지능 (Artificial Intelligence)

1.1 배경

인공지능은 인간의 지능을 모방하거나 대체하는 시스템이나 기술을 의미합니다. 이는 주로 두 가지 방식으로 이루어집니다. 첫 번째는 개발자에 의한 AI, 두 번째는 데이터에 의한 AI입니다.

  • 개발자에 의한 AI: 규칙 기반 시스템으로, 프로그래머가 명시적인 규칙과 논리를 사용하여 지능을 구현하는 방식입니다.
  • 데이터에 의한 AI: 머신러닝과 딥러닝을 활용하여, 컴퓨터가 대량의 데이터를 학습하고 패턴을 스스로 학습하는 방식입니다.

1.2 과거의 발전

과거에는 주로 규칙 기반 시스템이 사용되었으며, 프로그래머가 인간의 논리와 지식을 코딩하여 문제를 해결했습니다. 그러나 이러한 방식은 복잡한 문제나 다양한 상황에 대응하기 어려웠습니다.

 

1.3 머신러닝과의 연관

데이터를 대량으로 수집하고 처리할 수 있는 환경이 구축되면서, 머신러닝이 부상하게 되었습니다. 머신러닝은 데이터로부터 특징이나 패턴을 찾아내는 것이 주요 목표이며, 따라서 데이터는 머신러닝에서 가장 중요한 자원 중 하나가 되었습니다.

 

2. 머신러닝 (Machine Learning)

2.1 정의

머신러닝은 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야로, 데이터를 기반으로 한 학습하는 기계를 다룹니다. 무엇(X)으로 무엇(Y)을 예측하고 싶다의 함수를 찾아내는 것이 핵심입니다.

  • Y: 출력변수, 종속변수, 타겟값
  • X: 입력변수, 독립변수
  • f모형: 머신러닝 알고리즘

2.2 머신러닝으로 할 수 있는 것

2.2.1 회귀(Regression)

  • 시계열과 같은 연속된 데이터를 다룰 때 사용되는 기법.
  • 예시: 과거 주식추세를 학습하여 내일의 주가를 예측하는 시스템.

2.2.2 분류(Classification)

  • 데이터를 클래스별로 구별해내는 기법.
  • 주어진 데이터와 데이터의 레이블값을 학습시켜 어느 범주에 속한 데이터인지 판단하고 예측.
  • 예시: 스팸 메일 구별 시스템.

2.2.3 군집(Clustering)

  • 데이터에 레이블(정답 데이터)가 없이, 유사한 속성들을 갖는 데이터를 일정한 수의 군집으로 그룹핑하는 비지도 학습.
  • 예시: SNS 데이터를 통한 소셜 및 사회 이슈 파악.

2.3 학습

2.3.1 지도 학습(Supervised Learning)

  • 문제와 정답을 모두 학습시켜 예측 또는 분류하는 문제.
  • y = f(x)에 대하여 입력변수와 출력변수의 관계에 대하여 모델링.
  • y에 대한 예측 또는 분류.

2.3.2 비지도 학습(Unsupervised Learning)

  • 정답이 존재하지 않고 입력변수 간의 관계에 대해 모델링.
  • 군집분석: 유사한 데이터끼리 그룹화, PCA: 독립변수들의 차원 축소.

2.3.3 자기지도학습(Self Supervised Learning)

  • 데이터 자체에서 스스로 레이블을 생성하여 학습에 이용하는 방법.
  • 다량의 Label이 없는 Raw Data로부터 Label을 자동으로 생성하여 지도학습에 이용.

2.3.4 강화학습(Reinforcement Learning)

  • 결정을 순차적으로 내려야하는 문제에 적용.
  • 라벨이 있는 데이터를 통해서 가중치와 펴향을 학습하는 것과 비슷하게 보상이라는 개념을 사용하여 가중치와 편향을 학습.

3. 딥러닝 (Deep Learning)

  • 깊은 신경망 구조의 머신러닝.
  • 사람의 뇌의 뉴런을 모티브로 만든 신경망 알고리즘 활용.
  • 퍼셉트론: 신경망의 단위 하나.