머신러닝 기초1
머신러닝이란
- 기계학습 또는 머신러닝은 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록하는 알고리즘과 기술
- 주어진 데이터를 통해 입력변수와 출력변수간의 관계를 만드는 함수f를 만드는것
- 주어진 데이터 속에서 데이터의 특징을 찾아내는 함수f를 만드는것
- y=f(x) + e(엡실론) 구조이며, y는 출력변수, 종속변수, 반응변수라고하며, x를 입력변수, 독립변수, feature, 함수f를 모형(머신러닝 알고리즘)이라고 한다
(엡실론은 오차항, 이론적으로는 y=f(x)이지만 실제로는 정확한 함수를 구할 수 없다.)
- 데이터 목록 중 예측하고 싶은 대상을 y로 두고 나머지를 입력변수인 x로 둔다.
지도학습과 비지도학습
- 지도학습(supervised learning): 예측/분류하고자하는 y(labeled data)가 존재하여, y=f(x)에 대한 입력변수x와 출력변수y의 관계에 대하여 모델링하는 학습과정
- 지도학습에 따른 모형의 종류
회귀(regression): 입력 x에 대해 연속형 변수 형태를 가지는 출력 y(ex: 실수)를 예측하는 모델
분류(classification): 입력 x에 대해 이산형 변수 형태를 가지는 출력 y(클래스, ex: 정수, 성별, 정상/불량 여부 등)를 예측하는 모델
- 비지도학습(unsupervised learning): 출력변수 y가 존재하지 않고, 입력변수 x들간의 관계에 대하여 모델링하는 학습과정
- 비지도학습에 따른 모형의 종류
군집분석: 유사한 데이터들끼지 그룹화하는 모델
PCA: 독립변수들의 차원을 축소화하는 모델
- 기타
강화학습(reinforcement learning): 시뮬레이션을 반복 수행해 최대의 보상을 수행하는 action을 구하는 학습방법
agent가 특정 상태와 주어진 환경에서 수행(action)하여 나오는 보상을 입력으로 재학습 수행