취업 준비/AIVLE SCHOOL
CH5. 머신러닝 - 머신러닝 모델 학습
BraveTiger
2023. 3. 6. 10:32
머신러닝이란
: X와 Y의 관계를 찾는 것.
: Y를 설명하는 X변수는 보통 여러개, X 변수들을 조합하여 Y를 표현하는 것.
: 수학적으로 Y = f(X1,X2,X3,...,Xp)로 표현할 수 있다.
[수식]
$Y$ = $W_1X_1 + W_2X_2 + \epsilon$
$f(x)$ = $W_1X_1 + W_2X_2$
- 데이터가 주어졌을 때 W1과 W2(파라미터)를 어떻게 결정하는지가 머신러닝의 핵심이다.
※ epsilon (잔차, 에러)
- 실제값과 예측값의 차이
- 이론적으로는 y=f(x)이지만 실제로는 정확한 함수를 구할 수 없다.
[수식]
$Y$ = $W_1X_1 + W_2X_2 + \epsilon$ = $f(x) + \epsilon$
$\epsilon$ = $Y -f(x)$ => 오차
손실함수와 비용함수
1. 손실함수(Loss function)
입력으로 받은 데이터를 하나하나 받아 실제값과 예측값 간의 오차를 계산하는 방식
손실 함수를 ∑를 통하여 나타낸다면 이는 바로 비용 함수라고도 할 수 있다.

2. 비용함수(Cost function)
입력으로 받은 데이터를 모아서 오차를 계산하는 함수를 일컫는다. 입력으로 들어온 데이터를 기반으로 모든 데이터의 비용을 계산하는 방식이다.
머신러닝 모델의 파라미터 추정
- 비용함수를 최소로 하는 w1과 w2를 찾는다.

※ 모델과 알고리즘
- 문제가 발생했고 그와 관련된 다양한 변수X가 주어졌다.
- 문제 해결을 위해 X를 활용하여 모델을 만들었다.(Y를 위한 X의 결합 방식 결정) => 모델 선택 & 생성
- 모델을 구성하기 위해 다양한 파라미터를 추정한다.(실제 데이터와 최대한 같게 나오도록) => 알고리즘을 통해 파라미터 추정
https://colab.research.google.com/drive/1rSJ2DXPZj1KUDZUfzv0nSvRLjOXL5t_3#scrollTo=SaDCoYqCuoa5