1. 문제의 종류
1.1 예측하려는 값이 연속 값이면 회귀문제이며, 예측하려는 값이 이산 값이면 분류 문제이다
Continious 연속값 value / Discrete(이산 값) value
1.2 예/아니오 두 종류로 구분하는 것을 이진분류(binary classification)문제라고 함
positive class와 negative class로 분류한다고 함
2가지 이상으로 분류할 경우 multi-class classification이라고 함 (다항 분류 문제)
1.3 label유무 - 지도학습, 없음- 비지도 학습
선형회귀에 weight 값주면서 실험 어케?
오차error 계산은?
error = 데이터1의 x값을 회귀직선에 넣었을 때 예측 y 값 - 데이터1의 실제y값
= 예측y - 실제 y = (예측)y햇 - 실제 y
이렇게 구한 전체 오차들을 각각 제곱한 후 합한 것을 비용(Cost) 라 함.
비용을 계산하는 함수를 비용함수라고 하는데, 이는 어떤 데이터를 가지고 어떤 목적의 학습을 진행하느냐에 따라 다르게 바꿔줄수 있다.이 비용함수를 어떻게 주느랴에 따라 모델이 학습되는 방향과 속도가 달라짐.
예측에 대한 피드백을 받고, 정답 레이블에 가까워지도록 모델을 수정 -> 피드백을 계산하는 것이 비용함수라고 한다
모델의 cost가 낮으면 예측적이 좋다고 할 수 있다.(최소한 학습 데이터 안에서 라는 조건하에)
* 실제값과 예측값의 차이를 제곱한 뒤 모두 더해주는 과정-> 오차 제곱합
이 값을 전체 데이터 수로 나눠서 데이터 1개 당 평균 오차제곱합을 나타내는 것을 MSE, Mean Square Error 평균 제곱오차 이라 한다.
* 선형회귀는 평규제곱오차를 가장 작게하는, 모든 데이터를 적절히 아우르는 예측 직선을 찾는 것 - 최소제곱법 Least square method
https://box-world.tistory.com/6
'딥러닝' 카테고리의 다른 글
tensorflow without GPU (0) | 2023.01.30 |
---|---|
tensorflow (0) | 2022.08.22 |
quiita (0) | 2022.06.30 |
CVPR 2022 (0) | 2022.06.30 |
CNN (0) | 2022.05.08 |