머신러닝은 회귀와 분류로 나뉜다
- 회기(regression): 출력값이 연속적인 소수점으로 예측하게 푸는 방식
- 분류(classification): 이중분류, 다중분류로 푸는 방식
- 선형회기: x가 한가지(결과에 영향을 주는 변수의 갯수)
- 다중선형회기; x가 여러가지
- 시그모이드: s-커브로 함수를 표현한것이다
- 논리회기: 입력값과 범주 사이의 관계를 구하는걸 논리회기 라고 한다(???)
실질적 계산은 선형 회귀와 같지만 출력에 시그모이드 함수를 붙여 0,1사이의 값을 가진다 - 전처리: 정제 작업(필요없는건 지우고 필요한 데이터만 취하는것)
- binary_crossentropy: keras에서 이진 논리의 경우 이 함수를 사용한다
- 확률분포그래프: 가로축을 라벨(클레스) 세로축을 확률로 표시한 그래프를 말한다
- 크로스엔트로피: 확률분포의 차이를 비교할때 이 함수를 사용한다
- 원핫 인코딩: 다항 분류 문제를 풀때 출력값의 형태를 가장 예쁘게 표현한다(0,1로만 표현한다)
- 다항논리회기: 여러 클래스를 논리회기를 푸는것이다
- 소프트맥스: 선형 모델에서 나온 결과를 모두 더하면 1이 되도록 만들어 주는 함수다(결과를 확률로 표현하기 위해 사용된다)
머신러닝의 전처리
- 딥러닝: 선형회귀 사이에 비선형의 무언가를 쌓아 여러개의 층을 딥하게 쌓아 공부시키는것이다
- OR: x값에 1이 하나라도 있으면 y값은 1
- AND: x값에 0이 하나라도 있으면 0
- XOR: 0,0=0; 0,1=1; 1,1=0
딥러닝 네트워크의 구조
- 인풋레이어: 네트워크 입력부분(x)
- 아웃풋레이어: 네트워크 출력부분(y)
- 히든레이어: 입, 출력층을 제외한 중간층
댓글