Python
Day 22 - 머신러닝 3 > KNN(K - Nearest Neighbors)
카오시리
2022. 11. 9. 17:10
이번 글에서는 머신러닝 알고리즘 중 KNN에 대해 다룰 것이다.
KNN은 선형관계를 상정하지 않은 데이터셋에서도 활용할 수 있는 거리기반 머신러닝 모델로, 다중분류 문제에 적용 가능하다. KNN의 풀네임을 보면 유추할 수 있듯, KNN은 K개의 가장 가까운 데이터에 의해 결과값을 예측하는 알고리즘이다. 이 K값은 사용자가 지정할 수 있다.
K개의 데이터를 하나하나 고려하여 예측하는 알고리즘이다보니, K의 값이 크고 데이터셋의 크기가 클 수록 속도가 느려진다. 따라서 작은 데이터셋에 적합하다. 또한 이상치에 취약하다는 단점이 있다.
KNN 알고리즘 실습을 wine classification 데이터를 통해 진행했다.