Day 22 - 머신러닝 3 > KNN(K - Nearest Neighbors)

Day 22 - 머신러닝 3 > KNN(K - Nearest Neighbors)

2022. 11. 9. 17:10ㆍPython

이번 글에서는 머신러닝 알고리즘 중 KNN에 대해 다룰 것이다.

KNN은 선형관계를 상정하지 않은 데이터셋에서도 활용할 수 있는 거리기반 머신러닝 모델로, 다중분류 문제에 적용 가능하다. KNN의 풀네임을 보면 유추할 수 있듯, KNN은 K개의 가장 가까운 데이터에 의해 결과값을 예측하는 알고리즘이다. 이 K값은 사용자가 지정할 수 있다.

K개의 데이터를 하나하나 고려하여 예측하는 알고리즘이다보니, K의 값이 크고 데이터셋의 크기가 클 수록 속도가 느려진다. 따라서 작은 데이터셋에 적합하다. 또한 이상치에 취약하다는 단점이 있다.

KNN 알고리즘 실습을 wine classification 데이터를 통해 진행했다.

간단한 통계치를 확인한 결과 숫자간 단위가 달랐기 때문에 전처리 과정에서 스케일링을 하기로 했다.

K의 값을 다르게 하면서 모델 평가를 진행했다. K=13일 때 제일 정확도가 높은 것을 알 수 있다.

저작자표시 비영리 변경금지

'Python' 카테고리의 다른 글

Day 22/23 - 머신러닝 4 > 나이브 베이즈 (Naive Bayes) (0)	2022.11.09
Day 22 - 머신러닝 3 > KNN(K - Nearest Neighbors) (2) (0)	2022.11.09
Day 21 - 머신러닝 2 > 로지스틱 회귀 (0)	2022.11.08
Day 20 - 머신러닝 1 > 선형회귀 (0)	2022.11.07
Day 19 - Titanic 데이터 실습 (0)	2022.11.02

나의 코딩 교육 일지

나의 코딩 교육 일지

태그

최근글

댓글

공지사항

아카이브

'Python' 카테고리의 다른 글

관련글

티스토리툴바