Day 22 - 머신러닝 3 > KNN(K - Nearest Neighbors) (2)
2022. 11. 9. 17:19ㆍPython
이번 글에서는 Titanic 데이터를 활용해 KNN 모델링 연습문제를 푼 과정을 정리할 것이다. 이 연습문제 과정은 강사님의 도움을 받지 않고 수행했다.
이후 데이터 전처리를 진행했다.
그 후 세가지 스케일링 작업을 각각 수행했다.
마지막으로 KNN 모델 학습 후, 모델 평가를 진행했다.
Titanic 데이터를 4번째 다루어보는데, 데이터 전처리는 항상 중요하다는 걸 다시 한 번 생각하게 되었다. PassengerId컬럼을 없애지 않고 진행한 것과 없애고 진행한 것의 결과가 달랐기 때문이다. 한 편, 서로 다른 머신러닝 방법임에도 로지스틱 회귀와 KNN 모델의 정확도가 거의 비슷하게 나왔다는 것이(KNN이 살짝 높긴 하다) 흥미로웠다.
'Python' 카테고리의 다른 글
Day 23/24 - 머신러닝 5 > 결정 트리 (Decision Tree) (0) | 2022.11.12 |
---|---|
Day 22/23 - 머신러닝 4 > 나이브 베이즈 (Naive Bayes) (0) | 2022.11.09 |
Day 22 - 머신러닝 3 > KNN(K - Nearest Neighbors) (0) | 2022.11.09 |
Day 21 - 머신러닝 2 > 로지스틱 회귀 (0) | 2022.11.08 |
Day 20 - 머신러닝 1 > 선형회귀 (0) | 2022.11.07 |