Day 26 - 머신러닝 8 > LightGBM

2022. 11. 15. 21:59Python

이번 글에서는 머신러닝 기법 중 LightGBM에 대해 다룰 것이다.

LightGBM은 부스팅 모델 중 최신 모델 중 하나로, XGBoost와 비교했을 때 더 좋은 성능을 자랑한다. 모델은 리프 중심 트리 분할 방식을 이용한다. 다만 역시 복잡한 모델이기 때문에 설명력이 떨어진다는 단점이 존재한다.

 

LightGBM 실습을 카드 거래 데이터셋을 통해 실습해보았다.

데이터를 불러오고 확인했다.
컬럼 삭제 등의 간단한 전처리를 진행했다.
피처 엔지니어링에서는 고객의 일반적인 거래와는 다른 거래를 알아보는데 집중했다. 예를 들어 평소 거래 금액보다 얼마나 많은 금액이 결제 되었는지, 거주지와 카드 결제 장소의 거리는 얼마나 떨어져있는지 등을 알아보았다.
범주형 변수 변환과 인덱스 변환을 통한 데이터셋 나누기를 진행했다.
모델학습과 평가를 진행했다. 정확도가 매우 높게 나왔는데, 오버피팅이 있었는지 여부를 살펴봐야 겠다.