SMOTE 기법을 활용한 데이터 불균형 해소
·
카테고리 없음
데이터셋을 사용해서 머신러닝 모델을 학습시키기 전에 데이터 불균형으로 인한 과적합 문제를 해결하고 소수 클래스 예측 성능을 향상시키기 위해서 SMOTE 기법을 통해 데이터를 정제시키는 과정이 필요하다. 다음과 같은 데이터셋과 코드를 활용해 데이터셋을 불러오고 전처리 과정을 거쳐 클래스 불균형을 해소하고 모델을 학습/평가하는 과정을 진행했다. 사용 데이터셋: KDD99, NSL-KDD, UNSW-NB15Python + Pandas + scikit-learn + imbalanced-learn 기반 코드 1. SMOTE 기법이란SMOTE(Synthetic Minority Over-sampling Technique)는 데이터 불균형 문제를 해결하기 위한 대표적인 오버샘플링(oversampling) 기법이다...