인공지능/Data preprocessing
-
클래스 불균형인공지능/Data preprocessing 2021. 12. 10. 12:53
인공지능에서 분류(Classification)과제인 경우, 특히 다중 분류일 경우 많이 겪는 문제가 클래스 불균형(Class Imbalanced)이다. 이는 클래스(타겟)간의 비율이 맞지 않는 경우를 말한다. ex) 은행 거래 : 평소에는 큰 문제가 없지만 갑자기 생기는 금융 사기 거래 등 , 공장에서의 불량률 위와 같은 사례를 해결하기 위한 방법들을 비정상 탐지(Anomaly Detection)이라고 한다. 이를 해결하기 위한 방법론으로는 Under Sampling , Over Sampling 이 있다. 과소표집(Under Sampling) & 과대표집(Over Sampling) 과소표집은 다른 클래스에 비해 상대적으로 큰 클래스의 개수를 줄인다. 다만 균형은 맞게 되지만 전체적으로 학습할 데이터의 숫..