《과학자, 기술자들은 인민경제를 과학화하는데서 나서는 과학기술적문제를 풀기 위한 과학연구사업을 심화시켜 모든 부문의 생산과 경영활동을 새로운 과학적토대우에 올려세워야 하겠습니다.》 (
극단학습기는 단층앞방향신경망학습을 위한 리론적으로 간단하고 속도가 빠른 기계학습알고리듬으로서 최근년간에 여러가지 실천적인 문제들에 널리 적용되였다.
다른 분류기들과 류사하게 극단학습알고리듬은 균형자료모임들에 대하여 효과적이라고 하여도 불균형클라스분포문제에 대하여 좋은 모형을 얻을수 없다. 불균형자료에 고전적인 극단학습기를 적용할 때 더 좋은 분류결과를 얻기 위하여 다수클라스는 분류경계를 소수클라스쪽으로 밀어버린다. 그러므로 소수클라스의 자료는 쉽게 오분류된다.
왜냐하면 고전적인 극단학습기가 최량화의 관점에서 각이한 클라스들에 대하여 균형적인 클라스분포나 같은 오분류비용을 가정하기때문이다.
불균형자료학습에 대한 극단학습기의 약점을 극복하기 위하여 우리는 불균형학습에서 평가척도로 널리 리용된 G_mean에 기초하여 극단학습기최량화문제의 새로운 비용함수를 정의하고 이에 기초하여 새로운 극단학습알고리듬을 제안한다. 우리의 방법에서 비용함수는 훈련오유의 총합대신에 매 클라스의 훈련오유적을 최소로 하는것을 목표로 하며 전개의 편리를 위하여 로그함수가 추가되였다.
우리는 각이한 불균형률을 가진 58개 두 클라스자료모임과 11개 여러 클라스자료모임으로 이루어진 표준분류자료모임들에서 실험을 진행한다. 실험결과는 제안된 알고리듬이 다른 최신방법들과 비교하여 분류성능을 의의있게 개선할수 있다는것을 보여준다.
우리는 또한 중첩신경망으로부터의 특징표현을 가지는 YouTube-8M자료기지에서 실험을 진행하여 제안된 방법이 표현학습에서 높은 정확도를 달성할수 있다는것을 보여준다. 통계적결과는 제안된 방법이 고전적인 극단학습기를 릉가할뿐아니라 여러가지 최신클라스불균형학습문제들과 비교하여 더 좋거나 경쟁적인 결과를 얻을수 있다는것을 보여준다. 제안된 알고리듬은 두 클라스자료모임과 여러 클라스자료모임에 다 적용될수 있다.
우리의 연구결과는 국제잡지 "Digital Signal Processing"에 "G-mean based extreme learning machine for imbalance learning"라는 제목으로 출판되였다.
앞으로 클라스불균형문제를 풀기 위하여 극단학습기의 비용함수를 더 효과적으로 개선하고 불균형자료모임의 분포성질에 따라 효과적인 학습알고리듬을 연구하는데 주목할것이다.