과학연구

매몰형장치에서 심층학습에 기초한 실시간얼굴인식기술 개발

 2019.9.20.

경애하는 김정은동지께서는 다음과 같이 말씀하시였다.

《대학에서는 사회주의강국건설에서 나서는 리론실천적, 과학기술적문제들을 원만히 해결하며 기초과학부문을 발전시키고 첨단과학기술분야를 개척하는데 중심을 두고 과학연구사업을 진행하여야 합니다.》

인공지능기술(Artificial Intelligence : AI)의 급속한 발전은 과학기술과 산업전반에 커다란 혁신을 가져오고있다. 지금까지 얼굴인식, 물체인식, 자연어처리를 비롯한 실용화된 인공지능기술들은 구름연산환경(Cloud Computing)이나 개인용콤퓨터에서 동작하도록 개발되여왔다. 그러나 자률주행이나 로보트공학을 비롯한 분야에서는 종래의 구름연산환경에서의 집중형방식으로부터 말단장치들에서의 분산형방식으로 연구개발의 초점이 이동하고있다. 최근 많은 나라들과 기업들이 경쟁적으로 개발하고있는 인공지능소편(AI Chip)이 좋은 실례이다. 매몰형장치들에서의 인공지능기술개발은 인터네트접속에 의한 구름연산환경을 리용하지 않고도 가정용이나 휴대용전자장치들에서 직접 인공지능기술을 구현할수 있는 새로운 가능성을 열어준다. 그러나 제한된 계산자원을 가진 매몰형장치들에서 실시간처리속도를 보장하면서도 실용화수준의 정확도를 보장하는것은 여전히 어려운 문제로 남아있다.

우리는 인공지능기술 개발의 이러한 추이에 맞게 세계적으로 광범히 응용되고있는 ARM CPU 기반의 매몰형장치에서 심층학습에 기초한 실시간 얼굴인식기술을 개발하였다.

우리는 매몰형장치를 구성하고 이장치에서의 중첩신경망구조와 학습방법 에 대한 연구를 진행하였다.

화상인식을 비롯한 콤퓨터시각분야에서 많이 리용되는 신경망은 중첩신경망(Convolutional Neural Network : CNN)이며 목적과 응용에 따라 각이한 구조의 중첩신경망들이 연구되여왔다. 얼굴인식에서는 VGGNet, Inception, ResNet에 기초한 구조들이, 얼굴검출에서는 RCNN, Faster-RCNN과 같이 일반적인 물체검출에 리용된 구조의 개량형들이 리용되였다.

우리는 매몰형장치에서 인식하는 얼굴자세변화를 20도 이내의 정면얼굴

우리는 높은 성능을 발휘하면서도 연산속도가 매우 빠른 효률적인 구조의 최적화된 신경망구조들을 활용하였다. 얼굴검출에서는 MTCNN, 얼굴인식에서는 MobileFaceNets를 기반으로 얼굴인식신경망을 구현하였다. 신경망구조 구현과 학습을 위하여 Tensorflow를 사용하였으며 손실함수는 각도여백손실함수(ArcFace Loss)를 사용하였다. 우리가 보유하고있는 30만명, 3000만장의 자료기지에서 얼굴인식신경망을 학습하였다.

우리는 또한 매몰형장치환경에서의 얼굴인식엔진과 응용쏘프트웨어를 개발하였다.

매몰형환경에서 얼굴인식신경망들의 전방향계산을 효률적으로 구현하기 위하여 Tensorflow 를 휴대용전자장치환경에서 사용할수 있도록 경량화한 Tensorflow-Lite를 사용하여 얼굴인식엔진을 개발하였다.

Android Studio 를 사용하여 Android 조작체계가 설치된 매몰형장치에서 동작하는 얼굴인식쏘프트웨어를 개발하였다.

개발한 매몰형장치에서 전체 얼굴인식연산 속도는 HD 해상도의 경우 250ms, VGA 해상도의 경우에는 150 ms 로서 실시간성을 원만히 보장한다.

또한 정확도는 LFW 시험자료기지에서 인식정확도는 98%(타인접수률 0.1%)로서 실용화요구를 충분히 만족한다.