우리는 다중입력-다중출력 비직교다중접근(MIMO-NOMA)내리회선체계에서 모든 사용자들의 봉사의 질(QoS)을 담보하면서도 에네르기효률을 최대로 높이기 위한 전력할당문제에 대하여 연구하였다. 제안된 최량화문제는 비볼록동적최량화문제이며 이 문제를 우리는 두개의 심층강화학습에 기초하여 푸는 방안을 제안하였으며 이 방안을 다중대리자DDPG/TD3에 기초한 전력할당흐레임워크로 명명하였다.
특히 현재의 통로조건을 입력하면 두개의 다중대리자흐레임워크들의 매개 단일대리자들은 DDPG/TD3알고리듬에 따라 매개의 클라스터에 있는 모든 사용자들에게 최량적인 전력할당방책을 출력하며 체계의 전체 성능을 개선하기 위하여 클라스터들에 할당된 전력의 크기를 교정하기 위하여 전통적인 다중대리자모형에 추가적인 행위자망도 부가되였다. 결과적으로 두개의 흐레임워크들이 체계의 반결합에 따라 신경망들의 무게들을 갱신하여 전체 전력할당방책을 교정하게 된다.
모의결과들은 MIMO-NOMA내리회선체계에서 여러가지 송신전력제한조건들과 최소자료속도제한조건하에서 제안된 다중대리자심층강화학습에 기초한 전력할당흐레임워크들이 MIMO-OMA방식을 포함한 다른 방법들에 비하여 에네르기효률을 현저하게 개선할수 있다는것을 보여주고있다.
연구결과는 잡지《IET Communications》에 《Multi-agent deep reinforcement learning-based energy efficient power allocation in downlink MIMO-NOMA systems》(https://doi.org/10.1049/cmu2.12177)의 제목으로 출판되였다.