과학연구

언어정보처리의 견지에서 본 조선글자의 우수성

 2020.8.7.

위대한 수령 김일성동지께서는 다음과 같이 교시하시였다.

《과학과 문화의 발전에서 문자는 매우 중요한 역할을 합니다. 신문, 잡지, 과학기술서적들, 문학작품들이 다 문자로 씌여 집니다. 문자가 없이는 과학과 문화를 배울수도 없으며 발전시킬수도 없습니다.》 (김일성전집》 제32권 351페지)

혁명과 건설의 무기로서의 언어의 사회적기능과 역할은 문자에 의하여서도 높은 수준에서 담보된다.

정보의 폭발적흐름이 현대사회의 중요한 특징의 하나이라면 그 통보흐름의 주류를 이루는것은 문자로 씌여진 신문, 도서, 잡지, 문건이다. 문자로 씌여진 통보자료의 수집, 축적, 보존, 가공, 배렬, 정리, 색인, 초록, 검색, 번역문제는 불피코 문자와 관련한 언어학적문제를 제기한다.

독창적인 창제원리로 만들어진 우리 글자는 정보시대에 와서 자기의 우수성을 남김없이 발휘하고있어 세상사람들의 주요 관심사로 되고있다. 어떤 글자가 정보처리에서 합리성과 보편성을 띠고 쓰일수 있는가 하는것은 정보론적견지에서 글자의 우수성을 평가하는 척도의 하나로 된다. 우리 글자는 자모식음절문자이다.

자모 40개(자음 19개: ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅇ, ㅈ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ, ㄲ, ㄸ, ㅃ, ㅆ, ㅉ와 모음 21개: ㅏ, ㅑ, ㅓ, ㅕ, ㅗ, ㅛ, ㅜ, ㅠ, ㅡ, ㅣ, ㅐ, ㅒ, ㅔ, ㅖ, ㅚ, ㅟ, ㅢ, ㅘ, ㅝ, ㅙ, ㅞ)가 첫소리, 가운데소리, 받침소리의 규칙에 따라 서로 조합하여 음절글자를 이룬다.

첫소리로는 《닭》의 《ㄷ》와 같이 자음 18개(ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅈ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ, ㄲ, ㄸ, ㅃ, ㅆ, ㅉ), 가운데소리로는 《닭》의 《ㅏ》와 같이 모음 21개(ㅏ, ㅑ, ㅓ, ㅕ, ㅗ, ㅛ, ㅜ, ㅠ, ㅡ, ㅣ, ㅐ, ㅒ, ㅔ, ㅖ, ㅚ, ㅟ, ㅢ, ㅘ, ㅝ, ㅙ, ㅞ), 받침소리로는 《닭》의 《ㄺ》과 같이 자음 27개(ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅇ, ㅈ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ, ㄲ, ㅆ, ㄳ, ㄵ, ㄶ, ㄺ, ㄻ, ㄼ, ㄽ, ㄾ, ㄿ, ㅀ, ㅄ)가 된다.

구체적으로 본다면

① 모음만으로 이루어진 음절글자

아, 야, 어, 여 … 등 21개

② 자음과 모음으로 이루어긴 음절글자

가, 나, 다, 라 … 등 18×21=378개

③ 모음, 자음(홑받침)으로 이루어진 음절글자

악, 약, 억, 역 … 등 21×16=336개

④ 자음과 모음, 자음(홑받침)으로 이루어진 음절글자

각, 낙, 닥, 락 … 등 378×16=6 048개

⑤ 자음과 모음, 자음, 자음(둘받침)으로 이루어진 음절글자

몫, 닭, 삶, 돐 … 등 378×11=4 158개

⑥ 모음, 자음, 자음으로 이루어진 음절글자

앉, 옭, 옮, 앓 … 등 21×11=231개로서 총 결합가능한 음절글자수는 11 172개이다.

이렇게 결합되여 이루어진 11 172자의 음절글자로 순한소리, 거센소리, 된소리와 다양한 홑모음 겹모음뿐아니라 동서고금의 그 어떤 언어의 말소리도 거의다 정확히 표기할수 있다.

그러나 일부 언어들에서 쓰이는 라틴문자와 끼릴문자, 가나문자로는 일련의 말소리를 표기할수 없다.

실례로 조선어단어의 《코끼리》의 발음을 라틴문자로는 《코키리》(kokiri)로, 끼릴문자로는 《꼬끼리》(кокири)로, 가나문자로는 《곳기리》(コッギリ)로 표기하게 되는데 이렇게 되면 조선어단어의 고유한 말소리인 《코끼리》를 표기하지 못하는것으로 된다.

우리 글자는 각이한 언어의 말소리를 비교적 정확하게 표기할수 있어 다른 문자들에 비하여 어음표기에서 아주 우수하다.

우리 글자는 1음 1자로 되여있다.

다시말하여 자음 《ㄱ》는 어떤 조건에서든지 《ㄱ》으로 표기되며 모음《ㅏ》도 어떤 발음환경에서도 《ㅏ》로 표기된다.

그러나 라틴문자는 1음 다자(하나의 음, 여러 글자), 1자 다음(하나의 글자, 여러음)으로 되여있어 그 사용과 표현에서 일관성이 없다. 즉 같은 음을 각이하게 표기하거나 한개 자모가 여러개의 음을 나타내는 약점을 가지고있는것이다.

실례로 《이》라는 말소리를 표기하는데서 경우에 따라 《i, e(1음 다자)》로 쓰이며 《a》라는 자모가 《에, 애어, 에이, 아, 어(1자 다음)》등 여러가지 말소리로 표기되는것이다.

그런가하면 모음 《이》라는 말소리의 표기를 《ea, ee》처럼 모음을 합쳐서 쓰기도 하며 자음 《츠》라는 말소리의 표기를 《ch, sh, th》처럼 자음을 합쳐서 쓰기도 한다.

이렇게 놓고볼 때 우리 글자는 라틴문자들을 비롯한 다른 문자들보다 표기의 측면에서 합리적인 점을 가지고있으며 이것은 바로 우리 글자가 언어정보처리에서 국제적인 관심사로 될수 있게 하는 기본요인으로 되는것이다.

실지로 현시기 음성인식을 비롯한 정보처리분야에서는 우리 글자를 많은 나라의 말소리를 표기하는 공통표기수단으로 리용하자는 의견들이 제기되고있다.

우리는 우리 글자가 정보론적인 효과를 더 얻을수 있도록 연구사업을 심화시킴으로써 언어학의 주체적발전에 적극 이바지해나갈것이다.