《지금 사회가 발전하는 과정에 사회과학연구의 분야가 다양해지고 새로운 방법들이 적용되는데 따라 응용과학, 경계과학들이 새롭게 개척되고있습니다.》
모호한 단어들의 의미를 정량적으로 분석하는것은 언어학과 모호수학의 경계과학인 모호언어학에서 중요하게 제기되는 문제의 하나이다.
일반적으로 언어의 모호성이란 내용이 뚜렷하고 명백하지 못하여 의미한계를 정확히 규정할수 없는 성질을 말한다.
실례로 《그것은 몇사람만이 알고있었다.》라는 문장에서 《몇》은 모호성을 가진 단어로서 그것의 정확한 수량에 대하여서는 찍어서 말하기 힘들다. 어떤 사람은 3명이라고 할수 있고 또 어떤 사람은 4명이라고 할수도 있으며 5명이라고 하여도 틀린다고는 할수 없다.
사람들은 보통 정확성이나 명료성만이 언어의 표현성을 높이고 언어생활에서도 널리 쓰인다고 보아왔다. 하지만 자세히 따져보면 정확성이나 명료성만이 아니라 모호성도 언어의 표현성을 높이는데 이바지하며 또 언어생활에서 자주 쓰인다는것을 알수 있다.
실례로 《그 사람은 눈이 크고 입이 작다.》라는 문장에서 《크다》와 《작다》는 모두 모호한 단어들로서 이 단어들은 문장의 표현성을 높이는데 적극 이바지한다. 우의 문장에서 정확성과 명료성을 보장한다고 하여 눈이 3cm이고 입은 4cm라고 말한다면 오히려 대단히 따분하고 어색하게 될것이다.
언어생활에서 널리 그리고 효과적으로 쓰이는 모호한 단어들을 정량적으로 분석하는것은 언어자체에 대한 연구나 자연언어처리, 인공지능연구에서 중요한 의의를 가진다.
모호한 단어의 의미를 정량적으로 연구분석하기 위하여 모호수학의 연구성과를 도입하기로 한다.
모호수학은 모호성을 가지는 대상, 현상들을 연구하는 수학의 한 분야로서 모호수학이 종래의 수학과 차이나는 점은 의거하는 모임에 있다. 종래의 수학은 해당한 원소들이 주목하는 모임에 속하는가 속하지 않는가가 명백한 모임에 기초하였다면 모호수학은 해당한 원소들이 주목하는 모임에 속하는가 속하지 않는가가 모호한 모임에 기초한 수학이다.
주목하는 원소를 x라고 할 때 x∈A이면 x의 소속도는 A(x)=1, x∉A이면 x의 소속도는 A(x)=0이며 이러한 모임 A는 종래의 수학에서 론하는 보통모임이다.
한편 x의 Ã에로의 소속도 Ã(x)는 0과 1사이의 모든 실수값을 다 취할수도 있다. 즉 0≤Ã(x)≤1이며 이러한 모임 Ã가 바로 모호모임으로 된다.
만일 Ã(x)가 0과 1값만을 취한다면 모호모임 Ã은 보통모임 A로 된다. 결국 종래의 수학은 모호수학의 특수경우라는것을 알수 있다.
그러면 모호수학을 리용하여 《청년》, 《중년》, 《로년》과 같은 몇가지 모호한 단어들의 의미를 정량적으로 분석하는 방법에 대하여 보기로 하자.
《청년》, 《중년》, 《로년》의 개념들을 각각 모호모임 Ã1, Ã2, Ã3으로 표시하자.
사람의 년령을 1살부터 100살까지로 본다면 Ãi는 년령을 나타내는 원소들인 x1, x2, x3, …, x100으로 이루어진 모호모임이다.
모임 Ãi의 모호성이 큰가 작은가는 임의의 x에 대하여 Ãi에로의 소속도를 특징짓는 곁수 μ에 의하여 결정된다.
모호언어학에서 가장 어려운 문제는 곁수 μ를 수값으로 정확히 규정하는것이다. 이를 위하여 확률통계적방법과 성원함수를 만드는 방법 등이 리용된다.
언어의 모호성을 정량적으로 론의하기 위하여 성별, 성격, 년령들이 각이한 사람들 100명을 조사대상으로 하여 《청년》, 《중년》, 《로년》의 개념에 대한 확률통계적분석을 진행한 결과 다음의 그라프가 얻어진다.
여기서 t는 년령을 나타내는 축이고 μ는 매 년령이 개념 《청년》, 《중년》, 《로년》에 속하는 소속도를 나타내는 축이다.
그라프에서 보여주는것처럼 《청년》, 《중년》, 《로년》의 한계는 명백치 않고 어떤 주어진 년령의 매 개념에 대한 소속도 역시 각이하다.
어떤 년령은 두개의 개념모임에 속하기도 한다(례: 36살). 다시말하여 36살은 소속도 0.34를 가지고 《청년》개념에 속하기도 하고 소속도 0.66을 가지고 《중년》개념에 속하기도 한다.
각이한 사람들의 《청년》, 《중년》, 《로년》에 대한 진술을 통하여 Ã1에서의 값 μ23, μ24, μ25는 거의 1에 가깝고 μ36, μ37 등은 1보다 훨씬 작아진다는것을 알수 있다. 또한 μ37이상은 《중년》으로, μ57이상은 《로년》으로 보아야 할것이다.
이것을 모호수학을 리용하여 표시하자.
변수 x(년령)의 모임 Ãi에로의 소속도가 μ라는것을 μ(x ∈ Ãi) 또는 μ/x로 표시하자.
그러면 모호모임 Ãi={μ(i)1/x1, μ(i)2/x2, …, μ(i)100/x100}으로 표시된다.
주어진 년령이 주목하는 모임에 속하지 않으면 즉 0(x ∈ Ãi)이면 그 년령은 주목하는 모임에서 제거한다.
Ãi이 μ(i)>0인 원소들만을 포함한다는것을 고려하면 Ã1, Ã2, Ã3은 다음과 같이 표시된다.
Ã1={μ(1)16/x16, μ(1)17/x17,…, μ(1)37/x37}
Ã2={μ(2)33/x33, μ(2)37/x37,…, μ(2)57/x57}
Ã3={μ(3)54/x54, μ(3)57/x57,…, μ(3)100/x100}
이상에서 몇가지 모호한 단어들의 의미를 정량적으로 분석하는 방법에 대하여 보았다. 이와 관련한 방법에는 이밖에도 여러가지가 있을수 있다.
모호한 단어들의 이러한 정량적분석방법은 기계번역을 비롯한 자연언어처리분야에서 어려운 문제의 하나로 제기되는 의미적으로 애매하고 불명확한 단어들을 처리하는데 도움을 줄수 있다.
앞으로 이에 대한 연구는 더욱 심화되여야 할것이다.