《전사회적으로 과학기술중시기풍을 세우며 전민과학기술인재화의 구호를 높이 들고 모든 일군들과 근로자들이 현대과학기술을 열심히 배우도록 하여야 합니다.》
인터네트가 발전하면서 의미웨브기술이 지식공유 및 지식체계화의 한 방법으로 대두함과 동시에 조선어정보처리에서 형태/구문해석이상의 처리단계를 필요로 하고있고 이와 관련하여 온톨로지에 대한 연구가 활성화되고있다.
온톨로지는 해당 령역에 대한 개념과 그 관계, 속성들의 모임으로서 자연언어처리와 정보검색, 기계번역, 의미웨브 등 다양한 령역에서 널리 리용되고있다.
조선어질의응답체계에 대하여서는 세계적으로 아직 미개척분야로 남아있으며 국내적으로는 그에 대한 연구가 활발히 벌어져 사실형질문에 대한 질의응답체계가 제품화되고있으나 학습에서 제기되는 여러 형태의 질문에 대처하자면 아직 연구해야 할 분야가 많다.
우리는 사용자가 제시한 조선어질문에 대한 대답을 추출하기 위하여 새로운 메타를 정의하고 그에 해당한 의미정보를 대상자원에 추가하여 온톨로지를 구축하였으며 그에 기초하여 조선어질의응답기능을 높이였다.
사용자가 자연어로 제시한 질문에 해당한 대답을 제공하는것이 바로 자동질의응답이며 이것은 전자학습체계가 갖추어야 할 필수적인 기능이다.
학술적으로 질의응답체계(QAS, Question Answering System)는 자연언어처리기술(NLP, Natural Language Processing)을 리용하는 지능화된 정보검색체계(IRS, Information retrieval System)이다.
연구분야로 보면 체계의 지식이 자연언어로 된 문서이고 출력도 자연언어로 이루어지는것으로 하여 언어해석을 위한 자연언어처리기술, 문서검색과 패쎄지(Passage)검색과 같은 정보검색기술과 고유실체추출기술분야 등이다.
세계적으로 다국어질의응답체계는 이미 실용화단계에 있으며 인터네트에 련결된 웨브프로그람형식으로 많은 프로그람들이 등장하고있다.
특히 IBM의 와트슨질의응답체계, START질의응답체계, Siri체계들은 이미 전세계적으로 널리 알려져있는 질의응답체계들이지만 이 체계들에서는 질의응답체계의 첫 부분인 질문처리부에 대한 연구 즉 질문분석과 질문으로부터 질문류형추출, 초점단어추출에만 주의를 돌리고 실지 대답이 들어있는 문서처리부의 지식구축에 대한 방법이 개선되지 못하고있으며 질의응답체계의 문서처리부에서 대상문서에 대한 메타자료구축이나 실마리어사전구축도 진행하여 정확도를 높이고있지만 사용자의 요구와는 관계없는 문장들도 대답문장으로 출력되게 된다는 결함이 있다.
이로부터 우리는 질의응답체계의 정확성을 높이기 위하여 대상지식을 의미적으로 해석하고 구조화하였다.
다음으로 우리는 조선어질의응답체계를 학과목질의응답체계에 적용하였다.
질의응답체계가 대상으로 하고있는 검색자원은 지정된 령역일수록 정확도가 높다.
대상령역은 학생들이 방과후에 리용하는 자체학습분야들로 한정하였다.
이 분야는 론리적으로, 의미적으로 타당한 지식을 대상으로 하고있는 령역이다.
사전에 학과목별로 지정된 령역의 어휘를 포괄하는 기초용어들과 관계들, 확장어휘들을 정의하는 용어들과 관계, 속성들을 결합하여 온톨로지를 구축하였다.
학습자원을 《사실목록》으로 구성하였으며 지식기지는 사실들을 전제와 결론으로 가지는 규칙들의 모임 즉 《규칙목록》으로 구성하였다.
체계를 XML층, RDF층, 온톨로지층, 론리층으로 구성하고 의미정보를 리용한 지식기지를 구축하였으며 RDF, XML 등을 통하여 의미적련결관계를 맺고 이를 리용하여 의미적처리들을 진행하도록 하였다.
적용결과 자연언어의 의미정보에 따라 내용을 추론하며 예측하지 못한 상황에 해당한 지능적인 응답을 생성해내는것이 가능하였다.
체계는 학습자원이 많지 않은 경우에도 정확도가 높았으며 온톨로지를 량적으로 질적으로 잘 구성하면 그에 기초한 의미적검색을 정확히 진행할수 있다는것을 확증하였다.
우리는 조선어질의응답체계에 대한 연구를 꾸준히 진행하여 나라의 교육정보화수준을 세계적으로 발전된 수준에 올려세움으로써