《새로운 과학분야를 개척하며 최신과학기술의 성과를 인민경제에 널리 받아들이기 위한 연구사업을 전망성있게 하여야 합니다.》 (
질문응답체계(QSA)는 사실형질문응답체계, 정의형질문응답체계 그리고 서술형질문응답체계로 분류된다. 이 기사에서 우리는 사실형질문-패쎄지검색에 기초한 서술형질문응답의 실현을 위한 한가지 방법을 소개한다. 서술형질문응답체계는 《펭긴새에 대하여》와 같은 질문에 대한 대답을 본문으로부터 탐색하는 질문응답체계이다. 이 체계는 질문-초점문서요약과 류사하다. 우리는 질문-초점문서요약만을 리용하여 질문《펭긴새에 대하여》에 대한 대답을 찾는 경우에 펭긴새에 대한 일부 중요한 정보를 찾을수 없기때문에 서술형질문응답체계를 론의한다.
서술형질문응답체계는 다음의 절차에 따라 수행된다. 첫째로, 우리는 사실형질문응답자료기지와 온톨로지를 리용하여 중요한 정보에 대한 사실형질문들을 작성하며 이러한 사실형질문에 대한 대답을 포함하는 패쎄지들을 검색한다. 둘째로, 질문-초점문서요약을 리용하여 문서를 요약한다. 셋째로, 첫째와 둘째 단계로부터 얻은 문장들을 결합하여 응답결과를 얻는다. 그림 1에서 서술형질문응답체계의 도해를 보여준다.
여기서 기본과제는 서술형질문에 관계되는 사실형질문들을 만드는것이다.
1. 대상의 속성을 리용한 사실형질문의 설계
우리는 사실형질문들의 자료기지를 구축하며 이 자료기지로부터 입력된 서술형질문에 대응하는 사실형질문들을 탐색한다. 실례로 《장미는 어떤 꽃인가?》와 같은 서술형질문이 입력되였다고 하자. 꽃에 대한 질문을 통해 우리가 알려는 정보는 일반적으로 대다수의 사람들에게 있어서 공통적이다. 그것은 장미는 어느 과에 속하는 꽃이며 언제 피며 장미가 자라는 산지는 어딘가 그리고 장미꽃의 색은 무엇이고 잎의 모양은 어떠한가 등이다. 이로부터 우리는 《장미는 어떤 꽃인가?》에 대하여 다음과 같은 사실형질문들을 생각할수 있다.
《장미꽃은 어느 과에 속하는 꽃인가?》,
《장미꽃이 꽃피는 시기는 언제인가?》
《장미꽃의 주요산지는 어디인가?》,
《장미꽃의 색갈은 무엇인가?》,
《장미꽃의 잎은 어떤 모양인가?》
우리는 서술형질문을 사람, 식물, 동물, 장소, 회의 등과 같은 형으로 분류하고 입력된 서술형질문의 형에 따라 사실형질문들을 탐색한다. 실례로 《장미는 어떤 꽃인가?》의 서술형질문은 식물형이므로 우리는 식물과 관련되는 사실형질문들의 자료기지로부터 서술형질문에 대응하는 사실형질문들을 탐색한다.
2. 령역온톨로지를 리용한 사실형질문의 설계
우리는 또한 령역온톨로지를 리용하여 사실형질문들을 작성하였다. 《펭긴새에 대하여?》와 같은 서술형질문이 입력되였다고 하자. 펭긴새는 생물분야의 개념이다. 그래서 우리는 생물령역온톨로지를 리용하여 사실형질문들을 설계하였다. 실례로 그림 2와 같은 생물령역온톨로지가 주어졌다고 가정하자.
그림 2로부터 우리는 펭긴새는 물고기를 먹으며 북극에서 살며 다리는 2개라는것 그리고 날개는 있으나 날수 없다는것을 알수 있다. 결국 우리는 그림 2의 온톨로지를 리용하여 《펭긴새에 대하여?》와 같은 서술형질문에 대한 사실형질문들을 다음과 같이 만들수 있다.
《펭긴새는 무엇을 먹고 사는가?》
《펭긴새는 어디서 사는가?》
《펭긴새의 다리는 몇개인가?》
《펭긴새는 날수 있는가?》
실례로 《펭긴새의 다리는 몇개인가?》에 대한 질문에 대하여 우리는 질문응답체계를 사용하지 않고 온톨로지 그 자체를 가지고도 펭긴새의 다리는 2개이라는것을 알수 있으며 사실형질문응답체계를 사용한다고 할지라도 펭긴새는 다리는 2개이라것만을 알수 있다. 우리가 요구하는 정보는 다리의 개수가 아니라 다리에 대한 보다 풍부한 정보이다. 그래서 우리는 사실형질문응답체계의 패쎄지검색단계에서 체계의 실행을 중지하며 다리에 대한 정보를 포함하는 패쎄지 즉 문장모임을 출력한다.
우리는 서술형질문응답체계에 이상과 같은 방법을 적용하여 체계의 성능을 개선하였다.