2007年8月国际标准组织(ISO)第37技术委员会(TC37)第四分科(SC4)提议把语言信息处理的重要问题之一—《语言资源管理—书写文本的词汇区分》规定为国际标准的重点课题。
国际标准组织第37技术委员会把《语言资源管理——书写文本的词汇区分》作为标准化工作项目提了出来,这一课题的目的是在信息处理方面避免不同语言使用不同的词汇区分方法的弊端,而实现统一。
第37技术委员会第四分科专门负责朝鲜语、中国语、日本语等亚洲语言的词汇区分标准化工作。
朝鲜语不是屈折语、也不是孤立语,而是一种粘着语。上述标准反映了朝鲜语的这一特点,从而它作为全面反映世界各类型语言特性的样本标准,能够充分发挥作用,并且建立了一个全世界能够保证词汇区分工作的统一和互换、保证语言信息处理的速度和精确性的标准。
今后,此标准将适用于朝鲜语、日本语、汉语、泰语、越南语、蒙古语、藏语等语言的自然语言处理、信息搜索、搜索引擎、问答、机器翻译、语音合成的预处理、文本修正、语音识别、字符识别、其他文字输入方法的后处理、电子图书馆、语意网、电子办公、电子商务、电子学习等需要语言信息处理的所有应用领域中统一进行书写文本的词汇区分。
值得一提的是,通过此标准的制定过程,朝鲜语词汇丰富、语法构造发达的民族特性广为流传,它也就巩固了世界代表性语言的地位。
此标准的编制人员有