项目简介:
HNC自然语言处理技术(国家“973”计划项目G1998030506)是一种具有原始创新特点的自然语言理解处理技术。该技术以中科院声学所黄曾阳研究员创立的概念层次网络(简称HNC)理论为指导。HNC理论认为:自然语言理解的本质是概念联想脉络激活、扩展、浓缩、转换与存储的全过程运作。激活运作的要点是语句的理解;扩展与浓缩运作的要点是段落与篇章的理解,转换与存储的要点是记忆与学习。语句的理解必须定位于概念联想脉络运作全过程的激活。并且建立了自然语言的概念空间。语句及自然语言的理解,就是从语言空间向语言概念空间的映射过程。这一处理方案,使计算机能够进入自然语言的语义深层,在“懂”的基础上完成对自然语言的各种处理。该技术在汉语语句理解处理方面居国际领先水平。
应用前景:
汉字具有表意的特点,汉语是意合型语言,不使用形态变化,因此对它的处理,不同于有形态变化的语言,必须结合汉语的特点探索汉语自己的理解处理道路。HNC理论正是诞生于汉语的特点――“字义基元化,词义组合化”,它是进入语言深层对自然语言进行处理的理论。HNC自然语言处理技术,对于方块字的汉语,具有特殊重要的意义,具有巨大的市场和广阔的应用前景。该技术可以形成下述系统,或大大提高下述系统的处理能力:书面语双向翻译系统、汉语文字文本孤群发现及孤魂消除处理系统、基于文本内容的网络信息搜寻服务系统、文本分类系统、人机交互学习系统、汉语应用文语言助理小系统、常规口语处理的辅助理解系统、特定领域或要求的情报发掘系统、汉语语言研究服务系统。
HNC自然语言处理技术的建立与发展,标志着我国在自然语言理解处理及语言信息-知识转换方面占据了有利位置,有望在信息时代的高级阶段占领技术制高点,取得领先地位。