自然语言处理研究室

用机器来理解人类的语言是多年来人们一直想实现的梦想。随着siri的诞生,她背后的自然语言处理技术在公众面前大放异彩。自然语言处理技术,始于机器翻译的研究,虽经过几十年的积累,扩充其应用,提高其性能,但是依然还有很长的路要走。NLP研究室致力于利用知识引擎、统计机器学习等技术,来理解、响应自然语言输入,提升其在现有领域中的性能,并探索新的业务及应用。目前主要集中在机器翻译,自动问答系统,以及摘要自动生成等领域的研究。

  • 机器翻译

机器翻译是NLP的重要应用之一。随着时代的发展,人类的语言在不断变化,给机器翻译带来了很大挑战。尤其是在互联网时代,非正规的互联网语言,新词层出不穷,使得统计机器翻译系统很难获得高性能。目前我们针对这一问题正在展开研究工作,具体包括新词发现,翻译词典的构建,互联网语言正规化等。

  • 自动问答

自动问答是先进的下一代信息检索手段。不同于传统的基于关键字的信息检索,QA系统可以理解人类的自然语言,并且给出直接明了的答案。我们在问答系统的研究工作,包括:用户语义分析,知识库的管理,多知识库的联合使用,以及多问答系统的联合使用等。

  • 自动文摘

自动文摘生成可以利用计算机自动从原始文献中提取文摘,全面准确的反应某一文献的中心内容,从而把人们从大量的文献阅读中解脱出来。自动文摘的关键技术包括,计算词权,句权,选择文章句等。