首页 >> 资讯 >> 高校 >> 高校新闻
国际语言学高峰论坛在京举行
2014年07月28日 15:02 来源:中国社会科学网 作者: 字号

内容摘要:邵艳秋教授通过研究提出一套中文语义依存关系描述体系,用来实现对自然语言的自动语义分析,其主要内容为:语义分析是实现自然语言理解的必经之路。袁毓林教授通过研究提出一种基于规则的方法,用来找回隐含的动词,进而自动给出释义,其研究步骤为:一是利用《现代汉语语义词典》中名词的语义类别,来建立名名组合的语义类组合模式。荀恩东教授和于东老师通过将词汇嵌入技术和术语的概念表示相互结合,提出“概念嵌入”的思想,进而把术语的内涵和外延统一表示为向量,最终实现通过向量表示概念所蕴含的语义。词汇嵌入能够利用原始文本,无监督地发现上下文词语共现、语序等刻画语义的特征,可使语义类似的词语,其向量表示也较为接近。

关键词:语义;依存;北京语言大学;教授;词汇;分析;汉语;语言处理;图;向量

作者简介:

  中国社会科学网讯(记者马献忠)7月25日,主题为“语言学、自然语言处理和Web语言的发展趋势”、由北京语言大学主办的国际语言学高峰论坛在北京举行,来自北京语言大学、北京大学、清华大学和美国、印度、瑞典等高校和国家的语言学及计算机科学、心理学等相关领域的专家学者出席论坛,第12届国际语言学奥林匹克竞赛的部分裁判和参赛选手也到会,倾听语言学及相关学科的最新研究成果。

  来自美国的卡耐基梅隆大学Lori Levin女士,是机器翻译领域的副教授,作了题为“限定词语的标注和分类”(Annotation and Classification of Definiteness)的发言;来自印度的微软研究所的Monojit Choudhury先生,是计算语言学和复杂网络领域的研究员,作了题为“网络搜索查询语句的语言结构演化”(The Emergent Linguistic Structure of Web Search Queries)的发言;来自北京语言大学的邵艳秋教授,是中文信息处理方面的专家,作了题为“中文语义依存图库构建及语义分析技术研究”(Resource and Techniques of Chinese Semantic Dependency Graph Analysis)的发言;来自美国的密歇根大学的Dragomir Radev先生,是自然语言处理、信息检索和网络分析领域的副教授,作了题为“面向集体话语分析的自然语言处理”(Natural Language Processing for Analyzing Collective Discourse)的发言;来自北京大学袁毓林教授,是现代汉语研究、计算语言学和词汇语义学领域的专家,作了题为“基于规则的汉语名名组合的自动释义研究”(Towards a Rule-based Approach to Automatic Interpretation of Chinese Noun Compounds)的发言;来自荷兰奈梅亨马普心理语言学研究所的Hedvig Skirgard女士(瑞典籍),是语言类型学领域的学者,作了题为“语言学家的类型学?”(Typology of Linguists?)的发言;来自北京语言大学荀恩东教授和于东老师,是自然语言处理领域的学者,作了题为“科技术语概念的嵌入表示及其应用”(Conception Embedding of Technical Term and Its Applications)的发言;来自清华大学孙茂松教授,是自然语言处理和人工智能领域的学者,也作了发言。主办方还特邀北京大学心理系的周晓林教授参加峰会,参与研讨。

  邵艳秋教授通过研究提出一套中文语义依存关系描述体系,用来实现对自然语言的自动语义分析,其主要内容为:语义分析是实现自然语言理解的必经之路。语义依存分析是语义的深层分析。完善的语义表示体系对语义依存分析有重要作用。我们提出了一套层次清晰、覆盖面广的中文语义依存关系描述体系。为了更全面地覆盖多变的汉语语义表达形式,我们的体系突破了依存树结构的限制,扩展为语义依存图,允许图中的依存弧存在交叉、允许某些节点存在多个中心节点。此外,在依存树分析基础上建立了基于SVM的依存图构建系统,实现了完整的依存图的自动分析。

  在网络搜索中,经常遇到隐含了动词的双重名词组合。袁毓林教授通过研究提出一种基于规则的方法,用来找回隐含的动词,进而自动给出释义,其研究步骤为:一是利用《现代汉语语义词典》中名词的语义类别,来建立名名组合的语义类组合模式;二是利用名名组合中某个名词的施成角色或功能角色作为释义动词,来揭示这两个名词之间的语义关系;三是以语义类组合模式为单位构建名名组合的释义模板,并汇集成名名搭配数据库;四是建立包含施成角色和功能角色的汉语名词知识库。在这两个数据库的基础上,初步实现了一个汉语名名组合的自动释义程序。

  荀恩东教授和于东老师通过将词汇嵌入技术和术语的概念表示相互结合,提出“概念嵌入”的思想,进而把术语的内涵和外延统一表示为向量,最终实现通过向量表示概念所蕴含的语义。其主要内容为:“词汇嵌入”是指运用机器学习的方法,将离散的单词映射为连续空间中实数向量的技术。词汇嵌入能够利用原始文本,无监督地发现上下文词语共现、语序等刻画语义的特征,可使语义类似的词语,其向量表示也较为接近。通过词汇嵌入,词语中所蕴含的语义特征能够以更好的方式表示,为自然语言处理带来许多便利。术语是本体概念的简单字符串表示形式,通常仅体现了所指代概念的最明显特征和信息,如“蓝牙”、“形式语法”、“OTT”等,这种方式方便了书写和记录,但也因省略了过多信息而导致术语的概念难以通过字面理解。荀恩东教授和于东老师将词汇嵌入技术与术语概念的表示结合,提出“概念嵌入”的思想,试图把术语的内涵和外延统一表示为向量,用该向量来表示概念所蕴含的语义。

分享到: 0 转载请注明来源:中国社会科学网 (责编:张彦)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们