【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《文章语义分析》,欢迎阅读!
文章语义分析
1、什么是篇章语义分析篇章,是指由词和句子以复杂的关系链接而成,能够完成一定交际任务的完整连贯的语言单元。篇章语义分析是指在篇章层面上,将语言从表层的没有结构的文字序列转换为深层的有结构的机内表示,刻画篇章中的各部分内容的语义信息,并识别不同部分之间存在的语义关联,进而融合篇章内部信息和外部背景知识,更好的理解原文语义。篇章语义分析的研究建立在词汇级、句子级语义分析之上,融合篇章上下文的全局信息,分析跨句的词汇之间,句子与句子之间,段落与段落之间的语义关联,从而超越词汇和句子分析,达到对篇章等级更深层次的理解。
2、篇章语义分析方法概述篇章语义分析主要有以下三个主流的研究方向: 以篇章结构为核心此类研究工作的目标是识别不同文本块之间的语义关系,例如条件关系、对比关系等,亦称之为修辞关系识别。根据是否需要将文本分割为一系列彼此不相交的覆盖序列,可以将本类方法进一步分成两大类:第一类以修辞结构理论(Rhetorical Structure Theory)和篇章图树库(Discourse GraphBank)为代表,要求先将文本切分为彼此不相交的语义单元,并随后分析各部分之间的语义关系及结构组成;第二类方法以宾州篇章树库理论(Penn Discourse TreeBank)为代表,不需要预先切分文本,而是直接识别篇章关系及其元素所在位置,并随后识别具体的语义关系类型。
修辞结构理论(Rhetorical Structure Theory, RST)最早由Mann和Thompson在1988年发表的论文[1]中提出。除Mann和Thompson在该方向持续发表相关工作之外,Marcu在其论文中对RST理论进行了分析,并持续探索该方向,提出两种基于RST理论分析的文本处理方法[2]:(1)识别提示短
语(Cue Phrases, CP),然后将整句打散成若干个子句;(2)为无结构的文本建立一个有效的修辞结构树。RST理论以文本结构为分析对象,从小单元之间的连接关系开始,逐步延伸到自然语言段落和完整的语篇。RST在汉语中的跨语言可转移性有特殊的背景。可惜,虽然有不少对RST的中文介绍和初步应用计划等,但实质性的发展应用很少。
本文来源:https://www.wddqxz.cn/cfe1055001768e9951e79b89680203d8cf2f6a5e.html