基于多源数据流的Bootstrapping事件抽取文献综述

 2022-09-21 10:09

文献综述(或调研报告):

1、事件抽取

事件作为信息的一种表现形式,其定义为特定的人、物在特定时间和特定地点相互作用的客观事实。事件抽取则是一个从自由文本中识别事件的发生并抽取事件的各元素的任务。根据ACE2005评测,组成事件的各元素包括:触发词、事件类型、论元及论元角色。具体来说,自动内容抽取(Automatic Content Extraction, ACE)评测中的英文事件抽取任务涉及的相关术语及任务如下:

①实体(Entiy)。属于某个语义类别的对象或对象集合。其中包括:人、地理政治区域名、组织机构、地名、武器、建筑设施和交通工具。

②事件触发词(Event Trigger)。表示事件发生的核心词,多为动词或名词。

③事件论元(Event Argument)。事件的参与者,主要由实体、值、时间组成。值是一种非实体的事件参与者,例如工作岗位。和实体一样,ACE05 也标记出了句子中出现的值和时间。下文中,即将实体、值、时间统称为实体。

④论元角色(Argument Role)。事件论元在事件中充当的角色。共有35类角色,例如,攻击者、受害者等。ACE05定义了8种事件类型和33种子类型。其中,大多数事件抽取均采用33 种事件类型。事件识别是基于词的34 类(33 类事件类型+None)多元分类任务,角色分类是基于词对的36 类(35 类角色类型 None)多元分类任务。例如,对于以下句子:

In Baghdad, a cameraman died when an American tank fired on the Palestine hotel.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。