2022年6月23日,我院2020级硕士生张玉洁在国际数字图书馆会议(the ACM/IEEE Joint Conference on Digital Libraries 2022 (JCDL2022)) 3rd Workshop on Extraction and Evaluation of Knowledge Entities from Scientific Documents (EEKE2022)上,做了题为《2SCE-4SL: A 2-Stage Causality Extraction Framework for Scientific Literature》的报告。该文第一作者为张玉洁,第一单位为山东理工大学信息管理研究院,白如江教授为通讯作者,被会议录用为EEKE2022的Long Paper。
自动识别学术文献中的因果关系对于知识发现,智能推理,未来场景生成,事件溯因,因果推断等方面具有重要的作用,但是现有的因果关系抽取方法大都应用于通用的常识性领域。该文提出从科技文献中自动抽取因果关系,并提出了2SCE-4SL的两阶段式科技文献因果关系抽取框架。在第一阶段,从因果句中解析出术语和因果触发词,组配成为含有噪声的因果三元组。在第二阶段,设计了基于Transformer架构的降噪自编码器对因果句进行特征表示,该架构通过因果触发词标记和噪声消解用以学习句子的因果依赖和结构信息,同时注入特定领域知识。最后,结合第一阶段的因果表达结构和第二阶段的因果句表示模型,从噪声因果三元组中识别出真实的因果对。消融实验和对比实验说明2SCE-4SL仅需少量的标注数据就能有更好的性能,具有良好的领域适应性。
据悉,JCDL是图书情报与档案管理领域的重要会议,致力于关注数字图书馆机器相关技术、实践与社会问题的主要国际论坛,被武汉大学信息管理学院列为图情领域A类国际会议。2022年的JCDL于6月20-24日在德国科隆举行,线上线下相结合。EEKE2022 workshop由南京理工大学章成志教授,德国莱布尼茨社会科学研究所Philipp Mayr教授,武汉大学陆伟教授,悉尼科技大学张嶷博士联合发起,该研讨会致力于科技文献知识实体的挖掘与评估,在该领域具有重要的影响力。来自美国佐治亚理工学院Alan L .Porter教授作了Keynote报告。
山东理工大学 信息管理学院 地址:山东省淄博市张店区新村西路266号(255000) 电话:0533-2781428
CopyRight © 2023 isti.sdut.edu.cn All Rights Reserved