基于BoBGSAL⁃Net的文档级实体关系抽取方法

doi:10.13232/j.cnki.jnju.2023.06.011

[1]

Yuan

C S

， Huang

H Y

， Feng

C

，et al.

Document⁃level relation extraction with entity⁃selection attention

Information Sciences，2021（568）：163-174.

[本文引用: 1]

[2]

Zhang

Q Q

， Chen

M D

， Liu

L Z

.

A review on entity relation extraction ∥ Proceedings of the 2nd Inter⁃national Conference on Mechanical，Control and Computer Engineering

Harbin，China： IEEE，2017：178-183.

[本文引用: 1]

[3]

Li

Z H

， Yang

Z H

， Xiang

Y

，et al.

Exploiting sequence labeling framework to extract document⁃level relations from biomedical texts

BMC Bioinformatics，2020，21(1)：125.

[本文引用: 1]

[4]

Han

X Y

， Wang

L

.

A novel document⁃level relation extraction method based on BERT and entity information

IEEE Access，2020(8)：96912-96919.

[本文引用: 1]

[5]

Geng

Z Q

， Chen

G F

， Han

Y M

，et al.

Semantic relation extraction using sequential and tree⁃structured LSTM with attention

Information Sciences，2020（509）：183-192.

[本文引用: 4]

[6]

Luo

L

， Yang

Z H

， Yang

P

，et al.

An attention⁃based BiLSTM⁃CRF approach to document⁃level chemical named entity recognition

Bioinformatics，2018，34(8)：1381-1388.

[本文引用: 5]

[7]

Tang

H Z

， Cao

Y N

， Zhang

Z Y

，et al.

HIN：Hierarchical inference network for document⁃level relation extraction∥Proceedings of the 24th Pacific⁃Asia Conference on Knowledge Discovery and Data Mining

Springer Berlin Heidelberg，2020：197-209.

[本文引用: 7]

[8]

Najibi

M

， Rastegari

M

， Davis

L S

.

G⁃CNN：An iterative grid based object detector ∥Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition

Las Vegas，NV，USA：IEEE，2016：2369-2377.

[本文引用: 4]

[9]

Gu

J X

， Wang

Z H

， Kuen

J

，et al.

Recent advances in convolutional neural networks

Pattern Recognition，2018（77）：354-377.

[本文引用: 1]

[10]

Li

Z W

， Liu

F

， Yang

W J

，et al.

A survey of convolutional neural networks：Analysis，applications，and prospects

IEEE Transactions on Neural Networks and Learning Systems，2022，33(12)：6999-7019.

[11]

O'Shea

K

, Nash

R

.

An introduction to convolutional neural networks

2015，arXiv：1511.08458.

[12]

Lavin

A

， Gray

S

.

Fast algorithms for convolutional neural networks∥Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition

Las Vegas，NV，USA：IEEE，2016：4013-4021.

[本文引用: 4]

[13]

Huang

J W

， Abadi

D J

.

Leopard：Lightweight edge⁃oriented partitioning and replication for dynamic graphs

Proceedings of the VLDB Endowment，2016，9(7)：540-551.

[本文引用: 1]

[14]

刘英莉,吴瑞刚,么长慧，等.

铝硅合金实体关系抽取数据集的构建方法

浙江大学学报(工学版)，2022，56(2)：245-253.

[本文引用: 2]

Liu

Y L

， Wu

R G

， Yao

C H

，et al.

Construction method of extraction dataset of Al⁃Si alloy entity relationship

Journal of Zhejiang University (Engineering Science)，2022，56(2)：245-253.

[本文引用: 2]

[15]

Sheng

D M

， Wang

D

， Shen

Y

，et al.

Summarize before aggregate：A global⁃to⁃local heterogeneous graph inference network for conversational emotion recognition∥Proceedings of the 28th International Conference on Computational Linguistics

Barcelona，Spain： International Committee on Computational Linguistics，2020：4153-4163.

[本文引用: 1]

[16]

Auten

A

， Tomei

M

， Kumar

R

.

Hardware acceleration of graph neural networks∥ Proceedings of 2020 57th ACM/IEEE Design Automation Conference (DAC)

San Francisco，CA，USA：IEEE，2020：1-6.

[17]

Abadal

S

， Jain

A

， Guirado

R

，et al.

Computing graph neural networks：A survey from algorithms to accelerators

ACM Computing Surveys，2022，54(9)：191.

[本文引用: 1]

[18]

Pennington

J

， Socher

R

， Manning

C

.

GloVe：Global vectors for word representation ∥ Proceedings of 2014 Conference on Empirical Methods in Natural Language Processing

Doha，Qatar：ACL，2014：1532-1543.

[本文引用: 1]

[19]

Tanvir

R

， Shawon

T R

， Mehedi

H K

，et al.

A GAN⁃BERT based approach for bengali text classification with a few labeled examples∥ Proceedings of the 19^th International Symposium on Distributed Computing and Artificial Intelligence

Springer Berlin Heidelberg，2022：20-30.

[本文引用: 1]

[20]

Niu

Z Y

， Zhong

G Q

， Yu

H

.

A review on the attention mechanism of deep learning

Neuro⁃computing，2021（452）：48-62.

[本文引用: 1]

[21]

Harter

A

， Hopper

A

， Steggles

P

，et al.

The anatomy of a context⁃aware application

Wireless Networks，2002，8(2-3)：187-197.

[本文引用: 3]

[22]

Mrityunjay

K

, Ravindra

G

.

Learning to fingerprint the latent structure in question articulation∥2018 17^th IEEE International Conference on Machine Learning and Applications (ICMLA).

Orlando,FL,USA：IEEE,2018：73-80.

[本文引用: 3]

[23]

Veličković， Cucurull

G

， Casanova

A

，et al.

Graph attention networks

2017，arXiv：1710.10903.

[本文引用: 3]

[24]

Chen

L

， Tian

F L

.

Skew⁃rank of an oriented graph with edge⁃disjoint cycles

Linear and Multilinear Algebra，2016，64(6)：1197-1206.

[本文引用: 3]

[25]

Li

Z X

， Sun

Y R

， Zhu

J W

，et al.

Improve relation extraction with dual attention⁃guided graph convolutional networks

Neural Computing and Applications，2021，33(6)：1773-1784.

[本文引用: 3]

[26]

Zeng

S

, Xu

R

, Chang

B

，et al.

Double graph based reasoning for document⁃level relation extraction

2020，arXiv：2009.13752.

[本文引用: 3]

[27]

Dai

D M

， Ren

J

， Zeng

S

，et al.

Coarse⁃to⁃fine entity representations for document⁃level relation extraction

2020，arXiv：2012.02507.

[本文引用: 3]

[28]

Xu

B F

， Wang

Q

， Lyu

Y J

，et al.

Entity structure within and throughout：Modeling mention dependencies for document⁃level relation extraction ∥ Proceedings of the 35th AAAI Conference on Artificial Intelligence

Online：AAAI Press，2021：14149-14157.

[本文引用: 3]

[29]

Xu

W

， Chen

K H

， Mou

L L

，et al.

Document⁃level relation extraction with sentences importance estimation and focusing

∥Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics：Human Language Technologies. Seattle，WA，United States：ACL，2022：2920-2929.

[本文引用: 3]

[30]

Nan

G S

， Guo

Z J

， Sekuli

I

，et al.

Reasoning with latent structure refinement for document⁃level relation extraction

∥Proceedings of the 58^th Annual Meeting of the Association for Computational Linguistics. Online：ACL，2020：1546-1557，DOI：10.18653/v1/2020.acl-main.141 .

[本文引用: 3]

[31]

Zhao

C

， Zeng

D J

， Xu

L

，et al.

Document⁃level relation extraction with context guided mention integration and inter⁃pair reasoning

.2022， arXiv：2201.04826.

[本文引用: 3]

[32]

Yao

Y

， Ye

D M

， Li

P

，et al.

DocRED：A large⁃scale document⁃level relation extraction dataset∥Proceedings of the 57^th Annual Meeting of the Association for Computational Linguistics

Florence，Italy：ACL，2019：764-777，DOI：10.18653/v1/P19-1074.

[本文引用: 1]

[33]

Li

J Y

， Xu

K

， Li

F

，et al.

MRN：A locally and globally mention⁃based reasoning network for document⁃level relation extraction∥Proceedings of the Findings of the Association for Computational Linguistics

Online：ACL， 2021：1359-1370.

[本文引用: 1]

[34]

Xu

W

， Chen

K H

， Zhao

T J

.

Discriminative reasoning for document⁃level relation extraction ∥Proceedings of the Findings of the Association for Computational Linguistics

. ACL， 2021：1653-1663，DOI：10.18653/v1/2021.findings-acl.144 .

[本文引用: 1]

Document?level relation extraction with entity?selection attention

1

2021

... 近年来，随着深度学习算法快速发展，基于神经网络的文档级实体关系抽取^［1］方法已经成为研究热点.文档级实体关系抽取是指从整个文档中抽取出实体之间的关系，相较于句子级实体关系抽取^［2］，文档级实体关系抽取需要处理更大量、更复杂的实体关系信息.因此，需要将多个句子中的实体关系整合起来，以更准确地识别实体之间的关系.目前实体关系抽取的方法主要分为基于传统机器学习和深度学习的方法.基于传统机器学习的文档级实体关系抽取依赖于特征工程，无法处理复杂关系，并且模型的泛化能力有限.相比之下，基于深度学习的实体关系抽取方法可以很好地解决这些问题，对长文本处理更加高效，也具有更强的鲁棒性. ...

A review on entity relation extraction ∥ Proceedings of the 2nd Inter?national Conference on Mechanical，Control and Computer Engineering

1

2017

... 近年来，随着深度学习算法快速发展，基于神经网络的文档级实体关系抽取^［1］方法已经成为研究热点.文档级实体关系抽取是指从整个文档中抽取出实体之间的关系，相较于句子级实体关系抽取^［2］，文档级实体关系抽取需要处理更大量、更复杂的实体关系信息.因此，需要将多个句子中的实体关系整合起来，以更准确地识别实体之间的关系.目前实体关系抽取的方法主要分为基于传统机器学习和深度学习的方法.基于传统机器学习的文档级实体关系抽取依赖于特征工程，无法处理复杂关系，并且模型的泛化能力有限.相比之下，基于深度学习的实体关系抽取方法可以很好地解决这些问题，对长文本处理更加高效，也具有更强的鲁棒性. ...

Exploiting sequence labeling framework to extract document?level relations from biomedical texts

1

2020

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

A novel document?level relation extraction method based on BERT and entity information

1

2020

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

Semantic relation extraction using sequential and tree?structured LSTM with attention

4

2020

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

An attention?based BiLSTM?CRF approach to document?level chemical named entity recognition

5

2018

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

... BoBGSAL⁃Net是一种基于双图特征的图聚合和推理网络^［15-17］，利用异构提及级图来建模文档中不同提及级节点之间的交互，并捕获文档感知功能，从而更好地处理文档级的实体关系提取任务.BoBGSAL⁃Net采用实体级图，并融合路径推理机制来更明确地推断关系.该模型由四个部件组成，包括文本编码嵌入机制、混合提及级图策略、实体关系图模块和分类预测模块.其中，文本编码嵌入机制采用了BiLSTM^［6］，GloVe^［18］和BERT^［19］三种文本编码嵌入方式.BiLSTM在捕捉局部上下文信息方面效果较好；GloVe生成的词向量利用了全局语料库中的共现信息，对于单个词的语义表示有一定优势；BERT通过双向文本建模捕捉丰富的上下文信息，对于理解复杂实体关系至关重要.BERT的预训练模型能有效编码整个文档上下文，包括长文本中的实体语义关系.相较于BiLSTM和GloVe，采用BERT作为词嵌入模型具有显著优势.混合提及级图策略主要用于不同提及级节点之间的信息交互模拟计算，实体关系图模块对整个文档中的实体关系进行交叉计算.最后，通过实体关系分类预测模块，该模型可以从文档中抽取实体和关系.BoBGSAL⁃Net的完整结构如图1所示. ...

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

HIN：Hierarchical inference network for document?level relation extraction∥Proceedings of the 24th Pacific?Asia Conference on Knowledge Discovery and Data Mining

7

2020

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... ［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

G?CNN：An iterative grid based object detector ∥Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition

4

2016

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

Recent advances in convolutional neural networks

1

2018

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

A survey of convolutional neural networks：Analysis，applications，and prospects

0

2022

An introduction to convolutional neural networks

0

2015

Fast algorithms for convolutional neural networks∥Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition

4

2016

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

Leopard：Lightweight edge?oriented partitioning and replication for dynamic graphs

1

2016

... 基于深度学习的文档级实体关系抽取的方法主要包括基于序列^［3］、基于图和基于预训练语言模型^［4］.Geng et al^［5］提出一种基于双向树结构长短期记忆的端到端方法，提取基于句子依赖树的结构特征.Luo et al^［6］提出一种基于神经网络的方法，即带有条件随机场层的注意力双向长短时记忆方法，用于文档级别的化学命名实体识别.Tang et al^［7］提出一种分层推理网络，充分利用来自实体级、句子级和文档级的丰富信息，将平移约束和双线性变换应用于多个子空间中的目标实体对，以获得实体级的推理信息.Najibi et al^［8］提出一种基于卷积神经网络^［9-12］的目标检测技术，可以从多尺度网格的固定边界框开始，训练一个回归器，迭代地将网格元素移动和缩放到紧密围绕物体的框中.Huang et al^［13］提出一种针对不断变化的大型图而设计的动态图划分算法，该算法与分区算法紧密集成，进一步减少了分区算法切割的边数.尽管以上研究方法已在文档级实体关系抽取任务中取得了一些较好的成果，但仍然存在一定的局限性，具体表现在识别一些不需要一致性的实体类型时可能存在缺点.例如，在文章中有时会使用相同的缩写来指代不同的实体，而且在处理需要捕获更复杂的长距离依赖信息的文章时，这些方法表现不佳. ...

铝硅合金实体关系抽取数据集的构建方法

2

2022

... 针对文档级实体关系抽取的研究，主要难点有：（1）文档中不同实体之间的复杂信息交互问题，需要对文档中多个句子进行推理，对于深度学习模型的训练和推理会带来更高的计算复杂度；（2）文档中实体关系中存在的关系重叠问题，一个实体可能有多种不同的含义及解释，一个实体对应多种关系的复杂性.为了解决上述问题，本文提出一种基于双图结构的聚合逻辑网络（Based on Bipartite Graph Structure Aggregate Logic Network，BoBGSAL⁃Net）的文档级实体关系抽取方法，该方法首先构建一个混合提及级图（Mixed Mention⁃Level Graph，MMLG）来模拟整个文档中不同提及节点之间的信息交互，然后构建了实体关系图（Entity Relation Graph），针对文档的句内实体进行关系提取.基于MMLG和ERG，本文融合聚合逻辑推理路径来推断实体之间的关系并进行分类预测.最后，在公开的数据集DocRED以及作者实验室构建的数据集AlSia⁃RED^［14］上进行实验，结果证明BoBGSAL⁃Net在文档级实体关系抽取任务中性能有一定提升. ...

... 作者自建数据集AlSiaRED^［14］是在铝硅合金研究领域的专家指导下，构建的用于铝硅合金关系抽取的一个数据集，其构建过程包括选择材料科学文献、确定标注内容以及进一步确定数据集的实体类型和关系类型.AlSiaRED数据集共涵盖8226个句子，标注了9362个实体以及6876种关系，可以同时进行实体识别和关系抽取任务. ...

Construction method of extraction dataset of Al?Si alloy entity relationship

2

2022

... 针对文档级实体关系抽取的研究，主要难点有：（1）文档中不同实体之间的复杂信息交互问题，需要对文档中多个句子进行推理，对于深度学习模型的训练和推理会带来更高的计算复杂度；（2）文档中实体关系中存在的关系重叠问题，一个实体可能有多种不同的含义及解释，一个实体对应多种关系的复杂性.为了解决上述问题，本文提出一种基于双图结构的聚合逻辑网络（Based on Bipartite Graph Structure Aggregate Logic Network，BoBGSAL⁃Net）的文档级实体关系抽取方法，该方法首先构建一个混合提及级图（Mixed Mention⁃Level Graph，MMLG）来模拟整个文档中不同提及节点之间的信息交互，然后构建了实体关系图（Entity Relation Graph），针对文档的句内实体进行关系提取.基于MMLG和ERG，本文融合聚合逻辑推理路径来推断实体之间的关系并进行分类预测.最后，在公开的数据集DocRED以及作者实验室构建的数据集AlSia⁃RED^［14］上进行实验，结果证明BoBGSAL⁃Net在文档级实体关系抽取任务中性能有一定提升. ...

... 作者自建数据集AlSiaRED^［14］是在铝硅合金研究领域的专家指导下，构建的用于铝硅合金关系抽取的一个数据集，其构建过程包括选择材料科学文献、确定标注内容以及进一步确定数据集的实体类型和关系类型.AlSiaRED数据集共涵盖8226个句子，标注了9362个实体以及6876种关系，可以同时进行实体识别和关系抽取任务. ...

Summarize before aggregate：A global?to?local heterogeneous graph inference network for conversational emotion recognition∥Proceedings of the 28th International Conference on Computational Linguistics

1

2020

... BoBGSAL⁃Net是一种基于双图特征的图聚合和推理网络^［15-17］，利用异构提及级图来建模文档中不同提及级节点之间的交互，并捕获文档感知功能，从而更好地处理文档级的实体关系提取任务.BoBGSAL⁃Net采用实体级图，并融合路径推理机制来更明确地推断关系.该模型由四个部件组成，包括文本编码嵌入机制、混合提及级图策略、实体关系图模块和分类预测模块.其中，文本编码嵌入机制采用了BiLSTM^［6］，GloVe^［18］和BERT^［19］三种文本编码嵌入方式.BiLSTM在捕捉局部上下文信息方面效果较好；GloVe生成的词向量利用了全局语料库中的共现信息，对于单个词的语义表示有一定优势；BERT通过双向文本建模捕捉丰富的上下文信息，对于理解复杂实体关系至关重要.BERT的预训练模型能有效编码整个文档上下文，包括长文本中的实体语义关系.相较于BiLSTM和GloVe，采用BERT作为词嵌入模型具有显著优势.混合提及级图策略主要用于不同提及级节点之间的信息交互模拟计算，实体关系图模块对整个文档中的实体关系进行交叉计算.最后，通过实体关系分类预测模块，该模型可以从文档中抽取实体和关系.BoBGSAL⁃Net的完整结构如图1所示. ...

Hardware acceleration of graph neural networks∥ Proceedings of 2020 57th ACM/IEEE Design Automation Conference (DAC)

0

2020

Computing graph neural networks：A survey from algorithms to accelerators

1

2022

... BoBGSAL⁃Net是一种基于双图特征的图聚合和推理网络^［15-17］，利用异构提及级图来建模文档中不同提及级节点之间的交互，并捕获文档感知功能，从而更好地处理文档级的实体关系提取任务.BoBGSAL⁃Net采用实体级图，并融合路径推理机制来更明确地推断关系.该模型由四个部件组成，包括文本编码嵌入机制、混合提及级图策略、实体关系图模块和分类预测模块.其中，文本编码嵌入机制采用了BiLSTM^［6］，GloVe^［18］和BERT^［19］三种文本编码嵌入方式.BiLSTM在捕捉局部上下文信息方面效果较好；GloVe生成的词向量利用了全局语料库中的共现信息，对于单个词的语义表示有一定优势；BERT通过双向文本建模捕捉丰富的上下文信息，对于理解复杂实体关系至关重要.BERT的预训练模型能有效编码整个文档上下文，包括长文本中的实体语义关系.相较于BiLSTM和GloVe，采用BERT作为词嵌入模型具有显著优势.混合提及级图策略主要用于不同提及级节点之间的信息交互模拟计算，实体关系图模块对整个文档中的实体关系进行交叉计算.最后，通过实体关系分类预测模块，该模型可以从文档中抽取实体和关系.BoBGSAL⁃Net的完整结构如图1所示. ...

GloVe：Global vectors for word representation ∥ Proceedings of 2014 Conference on Empirical Methods in Natural Language Processing

1

2014

... BoBGSAL⁃Net是一种基于双图特征的图聚合和推理网络^［15-17］，利用异构提及级图来建模文档中不同提及级节点之间的交互，并捕获文档感知功能，从而更好地处理文档级的实体关系提取任务.BoBGSAL⁃Net采用实体级图，并融合路径推理机制来更明确地推断关系.该模型由四个部件组成，包括文本编码嵌入机制、混合提及级图策略、实体关系图模块和分类预测模块.其中，文本编码嵌入机制采用了BiLSTM^［6］，GloVe^［18］和BERT^［19］三种文本编码嵌入方式.BiLSTM在捕捉局部上下文信息方面效果较好；GloVe生成的词向量利用了全局语料库中的共现信息，对于单个词的语义表示有一定优势；BERT通过双向文本建模捕捉丰富的上下文信息，对于理解复杂实体关系至关重要.BERT的预训练模型能有效编码整个文档上下文，包括长文本中的实体语义关系.相较于BiLSTM和GloVe，采用BERT作为词嵌入模型具有显著优势.混合提及级图策略主要用于不同提及级节点之间的信息交互模拟计算，实体关系图模块对整个文档中的实体关系进行交叉计算.最后，通过实体关系分类预测模块，该模型可以从文档中抽取实体和关系.BoBGSAL⁃Net的完整结构如图1所示. ...

A GAN?BERT based approach for bengali text classification with a few labeled examples∥ Proceedings of the 19^th International Symposium on Distributed Computing and Artificial Intelligence

1

2022

... BoBGSAL⁃Net是一种基于双图特征的图聚合和推理网络^［15-17］，利用异构提及级图来建模文档中不同提及级节点之间的交互，并捕获文档感知功能，从而更好地处理文档级的实体关系提取任务.BoBGSAL⁃Net采用实体级图，并融合路径推理机制来更明确地推断关系.该模型由四个部件组成，包括文本编码嵌入机制、混合提及级图策略、实体关系图模块和分类预测模块.其中，文本编码嵌入机制采用了BiLSTM^［6］，GloVe^［18］和BERT^［19］三种文本编码嵌入方式.BiLSTM在捕捉局部上下文信息方面效果较好；GloVe生成的词向量利用了全局语料库中的共现信息，对于单个词的语义表示有一定优势；BERT通过双向文本建模捕捉丰富的上下文信息，对于理解复杂实体关系至关重要.BERT的预训练模型能有效编码整个文档上下文，包括长文本中的实体语义关系.相较于BiLSTM和GloVe，采用BERT作为词嵌入模型具有显著优势.混合提及级图策略主要用于不同提及级节点之间的信息交互模拟计算，实体关系图模块对整个文档中的实体关系进行交叉计算.最后，通过实体关系分类预测模块，该模型可以从文档中抽取实体和关系.BoBGSAL⁃Net的完整结构如图1所示. ...

A review on the attention mechanism of deep learning

1

2021

... 以上只考虑两次跳转情况的路径，上述公式很容易扩展到多次跳转路径的情况.同时，引入注意力机制^［20］，使用实体对

(e_{h}, e_{t})

作为query来融合

e_{h}

和

e_{t}

之间的不同路径信息.融合公式的表述如式（9）~（11）所示： ...

The anatomy of a context?aware application

3

2002

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

Learning to fingerprint the latent structure in question articulation∥2018 17^th IEEE International Conference on Machine Learning and Applications (ICMLA).

3

2018

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

Graph attention networks

3

2017

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

Skew?rank of an oriented graph with edge?disjoint cycles

3

2016

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

Improve relation extraction with dual attention?guided graph convolutional networks

3

2021

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

Double graph based reasoning for document?level relation extraction

3

2020

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

Coarse?to?fine entity representations for document?level relation extraction

3

2020

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

Entity structure within and throughout：Modeling mention dependencies for document?level relation extraction ∥ Proceedings of the 35th AAAI Conference on Artificial Intelligence

3

2021

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

Document?level relation extraction with sentences importance estimation and focusing

3

2022

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the DocRED dataset

Table 3

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	54.33%	53.75%	55.84%	54.97%	54.14%	55.08%
CNN^[12]	41.58%	36.85%	43.45%	39.39%	40.33%	42.26%
LSTM^[5]	48.44%	46.62%	50.68%	49.48%	47.71%	50.07%
BiLSTM^[6]	48.87%	47.61%	50.94%	50.26%	48.78%	51.06%
Context⁃Aware^[21]	48.94%	47.22%	51.09%	50.17%	48.40%	50.70%
HIN⁃GloVe^[7]	51.06%	—	52.95%	—	51.15%	53.30%
CFER⁃GloVe^[27]	54.29%	—	55.31%	—	53.70%	54.06%
SSAN⁃BERT⁃base^[28]	54.03%	—	54.95%	—	53.44%	53.16%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	54.79%

实验2：BoBGSAL⁃Net模型在AlSiaRED数据集上的命名实体识别对比实验. ...

... Experimental results of named entity recognition by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 4

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net	53.66%	53.19%	55.39%	55.23%	52.55%	54.83%
CNN^[12]	39.53%	31.47%	40.15%	32.44%	38.73%	39.20%
LSTM^[5]	41.34%	40.43%	43.03%	41.09%	41.26%	42.97%
BiLSTM^[6]	44.08%	43.65%	46.57%	45.13%	43.24%	45.16%
Context⁃Aware^[21]	46.09%	45.36%	48.85%	47.33%	46.13%	48.17%
HIN⁃GloVe^[7]	48.38%	—	50.35%	—	48.24%	50.18%
CFER⁃GloVe^[27]	53.34%	—	54.27%	—	52.45%	53.60%
SSAN⁃BERT⁃base^[28]	53.45%	—	53.25%	—	52.34%	53.27%
GAIN+SIEF^[29]	53.82%	—	54.24%	—	53.87%	53.29%

由表可知，BoBGSAL⁃Net模型在AlSiaRED数据集上的表现优于基准模型，但和其在Doc⁃RED数据集上的表现相比，性能有所下降.这可能是因为作者实验室构建的数据集包含更多的实体类型且文本长度较长，BoBGSAL⁃Net模型训练和推理的时间开销较大，导致性能指标的下降. ...

Reasoning with latent structure refinement for document?level relation extraction

3

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

Document?level relation extraction with context guided mention integration and inter?pair reasoning

3

2022

... 实验使用的基准模型主要完成实体识别和关系抽取两个任务.对于实体识别任务，选用多种经典模型进行对比，包括LSTM^［5］，BiLSTM^［6］，HIN⁃GloVe^［7］，CNN^［12］，Context⁃Aware^［21］，CFER⁃GloVe^［27］，SSAN⁃BERT⁃base^［28］和GAIN+SIEF^［29］.这些模型在文本分类和实体关系抽取任务中表现出色，已被广泛应用于自然语言处理领域.对于关系抽取任务，选择HIN⁃BERT⁃base^［7］，GCNN^［8］，LSR⁃GloVe^［22］，GAT^［23］，EOG^［24］，AGGCN^［25］，GAIN⁃GloVe^［26］，LSR+BERT⁃base^［30］和CGM2IR⁃RoBERTa^［31］作为基准模型.其中，LSR+BERT⁃base模型在文档级实体关系抽取任务中具有较高的影响力，已成为该领域的重要研究方向. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the DocRED dataset

Table 5

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
GAT^[23]	45.17%	—	51.44%	—	47.36%	49.15%
GCNN^[8]	46.22%	—	51.52%	—	49.59%	51.62%
EOG^[24]	45.94%	—	52.15%	—	49.48%	51.82%
AGGCN^[25]	46.29%	—	52.47%	—	48.89%	51.45%
LSR⁃GloVe^[22]	48.82%	—	55.17%	—	52.15%	54.18%
GAIN⁃GloVe^[26]	53.05%	52.57%	55.29%	55.44%	52.66%	55.08%
HIN⁃BERT⁃base^[7]	54.29%	—	55.43%	—	53.70%	55.60%
LSR+BERT⁃base^[30]	58.93%	—	60.89%	—	57.71%	59.94%
CGM2IR⁃RoBERTa^[31]	62.03%	—	63.95%	—	61.96%	62.89%
BoBGSAL⁃Net	54.32%	53.47%	55.20%	54.43%	53.62%	54.57%
BoBGSAL⁃Net+GloVe	56.15%	54.39%	57.33%	57.63%	54.35%	56.97%
BoBGSAL⁃Net+BiLSTM	60.62%	58.27%	61.45%	59.72%	58.47%	60.54%
BoBGSAL⁃Net+BERT	65.20%	64.47%	64.38%	64.58%	62.43%	65.32%

此外，在引入词嵌入模型后，性能与BoBGSAL⁃Net相比，有显著提升，尤其在BoBGSAL⁃Net与BERT相结合的BoBGSAL⁃Net+BERT模型中，性能表现最为出色.可能因为BoBGSAL⁃Net+BERT模型将图结构与BERT的预训练语义表示相结合，从而更加充分地整合不同层次的信息.通过ERG模块的路径推理机制，该模型能够更准确地学习实体关系的多个关系路径，增强对复杂关系的抽取能力，使得该模型在关系抽取任务中表现出色. ...

... Experimental results of relation extraction by BoBGSAL⁃Net and other models on the AlSiaRED dataset

Table 6

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
GAT^[23]	46.33%	—	48.20%	—	45.54%	47.39%
GCNN^[8]	48.46%	—	50.36%	—	47.85%	49.83%
EOG^[24]	45.57%	—	46.91%	—	45.31%	46.32%
AGGCN^[25]	49.19%	—	50.95%	—	48.89%	49.63%
LSR⁃GloVe^[22]	51.35%	—	53.44%	—	51.27%	53.29%
GAIN⁃GloVe^[26]	57.88%	56.47%	59.29%	57.89%	57.57%	59.14%
HIN⁃BERT⁃base^[7]	53.62%	—	54.44%	—	52.56%	54.72%
LSR+BERT⁃base^[30]	59.23%	—	61.47%	—	59.62%	60.20%
CGM2IR⁃RoBERTa^[31]	63.53%	—	62.74%	—	63.38%	63.26%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

实验5：BoBGSAL⁃Net模型在DocRED数据集上的实体抽取对比实验. ...

DocRED：A large?scale document?level relation extraction dataset∥Proceedings of the 57^th Annual Meeting of the Association for Computational Linguistics

1

2019

... Experimental results of entity extraction by BoBGSAL⁃Net and other model on the DocRED dataset

Table 7

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
DocRED⁃CNN^[32]	40.27%	32.75%	43.35%	34.17%	36.44%	42.33%
MRN+BERT^[33]	59.47%	—	60.20%	—	59.52%	61.74%
DRN⁃GloVe^[34]	54.61%	—	56.49%	—	54.35%	56.33%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

5 结论

本文提出一种文档级实体关系抽取方法，即基于双图结构的聚合逻辑网络BoBGSAL⁃Net.该方法首先构建一个MMLG模块，模拟整个文档中不同提及之间的复杂信息交互，提高模型对文档级实体关系的感知能力.其次，构建了ERG模块，该模块融合路径推理机制，主要针对实体间的多个关系路径进行推理学习，更准确地识别提及级节点实体及关系. ...

MRN：A locally and globally mention?based reasoning network for document?level relation extraction∥Proceedings of the Findings of the Association for Computational Linguistics

1

2021

... Experimental results of entity extraction by BoBGSAL⁃Net and other model on the DocRED dataset

Table 7

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
DocRED⁃CNN^[32]	40.27%	32.75%	43.35%	34.17%	36.44%	42.33%
MRN+BERT^[33]	59.47%	—	60.20%	—	59.52%	61.74%
DRN⁃GloVe^[34]	54.61%	—	56.49%	—	54.35%	56.33%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

5 结论

本文提出一种文档级实体关系抽取方法，即基于双图结构的聚合逻辑网络BoBGSAL⁃Net.该方法首先构建一个MMLG模块，模拟整个文档中不同提及之间的复杂信息交互，提高模型对文档级实体关系的感知能力.其次，构建了ERG模块，该模块融合路径推理机制，主要针对实体间的多个关系路径进行推理学习，更准确地识别提及级节点实体及关系. ...

Discriminative reasoning for document?level relation extraction ∥Proceedings of the Findings of the Association for Computational Linguistics

1

... Experimental results of entity extraction by BoBGSAL⁃Net and other model on the DocRED dataset

Table 7

模型	验证集				测试
模型	Ign F1	Ign AUC	F1	AUC	Ign F1	F1
BoBGSAL⁃Net+BERT	66.14%	65.59%	65.40%	65.32%	64.73%	66.04%
DocRED⁃CNN^[32]	40.27%	32.75%	43.35%	34.17%	36.44%	42.33%
MRN+BERT^[33]	59.47%	—	60.20%	—	59.52%	61.74%
DRN⁃GloVe^[34]	54.61%	—	56.49%	—	54.35%	56.33%
BoBGSAL⁃Net	55.43%	54.64%	56.51%	55.78%	54.84%	55.73%
BoBGSAL⁃Net+GloVe	60.45%	56.47%	59.29%	57.89%	57.57%	59.14%
BoBGSAL⁃Net+BiLSTM	61.58%	59.73%	62.50%	60.48%	59.76%	61.48%

5 结论

本文提出一种文档级实体关系抽取方法，即基于双图结构的聚合逻辑网络BoBGSAL⁃Net.该方法首先构建一个MMLG模块，模拟整个文档中不同提及之间的复杂信息交互，提高模型对文档级实体关系的感知能力.其次，构建了ERG模块，该模块融合路径推理机制，主要针对实体间的多个关系路径进行推理学习，更准确地识别提及级节点实体及关系. ...

操作系统	Ubuntu 20.04 LST
CPU型号	Inter Xeon Gold 5120 (56) CPU @2.2GHZ
CPU存储	256 G
GPU型号	NVIDIA Tesla V100
GPU存储	16 G

安装包	版本
CUDA	10.2
Python	3.7.5
Matplotlib	3.3.5
NumPy	1.19.4
Torch	1.6.0
Transformers	3.1.0
Scikit⁃learn	0.23.2