南京大学学报(自然科学版) ›› 2019, Vol. 55 ›› Issue (6): 10101019.doi: 10.13232/j.cnki.jnju.2019.06.013
摘要:
近年来,实体挖掘技术已经成为文本信息处理领域的研究热点,有广泛的应用前景,但目前实体挖掘技术通常缺少句法层面的分析,很难从语句中准确抽取关键性词汇,并且抽取实体的过程容易忽略主客体的动作关联.针对这一问题,建立一个适用于汉语句法分析的论元关系模型.使用多值递归函数识别句型结构并划分句法功能语块,根据句型结构抽取动作的施体和受体,建立论元关系模型.多值递归函数的分析窗口涵盖整个语句,函数递归地探索整个解空间,获取全局最优解.此外,层次分解机制可以识别处理嵌套句和歧义句,能够抽取出更有价值的句法成分,对长语句和复杂语句有更好的适应能力.
中图分类号:
1 | Liu B Y , Wang C R , Wang Y R ,et al . Microblog topic mining based on FR?DATM. Chinese Journal of Electronics,2018,27(2):334-341. |
2 | Shen H Y , Liu G X , Wang H Y ,et al . Social Q&A:an online social network based question and answer system. IEEE Transactions on Big Data,2017,3(1):91-106. |
3 | Ye H , Chao W H , Luo Z C ,et al . Jointly extracting relations with class ties via effective deep ranking. 2017,arXiv:1612.07602. |
4 | 赵志滨,石玉鑫,李斌阳 . 基于句法分析与词向量的领域新词发现方法. 计算机科学,2019,46(6):29-34. |
Zhao Z B , Shi Y X , Li B Y . . Newly?emerging domain word detection method based on syntactic analysis and term vector. Computer Science,2019,46(6):29-34. | |
5 | 刘倩,伍大勇,刘悦 等 . 结合全局特征的命名实体属性值抽取. 计算机研究与发展,2016,53(4):941-948. |
Liu Q , Wu D Y , Liu Y ,et al . Extracting attribute values for named entities based on global feature. Journal of Computer Research and Development,2016,53(4):941-948. | |
6 | Sun C Z , Wu Y B , Lan M ,et al . Extracting entities and relations with joint minimum risk training∥Proceedings of EMNLP 2018. Brussels,Belgium:ACL,2018:2256-2265. |
7 | Bekoulis G , Deleu J , Demeester T ,et al . Adversarial training for multi?context joint entity and relation extraction. arXiv:1808.06876,2018. |
8 | Feng W F , Zhuo H H , Kambhampati S . Extracting action sequences from texts based on deep reinforcement learning. 2018,arXiv:1803.02632. |
9 | Loli E V , Pe?a J T , Condori R L . An LDA?lexical syntactical approach for events and features extraction of earthquakes from Spanish and English tweets∥Proceedings of the 4th Annual International Symposium on Information Management and Big Data (SIMBig 2017). Lima,Peru:CEUR?WS,2017:190-197. |
10 | 杨丹,申德荣,聂铁铮 等 . 异构信息空间中实体关联关系挖掘算法CFRQ4A. 计算机研究与发展,2014,51(4):895-904. |
Yang D , Shen D R , Nie T Z ,et al . Entity association mining algorithm CFRQ4A in heterogeneous information spaces. Journal of Computer Research and Development,2014,51(4):895-904. | |
11 | 朱德熙 . 语法答问. 北京:商务印书馆,1985,1-5. |
12 | Liu W F , Liu P Y , Yang Y Z ,et al . An attention?based syntax?tree and tree?LSTM model for sentence summarization. International Journal of Performability Engineering,2017,13(5):775-782. |
13 | 谷波,王瑞波,李济洪 等 . 基于RNN的中文二分结构句法分析. 中文信息学报,2019,33(1):35-45. |
Gu B , Wang R B , Li J H ,et al . RNN based Chinese parsing for binary tree structure. Journal of Chinese Information Processing,2019,33(1):35-45. | |
14 | Jiang C J , Peng H , Ma Q L ,et al . Automatic summarization for Chinese text based on combined words recognition and paragraph clustering∥2010 3rd International Symposium on Intelligent Information Technology and Security Informatics.Jinggangshan,China:IEEE,2010:591-594. |
15 | 朱德熙 . 语法讲义. 北京:商务印书馆,1982,7-15. |
16 | Huang C T J , Li Y H A , Li Y F . The syntax of Chinese. Cambridge,UK:Cambridge University,2009,23-31. |
17 | 尹德春 . 基于语言实体关系模型的汉语句法分析. 博士学位论文. 北京:北京理工大学,2014. |
Yin D C . Chinese syntactic parsing based on linguistic entity relationship model. Ph.D.DissertationBeijing:Beijing Institute of Technology,2014. | |
18 | 赵元任 . 汉语口语语法. 吕叔湘译. 北京:商务印书馆,1979,31-37. |
19 | Qiu L K , Zhang Y . ZORE:a syntax?based system for Chinese open relation extraction∥The 2014 Conference on Empirical Methods in Natural Language Processing.Doha,Qatar:Association for Computational Linguistics,2014:1870-1880. |
[1] | 朱伟,张帅,辛晓燕,李文飞,王骏,张建,王炜. 结合区域检测和注意力机制的胸片自动定位与识别[J]. 南京大学学报(自然科学版), 2020, 56(4): 591-600. |
[2] | 李昭阳,龚安民,伏云发. 基于EEG脑网络下肢动作视觉想象识别研究[J]. 南京大学学报(自然科学版), 2020, 56(4): 570-580. |
[3] | 郑建兴,李沁文,王素格,李德玉. 基于翻译模型的异质重边信息网络链路预测研究[J]. 南京大学学报(自然科学版), 2020, 56(4): 541-548. |
[4] | 黄雨婷,徐媛媛,张恒汝,闵帆. 融合标签结构依赖性的标签分布学习[J]. 南京大学学报(自然科学版), 2020, 56(4): 524-532. |
[5] | 任睿,张超,庞继芳. 有限理性下多粒度q⁃RO模糊粗糙集的最优粒度选择及其在并购对象选择中的应用[J]. 南京大学学报(自然科学版), 2020, 56(4): 452-460. |
[6] | 陈俊芬,赵佳成,韩洁,翟俊海. 基于深度特征表示的Softmax聚类算法[J]. 南京大学学报(自然科学版), 2020, 56(4): 533-540. |
[7] | 王宝丽,姚一豫. 信息表中约简补集对及其一般定义[J]. 南京大学学报(自然科学版), 2020, 56(4): 461-468. |
[8] | 陈石,张兴敢. 基于小波包能量熵和随机森林的级联H桥多电平逆变器故障诊断[J]. 南京大学学报(自然科学版), 2020, 56(2): 284-289. |
[9] | 周昊,沈庆宏. 基于改进音形码的中文敏感词检测算法[J]. 南京大学学报(自然科学版), 2020, 56(2): 270-277. |
[10] | 罗春春,郝晓燕. 基于双重注意力模型的微博情感倾向性分析[J]. 南京大学学报(自然科学版), 2020, 56(2): 236-243. |
[11] | 王露,王士同. 改进模糊聚类在医疗卫生数据的Takagi⁃Sugeno模糊模型[J]. 南京大学学报(自然科学版), 2020, 56(2): 186-196. |
[12] | 陈睿, 伏云发. 基于EEG握力变化及想象单次识别研究[J]. 南京大学学报(自然科学版), 2020, 56(2): 159-166. |
[13] | 杨红鑫,杨绪兵,张福全,业巧林. 半监督平面聚类算法设计[J]. 南京大学学报(自然科学版), 2020, 56(1): 9-18. |
[14] | 刘胜久,李天瑞,珠杰,刘佳. 带权图的多重分形研究[J]. 南京大学学报(自然科学版), 2020, 56(1): 85-97. |
[15] | 张银芳,于洪,王国胤,谢永芳. 一种用于数据流自适应分类的主动学习方法[J]. 南京大学学报(自然科学版), 2020, 56(1): 67-73. |
|