南京大学学报(自然科学版) ›› 2017, Vol. 53 ›› Issue (6): 1004.
巩 皓1,杜军平1*,赖金财1,梁美玉1,王 巍2,罗 盎2
Gong Hao1,Du Junping1*,Lai Jincai1,Liang Meiyu1,Wang Wei2,Luo Ang2
摘要: 传统的基于关键词匹配的查询方法因查询词短少,微博博文短小,容易引起歧义性,对查询效率有较大影响.提出一种基于本体和局部查询反馈的微博查询扩展算法,首先结合安全领域文档构建安全领域本体知识库,然后利用本体提供的语义知识对初始查询词进行扩展,再结合局部查询反馈对候选扩展词集进行筛选,最后通过二次查询和迭代操作得到最终查询结果.实验结果表明,基于本体和局部查询反馈的微博查询扩展算法比基于关键词的查询扩展算法、基于本体的查询扩展算法和基于“伪相关反馈”的查询扩展算法有更好的查全率和查准率.
[1] 王书鑫,卫冰洁,鲁 骁等.面向微博搜索的时间敏感的排序学习方法.中文信息学报,2015,29(4):175-182.(Wang S X,Wei B J,Lu X,et al.Temporal sensitive learning to rank method for microblog search.Journal of Chinese Information Processing,2015,29(4):175-182.) [10] 王红霞.基于本体的语义查询扩展应用研究.科技通报,2016,32(1):118-122.(Wang H X.Application research of semantic query expansion based on ontology.Bulletin of Science and Technology,2016,32(1):118-122.) |
[1] | 韩彦昭1,乔亚男1*,范亚平1,李孟超2,万迪昉3. 基于条件随机场模型和文本纠错的微博新词词性识别研究[J]. 南京大学学报(自然科学版), 2016, 52(2): 353-. |
[2] | 吴秦,梁久祯,白玉昭. 一种基于语义词典的局部查询扩展方法[J]. 南京大学学报(自然科学版), 2014, 50(4): 526-. |
|