南京大学学报(自然科学版) ›› 2016, Vol. 52 ›› Issue (2): 335.
蒋晓娟,张文生*,杨 阳
Jiang Xiaojuan,Zhang Wensheng*,Yang Yang
摘要: Replicated Softmax model,是用于文本数据挖掘的无向概率主题模型,为描述语料库的主题分布提供了一个功能强大的框架.然而,作为一个无向的概率图模型,由于归一化常数的存在,该模型的参数学习是十分困难的.针对这一问题,利用退火过渡马尔科夫蒙特卡洛采样方法,借助近似极大似然学习的思想,实现了模型的参数学习.该算法采用基于退火过渡的马尔科夫蒙特卡洛采样方法,高效地探索存在多个孤立的模态的概率分布,提高对概率分布的逼近程度,从而提高了参数学习的效率和精度.实验结果证明了算法在训练时间、泛化能力和文档检索等三个方面的优势.
[1] Blei D M.Probabilistic topic models.Communications of the ACM,2012,55(4):77-84.
|
No related articles found! |
|