南京大学学报(自然科学版) ›› 2016, Vol. 52 ›› Issue (2): 313.
李晓宇1,周 铭2,袁晓彤1*,罗 琦1,刘青山1*
Li Xiaoyu1,Zhou Ming2,Yuan Xiaotong1*,Luo Qi1,Liu Qingshan1*
摘要: 在许多机器学习问题中,往往需要研究高维数据中各个特征之间的统计相关性.稀疏高斯图模型作为解决这一问题的有效方法之一,广泛应用于数据挖掘、生物信息、金融分析等应用问题中.由于模型参数量是数据维度的平方量级,基于高维数据的稀疏高斯图模型的参数估计一直是统计机器学习研究中的挑战性问题之一.提出了一种新颖的基于坐标下降优化的稀疏高斯图模型并行估计算法,其核心思想是根据高斯图模型结构估计等价于每个变量的稀疏近邻选择这一基本结论,采用坐标下降来求解每个近邻选择子问题.通过将样本矩阵进行分布式存储,在MPI(MessagePassing Interface)框架下实现了这些子问题的并行求解.实验结果表明,该算法具有良好的并行运算性能,在保证结构估计精度的同时,能够大幅度提升运算速度.
No related articles found! |
|