最小二乘回归(Least Square Regression,LSR)算法是一种流行的子空间聚类方法,在处理计算机视觉和机器学习的相关问题中的应用十分普遍.然而,当数据含有噪声时,其求得的亲和矩阵不是块对角化的,还存在一定的噪声,这使亲和矩阵不够鲁棒可靠,因而降低了算法的聚类性能.为了解决以上不足,提出一种双重结构的最小二乘回归子空间聚类算法(Double Structure Least Squares Regression Subspace Clustering,DSLSR).首先对原始数据实施LSR算法,由于其生成的亲和矩阵往往不是块对角矩阵且含有噪声,需要对求得的亲和矩阵再次实施LSR算法来去除亲和矩阵中的噪声,使亲和矩阵更干净可靠,从而提升算法的聚类性能.最后,把两次LSR过程纳入一个统一的算法框架,设计一个统一的目标函数.此外,还采取了增广拉格朗日乘子方法对目标函数进行优化求解.在一些数据集上的实验证实,DSLSR算法比现有算法的性能更卓越.
关键词:子空间聚类
;
目标函数
;
最小二乘回归
;
亲和矩阵
Abstract
The Least Square Regression (LSR) algorithm is a popular subspace clustering approach,which is widely used in dealing with problems related to computer vision and machine learning. However,when the data is noisy,the affinity matrix is not block diagonal with some noise,which makes the affinity matrix not robust enough. To resolve the above issues,this paper researches a double structure least squares regression subspace clustering (DSLSR). In DSLSR,the LSR algorithm is first conducted on the original data. Because the original data contains noise,the generated affinity matrix is often not block diagonal matrix and contains noise. Therefore,it is necessary to implement LSR again on the generated affinity matrix to remove the noise and make the affinity matrix cleaner and more reliable,which can improve the clustering performance of the algorithm. Finally,the two LSR processes are incorporated into a unified algorithm framework,and a unified objective function is designed. In addition,a useful approach based on augmented Lagrange multiplier is employed to optimize the objective function. Experiments on some datasets exhibit that the DSLSR acquires better property than existing algorithms.
Keywords:subspace clustering
;
objective function
;
least squares regression
;
affinity matrix
李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能.
然而,上述方法中,只有在数据不含噪声时,其求得的亲和矩阵才是块对角化的,而现实中的数据往往含有噪声,使其亲和矩阵的块对角特性不明显,并且存在噪声.为此,本文提出具有双重结构的最小二乘回归子空间聚类(Double Structure Least Squares Subspace Clustering,DSLSR)算法,其双重结构在于:首先,对原始数据实施LSR算法;然后,对LSR算法求得的亲和矩阵再次实施LSR算法来去除亲和矩阵中的噪声,使亲和矩阵更干净可靠;最后,把两次LSR过程纳入一个统一的算法框架,设计一个统一的目标函数.此外,本文还利用增广拉格朗日乘子法(Augmented Lagrangian Multiplier,ALM)[24-25]来优化求解DSLSR,并通过在数据集上的实验验证了DSLSR算法性能的卓越性和优异性.
Clustering and projected clustering with adaptive neighbors
∥Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York,NY,USA:Association for Computing Machinery,2014:977-986.
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...
Subspace clustering method based on TL1 norm constraints
1
2017
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...
基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法
1
2015
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...
Robust low rank subspace clustering based on local graph laplace constraint
1
2015
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...
Graph regularized sparse coding for image representation
1
2011
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...
Transfer sparse coding for robust image representation
1
2013
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...
Clustering and projected clustering with adaptive neighbors
2
2014
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...
... CAN[22]:采用自适应分配的最优邻居来学习亲和矩阵. ...
Scaled simplex representation for subspace clustering
2
2021
... 李海洋和王恒远[18]提出一种基于TL1范数的聚类方法(Subspace Clustering Method Based on TL1 Norm Constraints),使用TL1范数使系数矩阵更加稀疏并解决了噪声的鲁棒性问题.李波等[19]提出基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法(Robust Low Rank Subspace Clustering Based on Local Graph Laplace Constraint),通过图像局部相似性的约束,使矩阵成分块对角,并加强了亲和矩阵的稀疏性.Zheng et al[20]提出图正则化稀疏编码方法(Graph Regularized Sparse Coding for Image Representation,GraphSC),很好地体现了数据的几何构造.依据GraphSC的研究,Long et al[21]提出转移稀疏编码算法(Transfer Sparse Coding for Robust Image Representation,TSC),该算法习得的稀疏亲和矩阵具有鲁棒性,可以提高交叉分布图像的分类准确性.Nie et al[22]提出自适应邻域聚类与投影聚类(Clustering and Projected Clustering with Adaptive Neighbors,CAN),首先通过自动分配的最优邻居来学习样本的亲和矩阵,然后采用秩约束来规范亲和矩阵的拉普拉斯矩阵,使数据中的每一个连通分量都能很好地对应一个类.Xu et al[23]提出缩放单纯型表示(Scaled Simplex Representation,SSR),通过非负约束亲和矩阵并将非负的亲和矩阵的每个列向量和约束为,不仅保证数据的相关结构,而且可以通过调整s来寻找聚类的最佳性能. ...