Granulation is an inherent property of human cognition and the same phenomenon has different interpretations at different granularities. Flow graph is treated as a form of knowledge representation,and is known for its intuitive formation,straightforward computation and parallel processing. Taking the attribute⁃value information system as the research object,this paper studies the specific changes of the flow graph at different granularities which are induced by adding the new attribute(s). The validity of the flow graph at a new granularity depends on the change of the equivalence classes involved and the establishment of the Markov property. Specifically,if only parts of elements of the equivalence class at the new granularity maintain the Markov property,the change in granularity will then cause the graphical structure to be transformed from a flow graph at one granularity to a basic component for a complete flow graph at this new granularity. If the Markov property does not hold at the new granularity,the flow graph will be transformed into a structure that is unrelated to flow graph at this new granularity. If every element of the equivalence class at the new granularity satisfies the Markov property,the flow graph at one granularity will then remain unchanged at this new granularity. The illustrations of an information system on patients suffering from flu at different granularities further validate the proposed theoretical results. These conclusions can help to understand and characterize the relationship between knowledge and granularity,and lay the foundation for simulating human learning and thinking.
Keywords:flow graph
;
Markov property
;
equivalence class
;
granularity
;
rough set
Yao Ning, Miao Duoqian, Zhang Yuanjian, Kang Xiangping. The impact of changing attributes on flow graph. Journal of Nanjing University(Natural Science)[J], 2019, 55(4): 519-528 doi:10.13232/j.cnki.jnju.2019.04.001
粗糙集理论由Pawlak[1]依据Frege[2](德国哲学家、逻辑学家、数学家、现代逻辑之父)的“模糊性关联于边界区域,即存在不能唯一被归类于一个集合或者其补集的对象”的观点的具体实现而提出,开始于形式化知识表示系统或信息系统或属性⁃值数据表格.该理论认为数据自身的不可区分性导致数据具有粒状结构,进而可被用于挖掘数据中蕴涵的信息[3].图表示的核心也是将数据或事实归类于结构,通过这些结构,所找寻的信息可与任务中涉及的变量关联起来,沿着图中展示的路径,人类的许多推理模式可得到阐述.Pawlak[4]还提出了粗糙集理论中的流图表示,将条件粒(条件属性诱导的数据的粒状结构)和决策粒(决策属性诱导的数据的粒状结构)之间的关系描述为流网络(Flow networks),流图中的信息流由确定因子和覆盖因子(二者皆为条件概率的粗糙集术语描述的对应物)决定,并受全概率公式和Bayes定理支配.这类流图关注于网络中的流分布建模,不同于Ford and Fulkerson[5]提出的流图(聚焦于图中的最优流分析).流图的这种形式上的直观性、计算上的简单便捷性和并行处理特性,使得基于流图的推理相比于直接从数据做推理更直观、更具可解释性.流图的研究成果主要集中于流图的构建(比如基于等价类[6]或者基于决策树[7])和流图中系数的确定(比如利用因式分解逐个消除变量[8]或者基于矩阵的表示形式[9]以多项式时间计算流图中的系数),近年来在应用方面粗糙集流图在多目标优化问题近似求解中展示了重要优势[10].
Yao and Miao[6]将流图解释为一类特殊的概率图模型,即具有Markov性质的有向非循环图(Directed acyclic graphs),从而基于属性诱导的等价类直接由数据构建流图.该图形结构描述变量间的一种层次架构,不同的属性值对应不同层,每层中节点间满足Markov性质,整个架构中两终端节点之间的条件概率满足全概率公式.姚宁等[11]还探析了因果信息对于属性变化而产生的迁移问题.本文是这些工作的延续,研究信息系统中属性的变化对于已抽取的流图的影响,或者流图在不同信息系统中的可迁移性.这里属性的变化侧重于属性个数的增加或删减,关于属性值层面的粒度变化的最新研究成果可参考文献[12].考虑到属性的变化与系统所能刻画的信息的粒度,即信息粒中所包含的成员的数量直接相关,文中给出的结论可窥见粒度变化与流图变化之间的关联,为理解和刻画人类认知中的粒化属性提供新的视角.
Learning network flow based on rough set flow graphs and ACO clustering in distributed cognitive environments∥International Workshop on Software Engineering for Cognitive Services
... 粗糙集理论由Pawlak[1]依据Frege[2](德国哲学家、逻辑学家、数学家、现代逻辑之父)的“模糊性关联于边界区域,即存在不能唯一被归类于一个集合或者其补集的对象”的观点的具体实现而提出,开始于形式化知识表示系统或信息系统或属性⁃值数据表格.该理论认为数据自身的不可区分性导致数据具有粒状结构,进而可被用于挖掘数据中蕴涵的信息[3].图表示的核心也是将数据或事实归类于结构,通过这些结构,所找寻的信息可与任务中涉及的变量关联起来,沿着图中展示的路径,人类的许多推理模式可得到阐述.Pawlak[4]还提出了粗糙集理论中的流图表示,将条件粒(条件属性诱导的数据的粒状结构)和决策粒(决策属性诱导的数据的粒状结构)之间的关系描述为流网络(Flow networks),流图中的信息流由确定因子和覆盖因子(二者皆为条件概率的粗糙集术语描述的对应物)决定,并受全概率公式和Bayes定理支配.这类流图关注于网络中的流分布建模,不同于Ford and Fulkerson[5]提出的流图(聚焦于图中的最优流分析).流图的这种形式上的直观性、计算上的简单便捷性和并行处理特性,使得基于流图的推理相比于直接从数据做推理更直观、更具可解释性.流图的研究成果主要集中于流图的构建(比如基于等价类[6]或者基于决策树[7])和流图中系数的确定(比如利用因式分解逐个消除变量[8]或者基于矩阵的表示形式[9]以多项式时间计算流图中的系数),近年来在应用方面粗糙集流图在多目标优化问题近似求解中展示了重要优势[10]. ...
Identification of structures and causation in flow graphs
5
2019
... 粗糙集理论由Pawlak[1]依据Frege[2](德国哲学家、逻辑学家、数学家、现代逻辑之父)的“模糊性关联于边界区域,即存在不能唯一被归类于一个集合或者其补集的对象”的观点的具体实现而提出,开始于形式化知识表示系统或信息系统或属性⁃值数据表格.该理论认为数据自身的不可区分性导致数据具有粒状结构,进而可被用于挖掘数据中蕴涵的信息[3].图表示的核心也是将数据或事实归类于结构,通过这些结构,所找寻的信息可与任务中涉及的变量关联起来,沿着图中展示的路径,人类的许多推理模式可得到阐述.Pawlak[4]还提出了粗糙集理论中的流图表示,将条件粒(条件属性诱导的数据的粒状结构)和决策粒(决策属性诱导的数据的粒状结构)之间的关系描述为流网络(Flow networks),流图中的信息流由确定因子和覆盖因子(二者皆为条件概率的粗糙集术语描述的对应物)决定,并受全概率公式和Bayes定理支配.这类流图关注于网络中的流分布建模,不同于Ford and Fulkerson[5]提出的流图(聚焦于图中的最优流分析).流图的这种形式上的直观性、计算上的简单便捷性和并行处理特性,使得基于流图的推理相比于直接从数据做推理更直观、更具可解释性.流图的研究成果主要集中于流图的构建(比如基于等价类[6]或者基于决策树[7])和流图中系数的确定(比如利用因式分解逐个消除变量[8]或者基于矩阵的表示形式[9]以多项式时间计算流图中的系数),近年来在应用方面粗糙集流图在多目标优化问题近似求解中展示了重要优势[10]. ...
... Yao and Miao[6]将流图解释为一类特殊的概率图模型,即具有Markov性质的有向非循环图(Directed acyclic graphs),从而基于属性诱导的等价类直接由数据构建流图.该图形结构描述变量间的一种层次架构,不同的属性值对应不同层,每层中节点间满足Markov性质,整个架构中两终端节点之间的条件概率满足全概率公式.姚宁等[11]还探析了因果信息对于属性变化而产生的迁移问题.本文是这些工作的延续,研究信息系统中属性的变化对于已抽取的流图的影响,或者流图在不同信息系统中的可迁移性.这里属性的变化侧重于属性个数的增加或删减,关于属性值层面的粒度变化的最新研究成果可参考文献[12].考虑到属性的变化与系统所能刻画的信息的粒度,即信息粒中所包含的成员的数量直接相关,文中给出的结论可窥见粒度变化与流图变化之间的关联,为理解和刻画人类认知中的粒化属性提供新的视角. ...
An efficient algorithm for inference in rough set flow graphs∥Peters J F, Skowron A
1
2006
... 粗糙集理论由Pawlak[1]依据Frege[2](德国哲学家、逻辑学家、数学家、现代逻辑之父)的“模糊性关联于边界区域,即存在不能唯一被归类于一个集合或者其补集的对象”的观点的具体实现而提出,开始于形式化知识表示系统或信息系统或属性⁃值数据表格.该理论认为数据自身的不可区分性导致数据具有粒状结构,进而可被用于挖掘数据中蕴涵的信息[3].图表示的核心也是将数据或事实归类于结构,通过这些结构,所找寻的信息可与任务中涉及的变量关联起来,沿着图中展示的路径,人类的许多推理模式可得到阐述.Pawlak[4]还提出了粗糙集理论中的流图表示,将条件粒(条件属性诱导的数据的粒状结构)和决策粒(决策属性诱导的数据的粒状结构)之间的关系描述为流网络(Flow networks),流图中的信息流由确定因子和覆盖因子(二者皆为条件概率的粗糙集术语描述的对应物)决定,并受全概率公式和Bayes定理支配.这类流图关注于网络中的流分布建模,不同于Ford and Fulkerson[5]提出的流图(聚焦于图中的最优流分析).流图的这种形式上的直观性、计算上的简单便捷性和并行处理特性,使得基于流图的推理相比于直接从数据做推理更直观、更具可解释性.流图的研究成果主要集中于流图的构建(比如基于等价类[6]或者基于决策树[7])和流图中系数的确定(比如利用因式分解逐个消除变量[8]或者基于矩阵的表示形式[9]以多项式时间计算流图中的系数),近年来在应用方面粗糙集流图在多目标优化问题近似求解中展示了重要优势[10]. ...
Novel matrix forms of rough set flow graphs with applications to data integration
1
2010
... 粗糙集理论由Pawlak[1]依据Frege[2](德国哲学家、逻辑学家、数学家、现代逻辑之父)的“模糊性关联于边界区域,即存在不能唯一被归类于一个集合或者其补集的对象”的观点的具体实现而提出,开始于形式化知识表示系统或信息系统或属性⁃值数据表格.该理论认为数据自身的不可区分性导致数据具有粒状结构,进而可被用于挖掘数据中蕴涵的信息[3].图表示的核心也是将数据或事实归类于结构,通过这些结构,所找寻的信息可与任务中涉及的变量关联起来,沿着图中展示的路径,人类的许多推理模式可得到阐述.Pawlak[4]还提出了粗糙集理论中的流图表示,将条件粒(条件属性诱导的数据的粒状结构)和决策粒(决策属性诱导的数据的粒状结构)之间的关系描述为流网络(Flow networks),流图中的信息流由确定因子和覆盖因子(二者皆为条件概率的粗糙集术语描述的对应物)决定,并受全概率公式和Bayes定理支配.这类流图关注于网络中的流分布建模,不同于Ford and Fulkerson[5]提出的流图(聚焦于图中的最优流分析).流图的这种形式上的直观性、计算上的简单便捷性和并行处理特性,使得基于流图的推理相比于直接从数据做推理更直观、更具可解释性.流图的研究成果主要集中于流图的构建(比如基于等价类[6]或者基于决策树[7])和流图中系数的确定(比如利用因式分解逐个消除变量[8]或者基于矩阵的表示形式[9]以多项式时间计算流图中的系数),近年来在应用方面粗糙集流图在多目标优化问题近似求解中展示了重要优势[10]. ...
Learning network flow based on rough set flow graphs and ACO clustering in distributed cognitive environments∥International Workshop on Software Engineering for Cognitive Services
1
2018
... 粗糙集理论由Pawlak[1]依据Frege[2](德国哲学家、逻辑学家、数学家、现代逻辑之父)的“模糊性关联于边界区域,即存在不能唯一被归类于一个集合或者其补集的对象”的观点的具体实现而提出,开始于形式化知识表示系统或信息系统或属性⁃值数据表格.该理论认为数据自身的不可区分性导致数据具有粒状结构,进而可被用于挖掘数据中蕴涵的信息[3].图表示的核心也是将数据或事实归类于结构,通过这些结构,所找寻的信息可与任务中涉及的变量关联起来,沿着图中展示的路径,人类的许多推理模式可得到阐述.Pawlak[4]还提出了粗糙集理论中的流图表示,将条件粒(条件属性诱导的数据的粒状结构)和决策粒(决策属性诱导的数据的粒状结构)之间的关系描述为流网络(Flow networks),流图中的信息流由确定因子和覆盖因子(二者皆为条件概率的粗糙集术语描述的对应物)决定,并受全概率公式和Bayes定理支配.这类流图关注于网络中的流分布建模,不同于Ford and Fulkerson[5]提出的流图(聚焦于图中的最优流分析).流图的这种形式上的直观性、计算上的简单便捷性和并行处理特性,使得基于流图的推理相比于直接从数据做推理更直观、更具可解释性.流图的研究成果主要集中于流图的构建(比如基于等价类[6]或者基于决策树[7])和流图中系数的确定(比如利用因式分解逐个消除变量[8]或者基于矩阵的表示形式[9]以多项式时间计算流图中的系数),近年来在应用方面粗糙集流图在多目标优化问题近似求解中展示了重要优势[10]. ...
因果信息在不同粒度上的迁移性
1
2019
... Yao and Miao[6]将流图解释为一类特殊的概率图模型,即具有Markov性质的有向非循环图(Directed acyclic graphs),从而基于属性诱导的等价类直接由数据构建流图.该图形结构描述变量间的一种层次架构,不同的属性值对应不同层,每层中节点间满足Markov性质,整个架构中两终端节点之间的条件概率满足全概率公式.姚宁等[11]还探析了因果信息对于属性变化而产生的迁移问题.本文是这些工作的延续,研究信息系统中属性的变化对于已抽取的流图的影响,或者流图在不同信息系统中的可迁移性.这里属性的变化侧重于属性个数的增加或删减,关于属性值层面的粒度变化的最新研究成果可参考文献[12].考虑到属性的变化与系统所能刻画的信息的粒度,即信息粒中所包含的成员的数量直接相关,文中给出的结论可窥见粒度变化与流图变化之间的关联,为理解和刻画人类认知中的粒化属性提供新的视角. ...
因果信息在不同粒度上的迁移性
1
2019
... Yao and Miao[6]将流图解释为一类特殊的概率图模型,即具有Markov性质的有向非循环图(Directed acyclic graphs),从而基于属性诱导的等价类直接由数据构建流图.该图形结构描述变量间的一种层次架构,不同的属性值对应不同层,每层中节点间满足Markov性质,整个架构中两终端节点之间的条件概率满足全概率公式.姚宁等[11]还探析了因果信息对于属性变化而产生的迁移问题.本文是这些工作的延续,研究信息系统中属性的变化对于已抽取的流图的影响,或者流图在不同信息系统中的可迁移性.这里属性的变化侧重于属性个数的增加或删减,关于属性值层面的粒度变化的最新研究成果可参考文献[12].考虑到属性的变化与系统所能刻画的信息的粒度,即信息粒中所包含的成员的数量直接相关,文中给出的结论可窥见粒度变化与流图变化之间的关联,为理解和刻画人类认知中的粒化属性提供新的视角. ...
Multi?granularity feature selection on cost?sensitive data with measurement errors and variable costs
1
2018
... Yao and Miao[6]将流图解释为一类特殊的概率图模型,即具有Markov性质的有向非循环图(Directed acyclic graphs),从而基于属性诱导的等价类直接由数据构建流图.该图形结构描述变量间的一种层次架构,不同的属性值对应不同层,每层中节点间满足Markov性质,整个架构中两终端节点之间的条件概率满足全概率公式.姚宁等[11]还探析了因果信息对于属性变化而产生的迁移问题.本文是这些工作的延续,研究信息系统中属性的变化对于已抽取的流图的影响,或者流图在不同信息系统中的可迁移性.这里属性的变化侧重于属性个数的增加或删减,关于属性值层面的粒度变化的最新研究成果可参考文献[12].考虑到属性的变化与系统所能刻画的信息的粒度,即信息粒中所包含的成员的数量直接相关,文中给出的结论可窥见粒度变化与流图变化之间的关联,为理解和刻画人类认知中的粒化属性提供新的视角. ...
Rough sets:theoretical aspects of reasoning about data