传统机器人流程自动化(Robot Process Automation,RPA)主要使用操作系统和应用程序提供的接口获取图形用户界面(Graphical User Interface,GUI)控件,受操作系统和应用程序接口限制,但一些系统,如Linux,不提供获取控件信息的接口.提出一种基于神经网络对图形界面控件进行识别的方法,利用目标检测模型提取图形用户界面控件特征,在不使用操作系统接口的前提下识别图形用户界面内控件类别和几何信息,减少RPA对于系统与程序接口的依赖.同时,针对桌面端图形用户界面数据集缺失的问题,提出一种针对RPA领域桌面端图形用户界面目标检测数据集的生成方法.在该图形用户界面数据集上使用各类目标检测模型进行测试,结果显示,常用目标检测模型在识别用户界面控件的类别和几何信息时均能获得92%以上的准确率.
关键词:目标检测
;
机器人流程自动化
;
深度学习
;
图形用户界面自动生成
;
自动化测试
Abstract
Traditional RPA (Robot Process Automation) extracts GUI (Graphical User Interface) widget category and location information through the interface provided by operating system or application programs. However,the application scope of RPA is limited by operating system and application program interfaces. For example,some operation systems,such as Linux,have inadequate extraction interface access to widget category and location information. This paper proposes a method to extract GUI widget features based on neural network and extract the widget information by object detection. Object detection can fetch and understand the widget in desktop platform feature then further extract the widget category and location information without using any operation system or application program interface,which reduce the dependence of RPA on the operation system and application program interface. Meanwhile,aiming at the lack of the user interface database in desktop platform,an auto database generation method for target detection in RPA field is also proposed. The object detection models are tested on this user interface database in desktop platform. Experimental results show that the object detection models can obtain more than 92% mAP in extracting widget category and location information in desktop platform.
Keywords:object detection
;
robotic process automation
;
deep learning
;
GUI auto⁃generation
;
test automation
Lin Haochang, Qin Yunchuan, Cai Yuhui, Li Kenli, Tang Zhuo. Graphical user interface widget extraction based on object detection. Journal of nanjing University[J], 2022, 58(6): 1012-1019 doi:10.13232/j.cnki.jnju.2022.06.009
RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性.
随着人工神经网络技术成为研究热点,近年来目标检测技术快速发展,利用人工神经网络方法识别图形用户界面中的目标控件成为RPA技术发展的新趋势.例如,Moran et al[4]提出基于移动端Andorid用户界面数据库ReDraw.ReDraw数据集由两个数据文件所构成,一个是真实的用户界面截屏数据,另一个是扩展数据的合成数据集,数据集内每个控件类别都至少有5000个样本.Deka et al[7]提出一种基于移动端用户界面数据集RICO.对于这两个数据集,Liu et al[8]使用卷积神经网络来检测移动端用户界面控件元素的位置,Chen et al[9]则对移动端图形用户界面的新旧检测方式进行了对比,Fu et al[10]也提出一种基于NLP (Natural Language Processing)模型理解移动端用户界面的方式,但这些基于神经网络技术的研究主要集中在移动端应用.由于传统应用软件集中于桌面领域,所以RPA系统的关键应用场景也是桌面领域.与移动端图形用户界面数据相比,桌面端图形用户界面数据存在以下特点:
:Unified,real⁃time object detection∥Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas,NV,USA:IEEE,2016:779-788.
New accessibility model for Microsoft Windows and cross platform development
1
2005
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
Web application tests with selenium
1
2009
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
基于Selenium的自动化测试框架设计
1
2021
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
Machine learning?based prototyping of graphical user interfaces for mobile apps
2
2020
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
... 随着人工神经网络技术成为研究热点,近年来目标检测技术快速发展,利用人工神经网络方法识别图形用户界面中的目标控件成为RPA技术发展的新趋势.例如,Moran et al[4]提出基于移动端Andorid用户界面数据库ReDraw.ReDraw数据集由两个数据文件所构成,一个是真实的用户界面截屏数据,另一个是扩展数据的合成数据集,数据集内每个控件类别都至少有5000个样本.Deka et al[7]提出一种基于移动端用户界面数据集RICO.对于这两个数据集,Liu et al[8]使用卷积神经网络来检测移动端用户界面控件元素的位置,Chen et al[9]则对移动端图形用户界面的新旧检测方式进行了对比,Fu et al[10]也提出一种基于NLP (Natural Language Processing)模型理解移动端用户界面的方式,但这些基于神经网络技术的研究主要集中在移动端应用.由于传统应用软件集中于桌面领域,所以RPA系统的关键应用场景也是桌面领域.与移动端图形用户界面数据相比,桌面端图形用户界面数据存在以下特点: ...
手写金融汉字识别中的可信度估计
1
2005
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
Confidence evaluation for handwritten Chinese financial character recognition
1
2005
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
基于OCR技术的机场气象观测业务监控平台设计与实现
1
2022
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
Design and implementation of AWOS monitoring platform based on OCR technology
1
2022
... RPA(Robot Process Automation)技术利用人工智能手段模拟键盘鼠标输入,对一些高频、规则清晰的活动进行自动处理,例如读取账单、检查文件、单据申报项目填写等,它需要利用操作系统接口获取图形用户界面控件元素的类别信息与几何信息完成自动化操作.例如,Haverty[1]通过Windows系统的UI自动化(UI Automation,UIA)技术识别控件元素信息,实现RPA自动化操作测试框架.但该接口的应用范围仅限于Windows系统,而我国自主可控操作系统多数基于Linux内核开发,Linux X11接口不提供获取用户界面窗口内部控件信息的接口,所以无法获取用户界面窗口内部的控件信息.Bruns et al[2]与羊昌燕和邓印凯[3]使用Selenium框架获取Web界面控件信息,识别网页文档对象模型(Document Object Model,DOM)元素信息,获取对应控件的几何与类型信息.虽然Selenium框架具有跨平台特性,但只限用于浏览器,不能用于普通应用程序.在用户界面统一固定的工程控制领域,可以利用OCR (Optical Character Recognition)技术获取用户界面信息,很多用户的界面元素相对固定,一些学者采用传统的计算机视觉的方法进行元素识别,如Moran et al[4]使用Canny边缘算法识别用户界面控件,但该方式的应用范围非常局限,需要RPA系统提前根据用户控件特征设计识别算法,系统泛化能力很差.徐蔚然和郭军[5]结合OCR技术实现了银行票据录入的RPA方法,朱国栋等[6]也结合OCR技术实现了机场气象观测业务监控RPA系统.但RPA的核心应用场景为用户界面没有固定样式的桌面型应用,界面复杂多变,OCR技术也难以满足需求,因此,传统RPA技术受应用程序或操作系统接口的影响,应用范围存在很大局限性. ...
Rico:A mobile app dataset for building data?driven design applications
1
2017
... 随着人工神经网络技术成为研究热点,近年来目标检测技术快速发展,利用人工神经网络方法识别图形用户界面中的目标控件成为RPA技术发展的新趋势.例如,Moran et al[4]提出基于移动端Andorid用户界面数据库ReDraw.ReDraw数据集由两个数据文件所构成,一个是真实的用户界面截屏数据,另一个是扩展数据的合成数据集,数据集内每个控件类别都至少有5000个样本.Deka et al[7]提出一种基于移动端用户界面数据集RICO.对于这两个数据集,Liu et al[8]使用卷积神经网络来检测移动端用户界面控件元素的位置,Chen et al[9]则对移动端图形用户界面的新旧检测方式进行了对比,Fu et al[10]也提出一种基于NLP (Natural Language Processing)模型理解移动端用户界面的方式,但这些基于神经网络技术的研究主要集中在移动端应用.由于传统应用软件集中于桌面领域,所以RPA系统的关键应用场景也是桌面领域.与移动端图形用户界面数据相比,桌面端图形用户界面数据存在以下特点: ...
Learning design semantics for mobile apps
1
2018
... 随着人工神经网络技术成为研究热点,近年来目标检测技术快速发展,利用人工神经网络方法识别图形用户界面中的目标控件成为RPA技术发展的新趋势.例如,Moran et al[4]提出基于移动端Andorid用户界面数据库ReDraw.ReDraw数据集由两个数据文件所构成,一个是真实的用户界面截屏数据,另一个是扩展数据的合成数据集,数据集内每个控件类别都至少有5000个样本.Deka et al[7]提出一种基于移动端用户界面数据集RICO.对于这两个数据集,Liu et al[8]使用卷积神经网络来检测移动端用户界面控件元素的位置,Chen et al[9]则对移动端图形用户界面的新旧检测方式进行了对比,Fu et al[10]也提出一种基于NLP (Natural Language Processing)模型理解移动端用户界面的方式,但这些基于神经网络技术的研究主要集中在移动端应用.由于传统应用软件集中于桌面领域,所以RPA系统的关键应用场景也是桌面领域.与移动端图形用户界面数据相比,桌面端图形用户界面数据存在以下特点: ...
Object detection for graphical user interface:Old fashioned or deep learning or a combination?
1
2020
... 随着人工神经网络技术成为研究热点,近年来目标检测技术快速发展,利用人工神经网络方法识别图形用户界面中的目标控件成为RPA技术发展的新趋势.例如,Moran et al[4]提出基于移动端Andorid用户界面数据库ReDraw.ReDraw数据集由两个数据文件所构成,一个是真实的用户界面截屏数据,另一个是扩展数据的合成数据集,数据集内每个控件类别都至少有5000个样本.Deka et al[7]提出一种基于移动端用户界面数据集RICO.对于这两个数据集,Liu et al[8]使用卷积神经网络来检测移动端用户界面控件元素的位置,Chen et al[9]则对移动端图形用户界面的新旧检测方式进行了对比,Fu et al[10]也提出一种基于NLP (Natural Language Processing)模型理解移动端用户界面的方式,但这些基于神经网络技术的研究主要集中在移动端应用.由于传统应用软件集中于桌面领域,所以RPA系统的关键应用场景也是桌面领域.与移动端图形用户界面数据相比,桌面端图形用户界面数据存在以下特点: ...
Understanding mobile GUI:From pixel?words to screen?sentences
1
2021
... 随着人工神经网络技术成为研究热点,近年来目标检测技术快速发展,利用人工神经网络方法识别图形用户界面中的目标控件成为RPA技术发展的新趋势.例如,Moran et al[4]提出基于移动端Andorid用户界面数据库ReDraw.ReDraw数据集由两个数据文件所构成,一个是真实的用户界面截屏数据,另一个是扩展数据的合成数据集,数据集内每个控件类别都至少有5000个样本.Deka et al[7]提出一种基于移动端用户界面数据集RICO.对于这两个数据集,Liu et al[8]使用卷积神经网络来检测移动端用户界面控件元素的位置,Chen et al[9]则对移动端图形用户界面的新旧检测方式进行了对比,Fu et al[10]也提出一种基于NLP (Natural Language Processing)模型理解移动端用户界面的方式,但这些基于神经网络技术的研究主要集中在移动端应用.由于传统应用软件集中于桌面领域,所以RPA系统的关键应用场景也是桌面领域.与移动端图形用户界面数据相比,桌面端图形用户界面数据存在以下特点: ...