1.1研究背景
业务流程管理涉及计算机科学、管理科学以及数字通信等多个领域,因此计算机和通信方面的创新仍然是所有业务流程变化的主要驱动力。随着计算机和通信技术的迅速发展,业务流程变得越来越复杂,并严重依赖信息系统,而信息系统记录了相关的数据,可以通过分析这些数据对模型构建,进而将流程模型运用到业务流程管理领域的其他方面,以满足企业对产品质量等方面的要求,因此流程建模成为至关重要的。流程模型通过记录的程序可以简单化流程管理的复杂性,并且信息系统需要通过流程模型进行配置,同时只有模型间的交互达到一个共同的协议,那些跨组织的流程才能正确实施,所以流程模型可以广泛运用于各个领域。
业务流程管理可以分为三个阶段:模型(重)设计阶段、模型的实施和配置阶段以及模型的运行和调试阶段(如图1)。模型(重)设计阶段就是依据从信息系统中提取出日志对模型进行挖掘,也可以称之为模型的挖掘阶段;但是有些信息不会出现在挖掘出的模型中,因此这就需要进行第二个阶段模型的实施和配置,在此阶段可以使挖掘出的模型能够体现出行为方面的约束;在模型构建完成以后,就需要对模型在运行过程中是否会出现异常以及异常的改善,也就是第三个阶段模型的运行和调试阶段,也就是模型一致性和变化分析以及模型的优化过程。同时又可以将其分为两大阶段:模型分析阶段和数据分析阶段(如图1),也就是可配置流程模型的挖掘和模型的变化域分析两阶段。

1.2国内外研究现状
在业务流程管理领域业务流程的分析变得越来越重要,同时也对业务流程管理的其它阶段也有着极大的影响。流程模型是否能够正确实施和运行是流程分析的关键,但是由于外界因素以及模型间的交互行为会对模型的实施运行产生一定的影响,往往脱离了设计者当初的意图,因此可以从模型的相似性方面对流程进行分析。
1.2.1流程一致性及变化域分析
模型相似性方面的研究是业务流程管理领域研究不可缺少的阶段,模型间的相似程度可以用模型的一致性来衡量,一致性越高则认为模型越相似,反之,一致性度越低则认为这些模型是非一致的,模型之间存在变化;因此可以从模型的一致性和非一致性两个角度考虑:模型间的一致性主要分析模型间的不同方面的匹配;而模型的非一致性则是分析模型中存在的变化域,这对于模型的修复以及系统的正常运行有重要作用。
首先流程模型的一致性分析对于解决模型中的异常、模型间的不匹配以及模型的优化有着重要的作用。但是模型的建立是一致性分析的关键,因此构建一致性高的模型对于其它方面的研究提供了方便。建模之后需要考虑模型的一致性,目前已有很多学者提出了一致性不同的测量方法,大致可以分为两类:一是模型之间的一致性测量;二是日志与模型间的服从检测。首先对于模型间的一致性测量主要是从结构及行为两个方面研究的,从结构方面可以考虑模型的语义相似和结构距离,而从行为方面是计算模型的行为相似度和行为距离。
其次,模型的非一致性分析也就是模型的变化域分析,模型在不同的外界环境的影响下可能会出现模型的改变,这些改变会使模型运行阶段产生一些异常的结果,因此模型变化的分析对于模型的正常运行和配置有重要的作用。业务流程变化可以从检测模型的变化、分析变化之间的关系以及解决变化问题这三个方面考虑。首先文献从语义学角度提出了多种检测模型变化的方法,但是这些方法存在缺陷,文献基于变化的特征的基础上对变化进行追踪,从多个方面来检测模型的变化,避免了单一性和不准确性。
2基本知识
2.1事件日志
过程挖掘的目的就是在分析事件日志以及行为轮廓的基础上来构造流程模型,也就是流程挖掘描述了一种分析技术挖掘记录在交易日志、数据库等中的信息。假设这些方法能够连续记录事件并且每个事件对应一个活动,此外一些流程挖掘技术还使用了类似于时间的执行和来源以及序列的大小等这样一些附加信息,为了阐述事件日志的定义,表给出了事件日志的一个简单示例。

表中只给出了两种迹,包含了四个事件,每一个事件都有独特的属性。例如事件26563341属于caseS056并且是活动的一个实例,这个活动发生在1月27日的8:24,由Ann执行操作的,错误值为360。表中的数据信息现在仍然可以从系统中提取。系统以不同的方式储存事件,流程软件信息系统也就是工作流管理系统提供了专有的迹;在其它的系统中这些信息可能分散在很多个表中。
2.2概述
随着信息技术的迅猛发展以及计算机技术研究的不断深入,业务流程的应用领域也越来越广泛,更多的企业或公司为了提高他们的业务水平,对于建模的要求也越来越高。不同的公司根据不同的业务需求,对模型的要求也会不同,但是在建模过程中所产生的模型不一定都是符合要求的,有些模型可能受外界因素的影响会产生一些异常。因此就需要讨论这些模型间的一致性问题,在此基础上找出模型中的产生变化部分,进而对模型进行优化。
现有的分析流程模型变化问题的方法主要是从模型的行为结构方面来测量行为和结构偏差以及通过行为轮廓的笛卡尔积来计算模型间的一致性度等。文献中将模型的行为轮廓与迹等价比较,认为迹等价的要求比较严格以及行为轮廓在测量上的优势进而进行一致性测量。文献给出了计算日志的服从度的方法,并分别讨论了关于行为轮廓和因果行为轮廓上的服从度的计算,在此基础上提出两类导致不服从的干扰类型。文献提出了基于因果行为轮廓上的一致性的有效计算,并且给出了如何计算日志的一致性。文献中研究了在不同的抽象水平上模型之间一致性概念和观察一致性的联系,同时通过对迹等价和基于行为轮廓上的一致性概念的比较,得出了行为轮廓一致性概念的实用性和广泛性。文献介绍了一致性和兼容性之间的关系,并且对于一个给定的兼容性关系给出了优化一致性的标准。文献,介绍了业务流程中的动作模式,提出了支持数和信心数,进而来比较模型间的一致性。文献研究在模型间的变化传播时怎样缩小变化范围,作者是在已知原模型和目标模型基础上给出在原模型中假定的变化节点上来搜索变化范围的,目的是研究模型间变化的传播。上述研究基于静态方面以及依赖目标模型分析变化域具有局限性和不精确性,对流程模型间的一致性分析有一定的影响。
3基于行为轮廓和日志的流程模型变化域的分析方法............15
3.1概述.............15
3.2背景知识........16
4基于事件日志和配置约束的流程模型的挖掘方法............28
4.1概述...............28
4.2问题阐述...........29
5结论..............40
4基于事件日志和配置约束的流程模型的挖掘方法
流程挖掘技术是一种从信息系统的事件数据中构建出流程模型的方法,对分析业务流程模型的行为以及一致性检测等具有重要的意义。现有的挖掘技术可以挖掘出涵盖事件日志中所有行为的一般流程模型,对于存在隐变迁等行为约束问题,现有的挖掘技术存在局限性。本文基于事件日志次序关系和配置约束的基础上提出了可配置流程模型的挖掘方法;首先依据日志次序关系和两种度量给出了一般流程模型的挖掘方法,然后在此基础上结合活动变迁的隐藏、阻止等配置约束提出了一种可配置流程模型的挖掘方法;最后用实例证明了挖掘方法的可行性。
4.1概述
在上一章中我们通过事件日志的行为关系找到目标模型的变化部分,并结合实例分析模型中存在的变化,在本章中将通过配置约束对模型挖掘进而来排除疑似变迁中不匹配的变迁的存在。
目前,事件数据难以置信的增长使得流程挖掘成为业务流程管理领域研究的一个热点,同时也为流程分析者提供了更多的机会。流程挖掘的目的就是使用这些事件数据发现、管理以及改善与这些信息相关的流程,因此事件数据的分析对于流程的实施有着重要的作用。对于不同的组织或者企业可能需要执行相似的流程,但是通过以往的流程挖掘技术得到的一般的流程模型不能同时满足不同的组织或企业,因此为了能共享流程的相同点并且分析不同点,就需要找到一种能够描述一类流程变量而不是仅描述一个特定流程的流程模型一可配置的流程模型。
5结论
5.1本文的主要工作
本文主要从行为和结构两个方面来对流程模型进行研究。通过模型的变化域分析和流程模型的挖掘以及配置来实现对流程行为和结构的研究。本文在变化分析方面的研究避免了原模型和目标模型都已知,原模型中的变化给定的理想情况下,二是在没有原流程模型和变化点的情况下对模型的变化分析方面的进行研究,其次流程挖掘技术在原有的可见任务和不可见任务的基础上从行为约束的角度结合配置考虑模型的挖掘,这不仅解决了可见任务挖掘的隐藏行为的发现问题还避免了不可见任务的挖掘方法的低成功率。本文在行为轮廓、事件日志以及配置约束的基础上对模型的行为和结构进行研究,主要包括以下两个方面的内容:
(1)对于未知原模型和变化点的情况下研究流程模型的变化,提出了基于行为轮廓和日志的流程模型变化域的分析方法。流程模型变化域方面的研究主要是在静态分析的基础上,根据给定的原模型、目标模型以及变化节点,通过变化传播的理论来对变化范围进行搜索,该方法具有局限性。本文在流程模型的行为轮廓关系的基础上将其关系推广到事件日志上,对事件日志中的变迁进行归类,然后通过模拟关系、非模拟关系及归类模拟匹配关系来确定变迁间存在的行为关系;然后将事件日志中的变迁通过符号函数、标签函数、模拟关系映射函数和复杂对应关系将其与目标模型中的变迁进行匹配,以确定模型中存在的变化,并从理论上证明了该方法的有效性。
(2)对于存在隐变迁等行为约束问题的流程挖掘提出了基于配置约束的业务流程模型的挖掘方法。已有的挖掘算法例如《等算法是在网的行为轮廓关系以及结构性质的基础上来挖掘流程模型,而这些挖掘出的流程模型只涵盖了日志中的一般的行为,对于存在隐变迁等行为约束问题或是不可见任务角度,已有的挖掘方法存在局限性。行为约束角度的挖掘方法的核心是挖掘出可配置的业务流程模型,依赖日志的次序关系确定变迁间的行为关系以及变迁和库所间的流关系,初步建立流程模型,结合质量维度对模型进行测量,进而通过增量日志对模型进行改善,然后将其与配置约束结合确定可配置模型。该方法充分考虑了有行为约束模型的挖掘,提高模型的精确度。
参考文献(略)