1 引言
火电厂信息化程度的提高,使操作员的动作几乎完全取决于监视侧的显示结果,因此测量数据质量的优劣直接影响着电厂能否安全经济运行,这就对传感器的可靠性提出了更高的要求。同时随着火电厂自动化水平的提高,为了保证电厂正常运行,用于测量温度、压力、流量等信号的传感器的可靠性在监控和决策系统中就显得愈发重要;如果传感器发生故障,无论是硬故障还是软故障,都会影响系统的正常安全经济运行。事实上,传感器正是监控决策系统中比较容易损坏的部件,另一方面,火电厂信息化程度的提高,使火电厂传感器数量更大、种类也更加繁多,同时发生传感器故障的概率也就随之增大,而传感器故障将直接影响电厂运行的安全性,因此要充分利用这些大量传感器的相关信息对传感器进行故障检测。如果发现传感器故障,则利用其它相关的正确数据进行操作,并报警通知操作人以确保及时更换传感器,尽量避免危险性后果的发生。
目前传感器故障检测方法有许多[1-3],采用较多的传感器故障检测方法是以线性控制理论为基础的分析冗余法,但需要建立系统的精确数学模型,只适于线性和低阶系统[4]。人工神经网络不需要知道系统的数学模型,只通过样本的学习来掌握数据之间的关系,因而可以用于多传感器故障检测和信号恢复,但是神经网络的训练时间比较长,并且神经网络模型难以精确适合火电厂大工况负荷变动的实际运行状况[5-7]。火电厂运行时负荷变化大,并且各设备运行状态存在不确定变化(例如输入煤质的不确定性变化引起的锅炉系统的变化),这些变化就使得解析模型和神经网络难以适应系统的实际运行状况。
火电厂的各设备之间紧密联系,各设备运行状态的波动互相关联,这种动态波动的关联情况通过传感器的输出数据明显地凸现出来。在1993年Agrawal等首先提出了挖掘顾客交易数据库中项集间的关联规则问题,这些规则得出顾客的购买行为模式[8]。这样的规则可以应用于商品货架设计、货存安排以及根据购买模式对用户进行分类。关联规则具有以下优点:可以产生清晰有用的结果;支持间接数据挖掘;可以处理变长的数据;计算的消耗量可以预见等。因此本文根据火电厂动态波动中的关联特征,提出利用关联规则的方法进行火电厂传感器故障检测,可以避免对各设备建立精确的解析模型或神经网络模型。
2 火电厂的关联特性
火电厂的目的就是用燃料将能量以电能的形式传输出去,其发电过程从能量转换的角度来看,燃料通过燃烧将其化学能转换成热能,并将大部分热量传递给锅炉中的水和蒸汽,提高蒸汽的能位;之后,具有较高压力和温度的蒸汽在汽轮机内膨胀做功,将蒸汽所含有的一部分热能转换成汽轮机转子的机械能;高速旋转的汽轮机转子通过联轴器带动发电机转子,使静子上的线圈不断切割磁力线而产生电流,从而实现机械能转换成电能的过程。这个过程中任何一个环节出现波动,都会影响到发电厂的其它运行设备。
从能量转换的角度看,火电厂是一个互相关联的整体,它由物质流(燃料流/空气流,蒸汽流/凝水流/循环水流,电流)载着能量流实现连续能量转换。能量流的连续性(能量守恒)统驭和控制了各个子系统的物质流之间的协调关系,各个子系统的物质流又和相关设备的运行状态形成直接关联,这种内在的有机联系决定了整个电厂是按照一个统一节拍运行的整体。
火电厂的汽水系统、燃烧系统、电气系统和控制系统级级相连,环环相扣。按照能量守恒原理,各系统的能量变化都会波及到下一级系统,并由于负荷、供电质量、经济性等要求,控制系统又会使这些波动反过来影响能量源¾¾燃烧系统。燃烧系统的变化不可避免地会影响后面的各个系统。为了顺利有效地实现各主系统本身的能量转换,每个系统都由许多复杂的子系统组成。每个系统的变化,必须由各自的子系统来联合完成,每个系统的变化必然表现为所有子系统设备的变化。
为了监测发电厂运行状况,大型发电机组均配备了具有上千个测点的DAS系统[1],大量的测试数据形成了源源不断的信息流,这个信息流是发电厂的能量流和物质流的映像;故障诊断的过程就是通过对信息流的加工处理提取反映系统和设备的状态信息的过程。
3 关联规则算法
3.1 Apriori算法
Agrawal等于1993年基于频集理论的递推方法[8],设计了一个基本算法—apriori算法。这是一个基于两阶段频集思想的方法,将关联规则挖掘算法的设计可以分解为两个子问题:
(1)找到所有支持度大于最小支持度的项集,这些项集称为频集。
(2)使用第1步找到的频集产生期望的规则。
apriori算法是针对商业领域提出的,分析对象的数据都是对时间参量没有严格要求的离散值。每条商业操作记录之间的间隔时间都比较长,相对于工业领域监控信号的采样间隔,它们之间根本不是一个数量级。
在商业领域,Apriori算法的处理时间对操作记录的时间间隔不会受到任何影响,况且在商业领域每天都有一段的停业时间。而在工业领域,生产参数的采样频率都普遍比较高,并且它们基本上都是全天不间断采样的。Apriori算法很难直接对工业参数的时间序列数据进行关联规则挖掘。
3.2 改进的算法
Apriori算法不能直接用于时间序列的集中原因是单位时间数据量大和各传感器之间的关联程度未知。根据火电厂本身的关联特性和其生产规律以解决apriori的适应性问题,本文将改进算法分为三部分:
(1)利用相似搜索找出相似程度高的时间序列[9]。
经过相似搜索,达到以下两方面的目的:①分类。即将工业生产中的大量测点分为若干部分,这种分类方式不考虑设备功能,也不考虑具体的传感器类型,而是根据测量输出的规律性进行分类。经过这一步,就将直接参与关联算法的时间序列分成了几部分,这几部分可以并行计算而不干扰,同时降低了计算量。② 相似搜索的结果使得关联算法的对象的关联程度提高,这满足了工业生产故障诊断领域误诊率的要求。
(2)对时间序列按照工业生产的规律性分段。
经过将时间序列按照生产规律分段,使得关联算法能够直接用于时间序列。由于生成关联规则中的循环次数同数据量是成指数增长的,因此如果直接把时间序列中的每一个数据作为一条记录,就会使关联规则算法在对数据进行挖掘时花费的时间太长。但是,经过分段就会产生如下效果:
假设测点为N个,在不分段的情况下会产生N×M个频繁1-项集和个候选2-项集;但输出数据按照某标准被分为M个片段后,在频集计算时Apriori算法需要产生的候选2-项集个数却减少了
个,并累计和检查它们的频繁性。候选2-项集的大量减少就使得后续各项集的计算量锐减。
(3)利用Apriori算法产生期望的规则。
算法流程见图1。
上一篇:拟全局最优的配电网实时网络重构法