发新话题
打印

[PLC/DCS/SC及组态软件] 数据挖掘技术在高速铁路SCADA中的应用研究

数据挖掘技术在高速铁路SCADA中的应用研究

近年来,随着电气化铁道技术的不断发展,特别是高速铁路(客运专线)中变电所综合自动化、变电所在线监测的实现,提供了大量的可供分析的数据。而高速铁路SCADA系统产生的数据一般应用于统计报表、事故记录和曲线绘制显然,大量的数据仅仅用于此过于浪费。若从大量的数据中提取可用数据并对SCADA系统设各的潜在故障进行预测,那无疑将大大提高SCADA系统的综合分析性能。

  近10年来,铁路变电所电气设各故障分析有了迅速的发展。出现了基于开关、保护动作信息进行故障诊断的研究和基于故障录波信息进行故障诊断的研究。人工智能技术如专家系统、模糊理论、人工神经网络等在该领域得到广泛应用。这些方法除受系统干扰外,只依据变电所故障信息进行分析,而没有考虑变电所正常运行时的大量信息,是一种元件级故障诊断,而非系统级故障诊断。高速铁路调度中心保存了大量的历史信息(包括正常、越限、故障、录波等数据),将这些数据进行综合分析,可得到更加满意的分析预测结果。

  数据挖掘技术是数据库知识发现的关键技术,它是从大量的、不完全的、有噪声的数据中提取出人们事先不知道的但又是潜在的有用信息和知识的过程。将数据挖掘技术应用于高速铁路SCADA系统中,有利于改进即有SCADA系统的不足,提高SCADA系统的总体性能。

  一、数据挖掘技术概述

  所谓数据挖掘就是从海量的数据中提取隐含的、人们事先未知但又是潜在有用的信息和知识,并将其表示成最终能被人理解的模式的高级过程。因为数据挖掘是数据库中的知识发现KDD(Knowledge Discovery in Database)中一个非常重要的处理步骤,所以也通常称之为KDD。它能代替专家从大量的数据中挖掘出隐含于其中的知识,利用数据库的存储功能,还能找出数据之间的潜在联系和数据本身固有的规律。数据挖掘是一门交叉学科融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术数据挖掘有如下几种知识发现方式:分类知识发现、数据总结、数据聚类、关联规则发现、序列模式发现、依赖模式发现、异常发现,和趋势预测等。针对不同的知识发现目的,又有不同的算法,如神经网络算法。Apriori算法、决策树等数据挖掘的过程是一个反复的过程,如定义和分析主题、数据预处理、选取算法、提取规则、评估和解释结果、将模型变成知识,最后应用于实践中。而且,随着应用需求和数据基础的不同,挖掘处理的步骤也可能有所不同。



$该帖已被[lightsmile]修改过,最后修改于2007-4-29 10:03:30
有3种东西必须捍卫  祖国  荣誉和家庭
有3种东西必须控制  情绪  语言和行为
有3种行为必须屏弃  罪恶  无知和背叛
有3种做法必须避免  懒惰  野蛮和嘲讽
有3种东西必须挽救  圣洁  和平和快乐
有3种习惯必须培养  理性  谦恭和好学

TOP

Re:楼主

二、总体设计

  高速铁路SCADA系统是一个大型综合系统,各项功能比较完各其基本功能主要表现在以下几个方面①实时数据采集与处理采集变电所运行实时数据和设备运行状态,包括各种状态量、模拟量、脉冲量、数字量和保护信号,并将这些体念的数据去伪存真于数据库供计算机处理之用②运行监视功能。对变电所的各种状态量变位情况和各种模拟量进行监视。③故障录波与测距功能④事故顺序记录与事故追忆功能⑤控制及安全操作闭锁功能⑥数据处理与记录功能⑦人机联系功能⑧打印功能⑨运行技术管理功能⑩谐波的分析和监视功能:自诊断、自恢复和自动切换功能。本文旨在SCADA系统现有功能的基础之上扩展其功能,利用数据挖掘技术完成具有预测设各故障潜在性功能的系统,以降低设各维护费用,减少设各检修和停机时间。图1为系统的总体框架。

  SCADA数据库(含变电所综合自动化数据、在线监测数据)、外部数据库(如MIS数据库)为主要数据源。充分利用这些数据对变电所设各进行综合分析预测,以实现对设各的故障分析,保证高速铁路正常运行SCADA数据挖掘库也即SCADA数据仓库,负责存储面向变电所电气设各(如变压器、断路器、并联电容或隔离开关)的主题数据(包括故障报告故障录波,事件报告,自检报告,各种遥测记录等)它是在业务数据库的基础上建立一个较全面、独立和完善的信息环境用于支持高层决策分析数据以星形多维数据模型形式加以存储,并以Microsoft SQL Server 2000进行管理采用OLAP(On-Line Analytical Processing)技术完成分析预测,满足SCADA数据挖掘库多维环境的查询和报表需求。通过知识发现方式和合适的算法对变电所设备故障进行分析预测。最后将OLAP和挖掘结果以可视化界面加以展现总体功能由VC++6.0结合Microsoft SQL Server 2000实现。

  三、关键技术

  数据挖掘的关键问题包括:定义主题任务、建立SCADA挖掘库、挖掘库的数据更新、算法的选择与改进、挖掘模型的训练与评估。其数据挖掘过程的关键步骤可由图2表示。

  1、建立数据挖掘库

  以SCADA数据库为基础,建立面向主题的,数据相对稳定的高速铁路SCADA系统数据挖掘库。高速铁路SCADA系统被控站均采用综合自动化系统综合自动化中信息量极其丰富,并能通过信道上送调度中心,在调度中心可以保存历史记录库中包括系统运行记录表、位置状态表、事件记录表、遥测越限记录表、故障遥测记录表、开关跳闸记录表、故障报告历史记录表、保护装置故障报告历史记录表、故障录波、负荷录波,自检记录等。要从这些大量的数据中挖掘出有用的信息是一件十分困难的事,因此在实施数据挖掘之前需要确立明确的目标,即定义挖掘主题。本文的目的是进行故障预测

有3种东西必须捍卫  祖国  荣誉和家庭
有3种东西必须控制  情绪  语言和行为
有3种行为必须屏弃  罪恶  无知和背叛
有3种做法必须避免  懒惰  野蛮和嘲讽
有3种东西必须挽救  圣洁  和平和快乐
有3种习惯必须培养  理性  谦恭和好学

TOP

Re:楼主

 

分析,建立了面向变电所电气设备(如变压器、断路器或隔离开关)主题的数据挖掘库并以星形多维数据模型创建事实表和维表。多维数据模型包含多个多维数据模式,每个多维数据模式都对应一张事实表和多张维表,此结构为系统前端工具的设计提供了规范、优越的基础,对决策分析有很好的扩展性且聚集数据也十分方便。

  为了满足挖掘需要,建立数据挖掘库时往往要对数据进行标准化定义,在数据中增加新属性要对异常值作专门处理,并从海量的数据中选择数据。算法的好坏显得十分关键本文采用聚类和分类算法对数据加以选择和处理。聚类算法即是先定义一个合适的度量,然后计算任意两个样本之间的距离当两个样本之间的欧几里德距离小于某个给定阈值时,这两个样本就属于同一类。通过聚类分析,将具有共同特征属性或相关联的数据归为一类,便于从庞大的SCADA数据库中抽取对主题内容有用的数据。分类的目的是构造一个分类函数或分类模型(分类器),该模型能把数据库中的数据项映射到某一个给定类别。通过分类分析,将数据按需要分成若干组(如正常、越限报警和故障数据),便于对不同类型的数据进行分析比较,找出内在的必然联系,为数据挖掘提供帮助。

  2、SCADA数据挖掘库的数据更新

  SCADA系统每天都要产生大量的数据,如何将SCADA系统的实时数据映射到挖掘库,也是本系统要考虑的一个重要问题。本系统根据挖掘需要采用事件驱动(变电所故障跳闸事件)和定时驱动(正常运行时每天定时驱动)来更新SCADA挖掘库。

  3、挖掘算法分析及选择

  算法的选择建立在对数据源的理解、挖掘主题的把握和各种算法的了解之上。如前所述,SCADA系统中存储了海量的历史数据而目前的挖掘算法又是多种多样如何将二者有机地结合起来更好地为挖掘主题服务是本文的关键也是难点。本文结合高速铁路牵引供电SCADA系统数据量大实时性强,各子系统相互关联等特点,采取数据聚类发现、关联规则发现、序列模式发现三类知识发现方式,以神经网络算法。Apriori算法、时间序列相似算法等对变电所设备故障进行分析预测。

  4、模型训练与评估模型

  本系统的训练与评估模型将高速铁路SCADA数据仓库中的数据随机分为两部分一部分作为训练模型集,另一部分作为测试模型集训练出来的模型若经得起测试模型集的测试得出的预测结果与实际的运行情况相近(可信度达到一定的指标),即认为此模型满意。

  四、结束语

  本文通过对高速铁路SCADA系统的分析,指出其中大量的历史数据没有充分运用而过于浪费,提出了利用数据挖掘技术来提供对变电所电气设备故障综合分析、预测和决策能力。数据挖掘技术在保证高速铁路SCADA系统安全性、可靠性、经济性全方位协调发展方面将显示出不可忽视的作用。

有3种东西必须捍卫  祖国  荣誉和家庭
有3种东西必须控制  情绪  语言和行为
有3种行为必须屏弃  罪恶  无知和背叛
有3种做法必须避免  懒惰  野蛮和嘲讽
有3种东西必须挽救  圣洁  和平和快乐
有3种习惯必须培养  理性  谦恭和好学

TOP

发新话题