基于大数据挖掘采煤工作面安全预警管理研究

发表时间:2018-11-30 作者: 孟凡强  来源: e-works
关键字:大数据挖掘  安全预警管理 挖掘采煤 
采煤工作面作为煤炭的主要生产场所,空间狭窄,环境复杂,设备多,作业人员集中,是一个复杂的社会技术系统。

  采煤工作面作为煤炭的主要生产场所,空间狭窄,环境复杂,设备多,作业人员集中,是一个复杂的社会技术系统。系统中存在多种动态变化的风险因素,增加了工作面的风险防控的复杂性。应用系统工程分析方法,全面分析影响采煤工作面的风险因素,建立采煤工作面安全预警专家系统,对风险进行预警和采取应急预案。知识获取是专家系统知识库建立的核心问题,也是建造专家系统的瓶颈,决定了专家系统的质量好坏。

  数据挖掘(Data Mining,DM)从大量的、不完全的、模糊的、随机的数据中,提取隐含的有价值的信息,一个重要过程就是从数据中挖掘知识的过程,又称为数据库中知识发现(Knowledge Discovery in Database,KDD),是从数据中发现模式的算法的最好的方式。

  因此本文研究主要是研究将数据挖掘技术于专家系统中,改善采煤工作面安全预警专家系统中的知识获取“瓶颈”问题,以便更好的实现采煤工作面安全预警管理。

  1 采煤工作面安全预警专家系统

  一般传统采煤工作面安全预警专家系统由知识库、数据库、推理机、解释器、知识获取系统与人机接口组成。知识库、推理机作为系统的核心,用来存储采煤安全专家经验知识和已知的事实、产生式规则等,系统结构如图1所示。

采煤工作面安全预警专家系统结构图

  图1 采煤工作面安全预警专家系统结构图

  知识的获取按照采煤工作面安全预警系统目标要求及其领域限定问题的求解范围,收集专家知识,经过抽取知识、转换知识、输入知识、检测知识几个环节,通常由知识工程师与采煤安全领域专家反复交流而手工完成。但由于领域专家知识的局限性或者主观因素影响,或者知识工程师技能受限,在知识获取过程中,所获取的知识存在不完整、片面性或者不准确。知识获取是构建知识库的核心,由于知识获取时出现了问题,导致知识库构建过程中,领域知识表示存在非独立性和非唯一性,所归纳总结的知识元存在相关性的可能性大,这样推理机应用的前提条件变得不确定,导致推理结论不准确。

  为了解决这个问题,采用数据挖掘技术与采煤安全领域专家充分结合的思路与方法构建知识库,改造传统的采煤工作面安全预警专家系统。

  2 基于大数据挖掘的专家系统

  2.1 采煤工作面安全预警多元数据源

  采煤工作面安全预警需要对测量的参数进行选择和采集,参数的主要来源通过传感器进行采集、传输,直接测量的参数包括工作面环境参数,如瓦斯浓度、风速、风量、CO浓度等;顶板压力参数,如液压支架柱前端压力、后端压力;采煤设备运行参数,如采煤机转速、割刀转速、电机温度等。此外还有视频、维护维修管理等大量的非结构化数据,数据的发展趋势符合大数据容量大、处理速度快、类型多样化、价值大的特征。

  采煤工作面多元数据构成安全预警数据库的大数据来源,主要包括:

  (1)初始数据库。初始数据库主要是采煤工作面设计与建设阶段的数据,包括采煤工作面各类知识清单及各项规章制度、资料、文件等。知识清单如采煤作业系统知识、运输系统知识、通风系统知识、供电系统知识、排水系统知识、辅助作业系统知识;顶板管理知识、瓦斯与粉尘治理知识、水灾防治知识、火灾危害知识、机电事故知识、运输事故知识以及放炮事故风险知识。

  (2)运行数据库。采煤工作面运行数据库由采煤工作面环境、设备运行、顶板压力等状态信息构成。如前所述,这些信息通过自动化监测传感器收集。

  (3)管理数据库。管理数据库包括工作面日常维护、维修以及相关的维护设备材料、事故处理和管理人员等数据。维护数据通常是指工作面的日常班组维修记录、维护人员处理事件的报告、材料消耗以及相应技术支持的数据。维修数据指工作面(主要是机电设备、支护材料、监测仪表等)的定期检修记录、设备维修与更换数据等。管理人员数据主要包括维修人员的学历、专业水平、个人技能、工作年限、岗位职责等。

  (4)其他相关数据库。相关数据库是与采煤工作面有关但还不能确认的相关联数据,如大巷运输系统、井底车场提升系统对采煤工作面的影响。

  2.2 采煤工作面安全预警大数据挖掘分析

  采煤工作面安全预警大数据技术应用,重点关注的数据采集以及挖掘分析。由于安全预警大数据结构复杂,包括结构化、半结构化及非结构化数据,普通的信息化处理系统难以实现数据的处理,需要利用大数据处理技术才能对其进行有效存储和处理。

  大数据处理架构Hadoop是一个能够针对大量数据进行分布式处理的计算平台,采用分布式存储与分布式处理两大核心技术,其中Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)可以处理超大数据。大数据的挖掘分析是解决了数据之间的联系,挖掘过程采用分布式并行化技术,采用Hadoop的MapReduce平台,完成分区、映射、排序、合并、归并等系列数据处理过程。

  在采煤工作面安全预警大数据挖掘过程中,通过MapReduce平台对所有数据抽取、转换、加载,转换成可识别的状态数据,大量的数据不断积累,集聚为煤矿安全预警的经验大数据。

  2.3 基于大数据挖掘的采煤工作面安全预警专家系统

  数据挖掘是利用各种技术从数据库中发现知识(规则)送入知识库,常用的挖掘算法有关联分析、分类、聚类、可视化、决策树、遗传算法、粗糙集理论等,对于采煤工作面安全预警采用关联规则分析的方法。

  安全预警大数据挖掘的技术路线是对工作面全部安全生产数据进行关联性深度挖掘,分别取得工作面正常工作模式对应的数据指标及工作面存在风险时对应的数据指标,将收集到的数据进行对比,从而对工作面安全状况作出预测判断。图2是基于大数据挖掘的专家系统结构图。

基于大数据挖掘的采煤工作面安全预警专家系统结构图
 

  图2 基于大数据挖掘的采煤工作面安全预警专家系统结构图

  3 基于大数据挖掘采煤工作面安全预警专家系统应用分析

  3.1 数据预处理

  海量数据的预处理是采煤工作面安全预警的一个重要步骤,特别是在挖掘含有不完整数据、异常数据的对象时,为提高数据挖掘的质量,需要进行数据预处理,一般包括结构化处理、数据清洗与集成、选择与变换。

  (1)结构化处理:工作面日常维护、维修以及相关的维护设备材料、事故处理和管理人员等数据多以文本形式存储,数据挖掘模型难以对这些非结构化信息直接处理,需要对这些文本进行结构化处理,形成结构化数据,以便满足数据挖掘要求。

  (2)数据清洗与集成:在收集到的原始数据通常存在大量的异常数据,如关键指标偏离期望值、关键属性信息缺失、错误类型数据等,这些数据如果不清理将严重影响信息的质量。采用平滑噪声数据、填补遗漏缺失数据、剔除异常数据进行处理,并将数据结构标准化处理,使不同的数据融合到一个集合。

  (3)数据选择与变换:数据选择与变换根据业务需求,选择数据信息,然后进行数据格式化处理,统一编码,形成安全预警数据库,以备数据挖掘使用。

  3.2 风险预警信息关联规则挖掘

  关联规则研究有助于发现数据集合中不同项之间潜在的关联,用规则表示出来,经过推理、积累形成知识后,得到其关系模式。

  项集I={i1,i2,..in};TR是事物的集合;TR⊂I,并且TR是一个{0,1}属性集合。设X是一个项集,且X⊆TR。关联规则是形如X→Y的蕴含式,其中X⊆I,Y⊆I,且X|Y=φ,X——规则的条件(前件),Y——规则的结果(后件)。关联规则具有支持度、置信度两个重要属性。

  (1)支持度:关联规则对事物TR的支持度(support)定义为同时包含有事物X、Y的交易数与所有交易数之比,描述为:

支持度
 

  反映了项集X、Y在事物集TR同时出现的概率。

  (2)置信度:关联规则对事物TR的支持度(confidence)定义为包含有事物X、Y的交易数与包含X交易数之比,描述为:

置信度
 

  反映了数据集中出现项集X的同时又出现项集Y的条件概率。

  关联规则的支持度和置信度分别反映了所发现规则的有用性和确定性,一般的用户可以定义两个闭值,分别为最小支持度阈值和最小置信度阈值。当挖掘出的关联规则的支持度和置信度都满足这两个闭值时,就可以认为这个规则是有效的,否则就是无效的规则。两个阈值一般由领域专家或用户提前设定好的。

  数据挖掘关联规则主要包括以下两个步骤:

  Step1:发现所有的频繁项集,这些项集的频度至少应等于预先设置的最小支持频度;

  Step2:根据所获得的频繁项集产生的相应强规则,这些规则必须满足最小置信度阈值。

  通过以上所述过程,工作面安全预警数据库中的信息转化为不同的关联规则,利用这些规则,安全管理者可以依据已知因素预测其他因素存在的可能性,实现安全预警。

  3.3 可视化分析

  安全预警信息的可视化可以通过不同的图像直观表示,如用节点表示不同各类安全相关因素,出现频度越高的因素对应的节点越大。通过可视化图像分析,为安全管理者提供了决策依据。

  4 应用实践

  以山东某矿E3402综采工作面安全监测数据为例,进行应用实践分析。本案例利用关联规则挖掘技术,挖掘不同工作时间段与监测数据之间的关联关系。

  E3402综采工作面安全预警系统由井下监测系统采集工作面瓦斯、一氧化碳、温度、风速、顶板压力以及采煤机、胶带运输机、通风机等设备开停状态等。根据该矿地质构造、赋存条件分析,影响E3402工作面安全预警因素主要因是瓦斯、一氧化碳、通风、温度等。所有安全监测数据与重要操作事件参数均存入关系数据库。

  截取2017年1月-4月部分数据,原始资料如下表:

  表1 部分属性指标数据

部分属性指标数据
 

  应用大数据挖掘算法计算,对瓦斯、一氧化碳、工作面温度关联规则进行可视化处理,如图3所示:

关联规则可视化
 

  图3 关联规则可视化

  由上图可以看出,在早6:00-8:00时间段内,工作面温度高,风速低。分析原因为该矿这个时间段为夜班、早班交接时,夜班工人比较疲乏,急于升井早班工人没有到岗,而且井下值班领导、安全监管人员没有到位,工作面无人监管,出现通风机停止或风门没有关闭等现象,导致工作面通风不好,这样很可能会导致瓦斯等有害气体浓度升高,容易发生事故,起到预警作用。

  5 结论

  采煤工作面是煤矿事故多发地,大约占煤矿事故的40%之多;顶板、水灾、火灾、瓦斯、粉尘等灾害事故都在采煤工作面占有相当大的比例。应用大数据挖掘技术的采煤工作面安全预警专家系统,构建采煤工作面安全预警方法,以工作面安全监测、安全管理数据为基础,通过挖掘数据间的关联关系,实现工作面安全风险的识别与预警,对预防煤矿事故的发生起到积极作用。

Powered by 武汉制信科技有限公司 © 2013-2015 版权所有 ICP经营许可证:鄂B2-20080078(于2003年首获许可证:鄂B2-20030029)鄂公网安备:420100003343号
kutongji