如何从海量数据中把造假企业“筛”出来,精准识别自动监测数据造假行为?为满足打击污染源自动监测数据弄虚作假工作需要,湖北省武汉市生态环境局近日应用AI技术构建企业排放特征模型、弄虚作假行为识别模型,全过程分析自动监测数据,可视化呈现监测数据异常特征。
数据建模是一种以清晰有条理的方式组织和表示数据的方法,有助于识别和纠正数据中的错误和不一致性,从而提升数据的整体质量。那么,模型如何抓取数据并进行分析?据武汉市生态环境宣教中心技术人员介绍,武汉与第三方合作已构建涉及废水、废气排放两大类的多种行为AI识别模型,模型对接市本级污染源自动监控系统数据库,实时调取污染源自动监控历史数据,包括日数据、小时数据、分钟数据以及标记数据,并对数据质量进行监控,智能分析出疑似违法行为,并形成初步线索清单。接下来,再按照污染因子连续超标、重污染天气大气污染物排放不减反增、做样周期设置不规范、自动标样核查不规范、运维频次不规范等问题进行分类,运用12类模型,通过漏斗式筛选,逐步排查,剔除低频事件、客观因素,找到异常企业,分析异常企业是否存在连续超标、排放总量异常等状况,以及疑似超标人为断电、疑似设置量程上限、人为干扰分析仪等弄虚作假违法行为,依据疑似违法企业数据选取时间段、数据类型、数据特征,生成模型研判报告,并用多维数据图表的形式直观呈现。“基于企业排放特征和历史监测数据,对异常数据进行自动筛查,与相关模型数据相比对,能在第一时间识别出疑似企业人为干扰自动监测数据的行为。”武汉市生态环境宣教中心技术人员说。有了线索,锁定违法企业就不再困难。武汉市生态环境部门的工作人员每月一次输入《市污染源自动监控涉嫌违法企业清单》,并在清单中进一步筛选,输出某家重点企业分析报告。报告包括违法企业的数据特征识别、当前以及历史违法违规情况研判、相关结论以及现场检查指南,为现场执法检查提供精准支持。经人工研判后,线索可在电脑端和手机端(微信小程序)系统内流转,执法人员现场核查并及时反馈,形成污染源自动监控常规巡查的工作闭环。目前,武汉市非现场监管平台已具备提供不同时间段排放量的比对功能,通过对排放数据的持续追踪和比对,平台能够及时发现异常排放情况,一键导出企业不同时段数据比对的减排率,以便在空气重污染情况下相关部门迅速响应并采取应急减排措施。自2024年4月30日开展非现场执法监管数据分析以来,武汉市生态环境局利用非现场监管一张图进行精确统计和计算,为大气污染应急减排的排放量提供了坚实的数据支撑。在2024年7月的大气污染减排工作中,这一平台有效协助大气处及科技中心完成了排放大户清单的梳理工作。为助力构建精准科学的执法体系,武汉市生态环境局运用物联网、AI智能等先进技术手段,通过基于人工智能的模型工具开展分析研判,输出精准线索,并引入技术力量开展现场检查服务,精准识别违法行为,规范现场检查。2024年,运用污染源在线AI线索生成机制,武汉生态环境局已成功发现污染源在线监测预警线索431条,均已核实处理。在此期间,专家团队依托AI模型分析污染源自动监控弄虚作假线索,参与7次现场辅助执法行动,输出数据分析报告3份、现场检查报告5份,成功查实了两家企业存在违法行为,一家企业相关负责人入刑,一家企业被处罚。此外,专家在现场辅助执法过程中,深入分析企业的违法情况,并针对性地提出整改建议。目前,这些企业已开始按照要求进行整改,并取得了初步成效。