【摘要】水资源管理系统中储存着海量的取用水量数据,通过筛选数据中的异常值定位异常取水行为,是水资源监管的重要手段。对取用水量数据中的异常值普遍缺乏明确定义,传统的异常值检测算法在实时性和稳定性方面存在不足。在总结归纳现阶段取用水量异常数据种类、特点的基础上,首先运用平均插值法对可直观识别异常值进行预处理,在预处理后的数据中随机取样训练,建立多个孤立二叉树形成孤立森林,以此为工具对数据样本进行异常值检测。对某供水公司连续两年日取水量监测数据的实证分析结果表明,基于孤立森林算法的异常值检测方法将数据样本的特征通过非监督学习方式存储在森林中,具有更高的稳定性;能够准确检测出数据样本中的异常值,相比于传统最小二乘拟合方法具有更高的检出率。
【关键词】
《建筑知识》 2015-05-12
《中国医疗管理科学》 2015-05-12
《中国医疗管理科学》 2015-05-12
《中国医疗管理科学》 2015-05-12
《华侨大学学报(哲学社会科学版)》 2015-07-07
《中外医疗》 2015-07-06
《阅江学刊》 2015-07-02
《广西广播电视大学学报》 2015-07-01
Copyright © 2013-2016 ZJHJ Corporation,All Rights Reserved
发表评论
登录后发表评论 (已发布 0条)点亮你的头像 秀出你的观点