基于孤立森林算法的取用水量异常数据检测方法

更新时间:2023-05-28

《中国水利水电科学研究院学报》2020年01期

【摘要】水资源管理系统中储存着海量的取用水量数据,通过筛选数据中的异常值定位异常取水行为,是水资源监管的重要手段。对取用水量数据中的异常值普遍缺乏明确定义,传统的异常值检测算法在实时性和稳定性方面存在不足。在总结归纳现阶段取用水量异常数据种类、特点的基础上,首先运用平均插值法对可直观识别异常值进行预处理,在预处理后的数据中随机取样训练,建立多个孤立二叉树形成孤立森林,以此为工具对数据样本进行异常值检测。对某供水公司连续两年日取水量监测数据的实证分析结果表明,基于孤立森林算法的异常值检测方法将数据样本的特征通过非监督学习方式存储在森林中,具有更高的稳定性;能够准确检测出数据样本中的异常值,相比于传统最小二乘拟合方法具有更高的检出率。

【关键词】水资源监测异常数据平均插值孤立森林最小二乘拟合

全网下载: 12 页数: 2页价格: 免费来源:

发表评论

登录后发表评论 (已发布 0条)

点亮你的头像秀出你的观点

0/500

以上留言仅代表用户个人观点，不代表中教立场

基于孤立森林算法的取用水量异常数据检测方法

更新时间:2023-05-28

发表评论

热门文献

精选文献

推荐期刊