|
|
مدلسازی تشخیص مصرف غیرمجاز آب (مطالعه موردی: شهر قم)
|
|
|
|
|
نویسنده
|
امینی قاسم
|
منبع
|
آب و فاضلاب - 1399 - دوره : 31 - شماره : 4 - صفحه:184 -193
|
چکیده
|
شناسایی کنتورهای دستکاری شده آب، بهعنوان بخشی از مصارف غیرمجاز یکی از گامهای اساسی در توسعه خدماترسانی و افزایش بهرهوری از منابع آب به حساب میآید که باید به آن توجه کرد. دادههای مورد استفاده برای شناسایی مصرف غیرمجاز حاصل از دستکاری کنتور شامل تعداد 671 مشترک با سابقه دستکاری کنتور در سالهای 98-96 و یک نمونه تصادفی 3120 تایی از مشترکان بدون سابقه دستکاری (سالم) در کاربری خانگی شهر قم است. بهمنظور تحلیل دادهها از سابقه مصرف و پرداخت صورتحساب مشترکان و همچنین روشهای با نظارت داده کاوی از قبیل درخت تصمیم، ماشینبردار پشتیبان، شبکه عصبی، رگرسیون لجستیک، نزدیکترین همسایگی و روش بدون نظارت خوشهبندی استفاده شد. مقایسه روشهای مختلف داده کاوی بین دو گروه کنتورهای دستکاری شده و سالم نشان داد در بین روشهای با نظارت، دقت مدلها نزدیک یکدیگر است و اختلاف 1 تا 3 درصدی بین آنها وجود دارد. از طرفی با توجه به درصد پاسخ صحیح در بین روشها، رگرسیون لجستیک با تشخیص صحیح 85 درصد موارد دستکاری شده و 91 درصد موارد سالم و دقت کلی 89 درصد بر روی دادههای تست بهعنوان بهترین مدل برای شناسایی کنتورهای دستکاری شده میتواند استفاده شود. همچنین با استفاده از خوشهبندی بهعنوان یک روش بدون نظارت، مشترکان در 6 خوشه دستهبندی و خوشه شماره 3 با تعداد 160 مشترک، رفتار مجزایی از سایر خوشهها نشان داد. 86 درصد اشتراکهای این خوشه شامل موارد دستکاری شده بودند و 18 درصد از موارد دستکاری تشخیص داده شده توسط رگرسیون لجستیک در این خوشه قرار گرفت. این پژوهش به ارائه مدلهایی برای شناسایی موارد دستکاری کنتور آب توسط تکنیکهای داده کاوی پرداخته است. با توجه به یافتههای پژوهش، بهمنظور شناسایی مصارف غیرمجاز آب، میتوان از هر دو روش با نظارت (شامل متغیر پاسخ) و بدون نظارت (بدون نیاز به متغیر پاسخ) مانند خوشهبندی استفاده کرد. در این پژوهش رگرسیون لجستیک با دقت زیاد بهعنوان مناسبترین مدل برای شناسایی کنتورهای دستکاری شده انتخاب شد.
|
کلیدواژه
|
داده کاوی، مصرف غیرمجاز، دستکاری کنتور، رگرسیون لجستیک، خوشهبندی
|
آدرس
|
شرکت آب و فاضلاب شهری استان قم, ایران
|
پست الکترونیکی
|
ghasem2094.amini@gmail.com
|
|
|
|
|
|
|
|
|
Modeling of Unauthorized Water Consumption Detection (Case Study: Qom)
|
|
|
Authors
|
Amini Ghasem
|
Abstract
|
Detection of tampering in water meters as part of unauthorized usage is a key step in development of service delivery and increasing water resource productivity, and requires special attention. Data used to identify unauthorized water usage, due to tampering in water meters, include 671 subscribers with a history of meter tampering during the years 20172019 and a random sample of 3120 subscribers with no tampering record (clean) among Qom’s residential water users. Data analysis was conducted using subscriber’s water consumption and invoice payment history as well as supervised data mining techniques such as decision tree, support vector machine, neural network, logistic regression, Knearest neighbor and unsupervised clustering method. The comparison of different data mining techniques between two groups of tampered and nontampered water meters showed that among the supervised methods, the accuracy of the models is close to each other and there is a 1–3% difference between them. On the other hand, given the percentage of correct responses among the methods, logistic regression, as the best data mining model, with correct detection of 85% of tampered and 91% of nontampered cases as well as 89% overall accuracy on the testing data, can be used for identification of tampered meters. The study used clustering as an unsupervised technique. The subscribers were grouped into six clusters. Cluster 3 (n=160 subscribers) showed distinct behavior from the other clusters. About 86% of subscriptions in cluster 3 are tampered cases. Moreover, 18% of the tampered cases detected by logistic regression are in this cluster. Data mining techniques for identification of water meter tampering were presented in this study. Findings of the study indicated that both supervised (including response variable) and unsupervised methods (no response variable) such as clustering can be used for the identification of unauthorized water consumption In this study, logistic regression, due to its high accuracy, was selected as the most appropriate model for detection of tampered meters.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|