>
Fa   |   Ar   |   En
   تخمین عددی شاخص کیفی آب شرب با استفاده از روش‌های درختی و رویکردهای ترکیبی موجک و تحلیل مولفه اصلی  
   
نویسنده ستاری محمدتقی ,جاویدان سحر
منبع آب و خاك - 1401 - دوره : 36 - شماره : 6 - صفحه:695 -709
چکیده    آگاهی از کیفیت آب، یکی از نیازهای مهم در برنامه‌ریزی، توسعه و حفاظت از منابع آب برای مصارف مختلف از جمله شرب به شمار می‌رود. استفاده از روش‌های مدرن داده‌کاوی، می‌تواند رویکرد مناسبی برای پیش‌بینی و طبقه‌بندی کیفیت آب باشد. در پژوهش حاضر، برای محاسبه شاخص کیفی آب شرب از پارامترهای شیمیایی شامل سختی کل، قلیائیت، هدایت الکتریکی، کل مواد جامد محلول، کلسیم، سدیم، منیزیم، پتاسیم، کلر، کربنات، بی کربنات و سولفات ایستگاه هیدرومتری باغ کلایه استان قزوین، در دوره آماری 23 ساله (1998-2020) استفاده شد. روش درخت تصادفی برای تخمین و مدل‌سازی مقادیر عددی شاخص کیفی آب شرب براساس ترکیب‌های مختلفی از پارامترهای شیمیایی به کار برده شد. ماتریس همبستگی و الگوریتم رلیف، مبنای انتخاب ترکیب‌های مختلفی از پارامترهای شیمیایی به‌عنوان ورودی روش‌های داده‌کاوی در قالب سناریوهای مختلف در نظر گرفته شدند. در جهت بهبود نتایج تخمین عددی شاخص کیفی آب شرب، از رویکرد‌های تبدیل موجک، دسته‌بندی مدل‌ها و تحلیل مولفه اصلی استفاده شد. بررسی نتایج نشان داد که ترکیب 3 روش تحلیل مولفه اصلی (با در نظر گرفتن 3 عامل اصلی)، رویکرد پیش‌پردازش bagging و درخت تصادفی، با ضریب همبستگی برابر با 0.98، ریشه میانگین مربعات خطا برابر با 2.17، میانگین خطای قدر مطلق برابر با 1.52 و ضریب ویلموت اصلاح شده برابر با 0.97 می‌تواند دقت بالایی در تخمین مقادیر عددی شاخص کیفی آب شرب داشته باشد. براساس نتایج کلی به دست آمده، در صورت کمبود نمونه‌های آزمایشگاهی و یا عدم دسترسی به تمام پارامترهای شیمیایی، روش‌های معرفی شده در این مطالعه، به علت دقت بالا جهت تخمین شاخص کیفی آب شرب قابل توصیه خواهند بود.
کلیدواژه الگوریتم رلیف، تبدیل موجک، تحلیل مولفه اصلی، رویکرد پیش‌پردازش bagging، ضریب ویلموت اصلاح شده
آدرس دانشگاه تبریز, دانشکده کشاورزی, گروه علوم و مهندسی آب, ایران, دانشگاه تبریز, دانشکده کشاورزی, گروه علوم و مهندسی آب, ایران
پست الکترونیکی javidansahar77115@gmail.com
 
   numerical estimation of drinking water quality index using tree methods and combined wavelet approaches and principal component analysis  
   
Authors sattari m.t. ,javidan s.
Abstract    introductionsurface and underground waters are one of the world’s most important problems and environmental concerns. in the last few decades, due to the rapid growth of the population, the water needs have increased, followed by the input load to the water. in order to classify the quality of underground water and water level according to the type of consumption, there are many methods, one of the most used methods is the use of quality indicators. considering the facilities available in water quality monitoring stations and the need to save time and money, using alternative methods of modern data mining methods can be good for predicting and classifying water quality. the process of water extraction for domestic use, agricultural production, mineral industrial production, electricity production, and ester methods can lead to the deterioration of water quality and quantity, which affects the aquatic ecosystem, that is, the set of organisms that live and interact. therefore, it is very important to evaluate the quality of surface water in water-environmental management and in monitoring the concentration of pollutants in rivers. the aim of the current research was to estimate the numerical values of the drinking water quality index (wqi) using the tree method and investigate the effect of wavelet transformation, the bagging method, and principal component analysis.materials and methodsin this research, to calculate the wqi index from the quality parameters of the bagh kalaye hydrometric station including total hardness (th), alkalinity (ph), electrical conductivity (ec), total dissolved solids (tds), calcium (ca), sodium (na), magnesium (mg), potassium (k), chlorine (cl), carbonate (co3), bicarbonate (hco3) and sulfate (so4) were used in the statistical period of 23 years (1998-2020). quantitative values calculated with the wqi index were considered as target outputs. by using the relief and correlation method, the types of input combinations were determined. the random tree method was used to estimate the numerical values of the wqi index. then, the capability of the combined approach of wavelet, principal component analysis, and bagging method with random tree base algorithm was evaluated. to compare the values obtained from the data mining methods with the values calculated from the wqi index, the evaluation criteria of correlation coefficient (r), root mean square error (rmse), mean absolute error (mae), and modified wilmot coefficient (dr) were used.results and discussionthe use of the wavelet transform method and the bagging method has improved the modeling results. considering that the bagging classification method with the random tree base algorithm is a combination of the results of several random trees, so using this method has increased the accuracy of the rt model. so, in general, it was concluded that the use of wavelet transformation and classification methods increases accuracy and reduces errors. the best scenario with the highest accuracy and the lowest error was related to scenario 10 of the w-b-rt model with total hardness, electrical conductivity, total dissolved solid, sulphate, calcium, bicarbonate, magnesium, chlorine, sodium, and potassium parameters. the results showed that the effect impact of ph in estimating the numerical value of the wqi index is considered lower than other parameters. when the principal component analysis method was used, by reducing the value of the eigenvalue from f1 to f12, the value of the factor also decreased; as a result,so f1, f2, and f3 factors were selected as the basic components. considering 3 main factors, modeling was done employed and r=0.98, rmse=2.17, mae=1.52, and dr=0.97 were obtained. in general, the results showed that the pca method, despite reducing the dimension of the input vectors and simplifying it, can improve the accuracy and speed of the model and is introduced as the best method for estimating the numerical value of the wqi index.conclusionthe results obtained from the present research showed that the use of wavelet transform, bagging and pca methods had a positive effect on improving the results and increasing higherthe accuracy. in estimating the numerical values of wqi index, pca-b-rt method considering 3 main factors, with correlation coefficient equal to 0.98, root mean square error equal to 2.17, average absolute value error equal to 1.52 and tthe modified wilmot coefficient equal to 0.97 had the highest accuracy. considering that all the methods used in the estimation of quantitative values had acceptable accuracy, therefore, in case of lack of data and lack of access to all chemical parameters, it is possible to obtain appropriate and acceptable results by using a limited number of parameters and data mining methods achieved.
Keywords bagging preprocessing approach ,modified wilmot coefficient ,principal component analysis ,relief algorithm ,wavelet transform
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved