>
Fa   |   Ar   |   En
   مقابله با مخاطرات ناشی از غلظت آلایندۀ Pm2.5 با به‌کارگیری روش‌های رگرسیونی و شباهت مکانی-زمانی و تخمین مقادیر گم‌شده در سری زمانی آنها (مطالعۀ موردی: شهر تهران)  
   
نویسنده فرجی مرجان ,نادی سعید
منبع مديريت مخاطرات محيطي - 1399 - دوره : 7 - شماره : 3 - صفحه:299 -312
چکیده    با توجه به تاثیر نامطلوب آلاینده‌ها بر محیط زیست و سلامت انسان، تجزیه‌وتحلیل داده‌های کیفیت هوا اهمیت زیادی در حفاظت از محیط زیست و رویارویی با مشکلات آلودگی هوا دارد. داده‌های گم‌شده در سری‌های زمانی به‌خصوص داده‌های مربوط به آلودگی هوا موجب بروز چالشی ویژه در برابر آنالیز این داده‌ها می‌شود که ضرورت استفاده از روش‌هایی با عنوان جانهی را برای مقابله با این پدیده نمایان می‌کند. مقادیر گم‌شده، موجب کاهش حجم داده و تغییر الگوهای زمانی موجود در داده‌ها و نتیجه‌گیری اشتباه در تجزیه‌وتحلیل داده‌ها می‌شود. در این پژوهش به‌منظور جانهی مقادیر از‌دست‌رفته ‌در داده‌های سری زمانی غلظت آلایندۀ  از 12 ایستگاه سنجش آلودگی شهر تهران، روشی ترکیبی برمبنای رگرسیون جانهی با در نظر گرفتن وابستگی و شباهت‌های مکانی و زمانی بین ایستگاه‌ها توسط الگوریتم پیچش زمانی پویا معرفی شده است. داده‌هایی با مقادیر گم‌شده با الگویی مشابه با داده‌های اصلی در دامنۀ 10، 15 و 20 درصد گم‌شدگی در داده‌ها با هدف ارزیابی عملکرد مدل‌های جانهی شبیه‌سازی شدند. سپس روش پیشنهادی در ترکیب با روش‌های مختلف جانهی چندگانه همانند روش طبقه‌بندی و رگرسیون درختی، نمونۀ تصادفی و میانگین تطابق پیش‌بینی کننده، اجرا و نتایج با روش‌های جانهی منفرد مقایسه شد. نتایج بیانگر برتری روش معرفی‌شده در ترکیب با رگرسیون درختی در مقایسه با دیگر روش‌های جانهی چندگانه و منفرد است.
کلیدواژه آلایندۀ Pm2.5، جانهی منفرد و چندگانه، داده‌های گم‌شده، مخاطرات، معیار شباهت Dtw
آدرس دانشگاه اصفهان, دانشکدۀ مهندسی عمران و حمل‌ونقل, ایران, دانشگاه اصفهان, دانشکدۀ مهندسی عمران و حمل‌ونقل, گروه مهندسی نقشه‌برداری, ایران
پست الکترونیکی snadi@eng.ui.ac.ir
 
   Dealing with the hazards caused by the concentration of pollutants PM2.5 by using regression methods and spatiotemporal similarity in order to impute the missing values in their time series (Case study of Tehran)  
   
Authors Faraji Marjan ,Nadi Saeed
Abstract    Due to the adverse effects of pollutants on the environment and human health, the analysis of air quality data has an important role in protecting the environment and tackling air pollution problems. Missing data in time series, especially air pollution data, Cause a particular challenge to the analysis of these data, which show the importance of using methods known as imputation in order to deal with this phenomenon. Missing values reduce the volume of data, change time patterns in data and make inaccurate conclusions in data analysis. In this study, in order to estimate the missing values in time series data of PM_2.5 pollutant concentration from 12 contamination stations in Tehran, a hybrid algorithm based on regression algorithm considering spatial and temporal similarities and dependence by dynamic time wrapping algorithm is presented. Data with missing values with a pattern similar to the original data were simulated in the interval of 10, 15 and 20% missing in data, with the aim of evaluating the performance of the single and multiple imputation models. Then the proposed method in combination with different multiple imputation methods such as classification and regression tree, random sample and predictive mean matching, have been implemented and results have been compared with single imputation methods. Implementation results indicated the superiority of the proposed method combined with regression tree and linear interpolation compared to other methods of multiple and single imputation
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved