|
|
مقابله با مخاطرات ناشی از غلظت آلایندۀ pm2.5 با بهکارگیری روشهای رگرسیونی و شباهت مکانی-زمانی و تخمین مقادیر گمشده در سری زمانی آنها (مطالعۀ موردی: شهر تهران)
|
|
|
|
|
نویسنده
|
فرجی مرجان ,نادی سعید
|
منبع
|
مديريت مخاطرات محيطي - 1399 - دوره : 7 - شماره : 3 - صفحه:299 -312
|
چکیده
|
با توجه به تاثیر نامطلوب آلایندهها بر محیط زیست و سلامت انسان، تجزیهوتحلیل دادههای کیفیت هوا اهمیت زیادی در حفاظت از محیط زیست و رویارویی با مشکلات آلودگی هوا دارد. دادههای گمشده در سریهای زمانی بهخصوص دادههای مربوط به آلودگی هوا موجب بروز چالشی ویژه در برابر آنالیز این دادهها میشود که ضرورت استفاده از روشهایی با عنوان جانهی را برای مقابله با این پدیده نمایان میکند. مقادیر گمشده، موجب کاهش حجم داده و تغییر الگوهای زمانی موجود در دادهها و نتیجهگیری اشتباه در تجزیهوتحلیل دادهها میشود. در این پژوهش بهمنظور جانهی مقادیر ازدسترفته در دادههای سری زمانی غلظت آلایندۀ از 12 ایستگاه سنجش آلودگی شهر تهران، روشی ترکیبی برمبنای رگرسیون جانهی با در نظر گرفتن وابستگی و شباهتهای مکانی و زمانی بین ایستگاهها توسط الگوریتم پیچش زمانی پویا معرفی شده است. دادههایی با مقادیر گمشده با الگویی مشابه با دادههای اصلی در دامنۀ 10، 15 و 20 درصد گمشدگی در دادهها با هدف ارزیابی عملکرد مدلهای جانهی شبیهسازی شدند. سپس روش پیشنهادی در ترکیب با روشهای مختلف جانهی چندگانه همانند روش طبقهبندی و رگرسیون درختی، نمونۀ تصادفی و میانگین تطابق پیشبینی کننده، اجرا و نتایج با روشهای جانهی منفرد مقایسه شد. نتایج بیانگر برتری روش معرفیشده در ترکیب با رگرسیون درختی در مقایسه با دیگر روشهای جانهی چندگانه و منفرد است.
|
کلیدواژه
|
آلایندۀ pm2.5، جانهی منفرد و چندگانه، دادههای گمشده، مخاطرات، معیار شباهت dtw
|
آدرس
|
دانشگاه اصفهان, دانشکدۀ مهندسی عمران و حملونقل, ایران, دانشگاه اصفهان, دانشکدۀ مهندسی عمران و حملونقل, گروه مهندسی نقشهبرداری, ایران
|
پست الکترونیکی
|
snadi@eng.ui.ac.ir
|
|
|
|
|
|
|
|
|
Dealing with the hazards caused by the concentration of pollutants PM2.5 by using regression methods and spatiotemporal similarity in order to impute the missing values in their time series (Case study of Tehran)
|
|
|
Authors
|
Faraji Marjan ,Nadi Saeed
|
Abstract
|
Due to the adverse effects of pollutants on the environment and human health, the analysis of air quality data has an important role in protecting the environment and tackling air pollution problems. Missing data in time series, especially air pollution data, Cause a particular challenge to the analysis of these data, which show the importance of using methods known as imputation in order to deal with this phenomenon. Missing values reduce the volume of data, change time patterns in data and make inaccurate conclusions in data analysis. In this study, in order to estimate the missing values in time series data of PM_2.5 pollutant concentration from 12 contamination stations in Tehran, a hybrid algorithm based on regression algorithm considering spatial and temporal similarities and dependence by dynamic time wrapping algorithm is presented. Data with missing values with a pattern similar to the original data were simulated in the interval of 10, 15 and 20% missing in data, with the aim of evaluating the performance of the single and multiple imputation models. Then the proposed method in combination with different multiple imputation methods such as classification and regression tree, random sample and predictive mean matching, have been implemented and results have been compared with single imputation methods. Implementation results indicated the superiority of the proposed method combined with regression tree and linear interpolation compared to other methods of multiple and single imputation
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|