|
|
معرفی روش mice در ترمیم دادههای گمشده هواشناسی و مقایسه با رگرسیون؛ مطالعه موردی: 130 سال دمای ماهانه مشهد، جاسک و بوشهر
|
|
|
|
|
نویسنده
|
فرزندی محبوبه ,رضائی پژند حجت
|
منبع
|
آب و توسعه پايدار - 1400 - دوره : 8 - شماره : 3 - صفحه:31 -42
|
چکیده
|
نیاز به دادههای کامل و قابل اطمینان اولین گام در مطالعات اقلیمی است. دادههای ناکامل، تحلیلهای اقلیمی را دچار چالش میکند. اغلب در آب و هواشناسی دادههای گمشده (ناکامل) وجود دارد. بنابراین کاملکردن دادهها (ترمیم) نیاز اولیه تحلیلهاست. روشهای متعددی برای بازسازی دادهها وجود دارند که بسته به نوع داده و خصوصیات آب و هوایی هر منطقه متفاوت میباشند. بارش و دما از مهمترین متغیرهای هوا و اقلیمشناسی هستند. طول دوره آماری اهمیت بسزایی در دقت تحلیل این دو متغیر دارد. دمای ماهانه سه شهر ایران شامل مشهد، بوشهر و جاسک از سال حدود 1890 در کتبی به نام world weather records موجود است. این اطلاعات دارای دادههای گمشده میباشد، مخصوصاً همزمان با جنگ جهانی دوم (1941-1949) این دادههای گمشده مشهودتر هستند. هدف این پژوهش، افزایش دقت برآورد این دادههای مفقود با معرفی روش کاربردی mice و ارائه سری کامل دمای ماهانه در طول 130 سال است. بدین منظور، ایستگاههایی از کشورهای مجاور بهعنوان ایستگاههای مبنا انتخاب شدند. ابتدا دادههای مفقود دمای ماهانه این سه ایستگاه با برازش الگوهای رگرسیونی ترمیم شدند (ریشه میانگین مربعات خطا 0/71 تا 0/94 درجه سانتیگراد). روش کلاسیک رگرسیون نیازمند بررسی فرضهای زیربنایی و آسیبشناسی است. این الگوها با روش mice نیز برآورد شدند (ریشه میانگین مربعات خطا 0/39 تا 0/82 درجه سانتیگراد). نتایج مطالعه و اجرای این بسته در محیط rstudio نشان از برتری این روش دارد. این روش برای دادههای مفقود طراحی شده، مشکلات رگرسیون را نداشته و قابلیتهای زیادی دارد. لذا برای ترمیم دادههای گمشده آب و هواشناسی پیشنهاد میشود.
|
کلیدواژه
|
داده گمشده، رگرسیون، الگوریتم mice، دما، فرضهای زیربنایی رگرسیون
|
آدرس
|
دانشگاه فردوسی مشهد, دانشکده کشاورزی, ایران, دانشگاه آزاد اسلامی واحد مشهد, ایران
|
|
|
|
|
|
|
|
|
|
|
Introduction of MICE Method for Imputation Missing Meteorological Data and Comparison by Regression; Case Study: 130 Years of Monthly Temperature in Mashhad, Jask and Bushehr
|
|
|
Authors
|
Farzandi Mahbobeh ,Rezaee-Pazhand Hojjat
|
Abstract
|
Requiring accurate, complete and reliable data is the first step in climate studies. Incomplete data challenges climate analysis. Missing (incomplete) data is often found in meteorology. Therefore, completing the data (imputation) is the primary need for analysis. There are several ways to imputation missing data that vary depending on the data type and climatic characteristics of each region. Precipitation and temperature are the most important variables of meteorology and climatology. The length of the statistical period plays a pivotal role in the accurate analysis of these variables. The monthly temperature of three cities in Iran, including Mashhad, Bushehr and Jask, has been available in a book called World Weather Records since about 1890. This information contains missing data, especially during World War II (19411949). This missing data is more visible. The purpose of this study is to increase the accuracy of estimating these missing data by introducing the applied MICE method and providing a complete series of monthly temperatures over 130 years. Stations from neighboring countries were selected as independent (predictor) stations in the patterns. First, the missing monthly temperature data of these three stations were estimated by fitting regression patterns (RMSE of 0.71 to 0.94 οC). The classical regression method requires the study of basic hypotheses and pattern pathology. These patterns were also estimated by the MICE method (RMSE of 0.39 to 0.82 οC). The results of the study and implementation of this package in Rstudio show the superiority of this method. This method is designed for missing data, does not have regression problems, and has many capabilities. Therefore, it is recommended to estimate missing meteorological data.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|