>
Fa   |   Ar   |   En
   معرفی روش mice در ترمیم داده‌های گمشده هواشناسی و مقایسه با رگرسیون؛ مطالعه موردی: 130 سال دمای ماهانه مشهد، جاسک و بوشهر  
   
نویسنده فرزندی محبوبه ,رضائی پژند حجت
منبع آب و توسعه پايدار - 1400 - دوره : 8 - شماره : 3 - صفحه:31 -42
چکیده    نیاز به داده‌های کامل و قابل اطمینان اولین گام در مطالعات اقلیمی است. داده‌های ناکامل، تحلیل‌های اقلیمی را دچار چالش می‌کند. اغلب در آب و هواشناسی داده‌های گمشده (ناکامل) وجود دارد. بنابراین کامل‌کردن داده‌ها (ترمیم) نیاز اولیه تحلیل‌هاست. روش‌های متعددی برای بازسازی داده‌ها وجود دارند که بسته به نوع داده و خصوصیات آب و هوایی هر منطقه متفاوت می‌باشند. بارش و دما از مهم‌ترین متغیرهای هوا و اقلیم‌شناسی هستند. طول دوره آماری اهمیت بسزایی در دقت تحلیل این دو متغیر دارد. دمای ماهانه سه شهر ایران شامل مشهد، بوشهر و جاسک از سال حدود 1890 در کتبی به نام world weather records موجود است. این اطلاعات دارای داده‌های گمشده می‌باشد، مخصوصاً همزمان با جنگ جهانی دوم (1941-1949) این داده‌های گمشده‌ مشهودتر هستند. هدف این پژوهش، افزایش دقت برآورد این داده‌های مفقود با معرفی روش کاربردی mice و ارائه سری کامل دمای ماهانه در طول 130 سال است. بدین منظور، ایستگاه‌هایی از کشورهای مجاور به‌عنوان ایستگاه‌های مبنا انتخاب شدند. ابتدا داده‌های مفقود دمای ماهانه این سه ایستگاه با برازش الگوهای رگرسیونی ترمیم شدند (ریشه میانگین مربعات خطا 0/71 تا 0/94 درجه سانتیگراد). روش‌ کلاسیک رگرسیون نیازمند بررسی فرض‌های زیربنایی و آسیب‌شناسی است. این الگوها با روش mice نیز برآورد شدند (ریشه میانگین مربعات خطا 0/39 تا 0/82 درجه سانتیگراد). نتایج مطالعه و اجرای این بسته در محیط rstudio نشان از برتری این روش دارد. این روش برای داده‌های مفقود طراحی شده، مشکلات رگرسیون را نداشته و قابلیت‎های زیادی دارد. لذا برای ترمیم داده‌های گمشده آب و هواشناسی پیشنهاد می‌شود.
کلیدواژه داده گمشده، رگرسیون، الگوریتم mice، دما، فرض‌های زیربنایی رگرسیون
آدرس دانشگاه فردوسی مشهد, دانشکده کشاورزی, ایران, دانشگاه آزاد اسلامی واحد مشهد, ایران
 
   Introduction of MICE Method for Imputation Missing Meteorological Data and Comparison by Regression; Case Study: 130 Years of Monthly Temperature in Mashhad, Jask and Bushehr  
   
Authors Farzandi Mahbobeh ,Rezaee-Pazhand Hojjat
Abstract    Requiring accurate, complete and reliable data is the first step in climate studies. Incomplete data challenges climate analysis. Missing (incomplete) data is often found in meteorology. Therefore, completing the data (imputation) is the primary need for analysis. There are several ways to imputation missing data that vary depending on the data type and climatic characteristics of each region. Precipitation and temperature are the most important variables of meteorology and climatology. The length of the statistical period plays a pivotal role in the accurate analysis of these variables. The monthly temperature of three cities in Iran, including Mashhad, Bushehr and Jask, has been available in a book called World Weather Records since about 1890. This information contains missing data, especially during World War II (19411949). This missing data is more visible.  The purpose of this study is to increase the accuracy of estimating these missing data by introducing the applied MICE method and providing a complete series of monthly temperatures over 130 years. Stations from neighboring countries were selected as independent (predictor) stations in the patterns. First, the missing monthly temperature data of these three stations were estimated by fitting regression patterns (RMSE of 0.71 to 0.94 οC). The classical regression method requires the study of basic hypotheses and pattern pathology. These patterns were also estimated by the MICE method (RMSE of 0.39 to 0.82 οC). The results of the study and implementation of this package in Rstudio show the superiority of this method. This method is designed for missing data, does not have regression problems, and has many capabilities. Therefore, it is recommended to estimate missing meteorological data.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved