عنوان مقاله :
معرفي روش MICE در ترميم دادههاي گمشده هواشناسي و مقايسه با رگرسيون؛ مطالعه موردي: 130 سال دماي ماهانه مشهد، جاسك و بوشهر
عنوان به زبان ديگر :
Introduction of MICE Method for Imputation Missing Meteorological Data and Comparison by Regression; Case Study: 130 Years of Monthly Temperature in Mashhad, Jask and Bushehr
پديد آورندگان :
فرزندي، محبوبه دانشگاه فردوسي مشهد - دانشكده كشاورزي، ايران , رضائي پژند، حجت دانشگاه آزاد اسلامي مشهد، ايران
كليدواژه :
داده گمشده , فرضهاي زيربنايي رگرسيون , رگرسيون , الگوريتم MICE , دما
چكيده فارسي :
نياز به دادههاي كامل و قابل اطمينان اولين گام در مطالعات اقليمي است. دادههاي ناكامل، تحليلهاي اقليمي را دچار چالش ميكند. اغلب در آب و هواشناسي دادههاي گمشده (ناكامل) وجود دارد. بنابراين كاملكردن دادهها (ترميم) نياز اوليه تحليلهاست. روشهاي متعددي براي بازسازي دادهها وجود دارند كه بسته به نوع داده و خصوصيات آب و هوايي هر منطقه متفاوت ميباشند. بارش و دما از مهمترين متغيرهاي هوا و اقليمشناسي هستند. طول دوره آماري اهميت بسزايي در دقت تحليل اين دو متغير دارد. دماي ماهانه سه شهر ايران شامل مشهد، بوشهر و جاسك از سال حدود 1890 در كتبي به نام World Weather Records موجود است. اين اطلاعات داراي دادههاي گمشده ميباشد، مخصوصاً همزمان با جنگ جهاني دوم (1941-1949) اين دادههاي گمشده مشهودتر هستند. هدف اين پژوهش، افزايش دقت برآورد اين دادههاي مفقود با معرفي روش كاربردي MICE و ارائه سري كامل دماي ماهانه در طول 130 سال است. بدين منظور، ايستگاههايي از كشورهاي مجاور بهعنوان ايستگاههاي مبنا انتخاب شدند. ابتدا دادههاي مفقود دماي ماهانه اين سه ايستگاه با برازش الگوهاي رگرسيوني ترميم شدند (ريشه ميانگين مربعات خطا 0/71 تا 0/94 درجه سانتيگراد). روش كلاسيك رگرسيون نيازمند بررسي فرضهاي زيربنايي و آسيبشناسي است. اين الگوها با روش MICE نيز برآورد شدند (ريشه ميانگين مربعات خطا 0/39 تا 0/82 درجه سانتيگراد). نتايج مطالعه و اجراي اين بسته در محيط Rstudio نشان از برتري اين روش دارد. اين روش براي دادههاي مفقود طراحي شده، مشكلات رگرسيون را نداشته و قابليتهاي زيادي دارد. لذا براي ترميم دادههاي گمشده آب و هواشناسي پيشنهاد ميشود.
چكيده لاتين :
Requiring accurate, complete and reliable data is the first step in climate studies. Incomplete data challenges climate analysis. Missing (incomplete) data is often found in meteorology. Therefore, completing the data (imputation) is the primary need for analysis. There are several ways to imputation missing data that vary depending on the data type and climatic characteristics of each region. Precipitation and temperature are the most important variables of meteorology and climatology. The length of the statistical period plays a pivotal role in the accurate analysis of these variables. The monthly temperature of three cities in Iran, including Mashhad, Bushehr and Jask, has been available in a book called World Weather Records since about 1890. This information contains missing data, especially during World War II (1941-1949). This missing data is more visible. The purpose of this study is to increase the accuracy of estimating these missing data by introducing the applied MICE method and providing a complete series of monthly temperatures over 130 years. Stations from neighboring countries were selected as independent (predictor) stations in the patterns. First, the missing monthly temperature data of these three stations were estimated by fitting regression patterns (RMSE of 0.71 to 0.94 οC). The classical regression method requires the study of basic hypotheses and pattern pathology. These patterns were also estimated by the MICE method (RMSE of 0.39 to 0.82 οC). The results of the study and implementation of this package in Rstudio show the superiority of this method. This method is designed for missing data, does not have regression problems, and has many capabilities. Therefore, it is recommended to estimate missing meteorological data.
عنوان نشريه :
آب و توسعه پايدار