>
Fa   |   Ar   |   En
   تحلیل توزیع مکانی و زمانی رخدادهای طبیعی ایران از سال 1390 تا 1400 بر پایه گزارش‌های خبری  
   
نویسنده شاخصی مهدی ,آل شیخ علی اصغر
منبع علوم و فنون نقشه برداري - 1401 - دوره : 12 - شماره : 1 - صفحه:63 -79
چکیده     رخدادهای طبیعی اغلب با تاثیرات اجتماعی، اقتصادی و محیطی همراه می‌شوند. هر چند سنجنده‌های مختلفی در امر پایش این رخدادها می‌توانند بکار گرفته شوند ولی تحلیل کارآمد این رخدادها نیازمند توسعه پایگاه‌داده‌هایی متشکل از رخدادها و اطلاعات مکانی، زمانی و توصیفی آن‌ها است. برای توسعه سیاهه رخدادها، می‌توان از رسانه‌های جمعی و اجتماعی به خاطر دربرگرفتن اطلاعات جزئی‌تر در مقایسه با گزارش‌های سالیانه، بهره برد. در این پژوهش، با کمک تکنیک‌های متن‌کاوی چارچوبی برای استخراج خودکار رخدادهای طبیعی از گزارش‌های خبری توسعه داده شده است. پس از وبکاوی اخبار و حذف موارد غیرمرتبط با رخدادهای طبیعی، استانداردسازی متن انجام می‌شود. در ادامه، با کمک مدل‌های مبتنی بر یادگیری ماشین نخست مشخص می‌شود که خبر درباره رخدادی جدید یا جاری است و دوم در قالب چه موضوعی به رخداد طبیعی پرداخته شده است (مقادیر 875.0 و 716.0 به ترتیب برای f-score مدل‌های طبقه‌بندی اول و دوم اخذ شده است). همچنین با بهره‌گیری از مدلی قاعده محور انواع رخدادهای مطرح‌شده شناسایی می‌شود. بعد از تشخیص جاینام‌های مدیریتی، به ازای هر «نوع رخداد-جاینام» اطلاعات زمانی و توصیفی از هر خبر استخراج می‌شود. در آخر، رخدادهای طبیعی به همراه گزارش‌های خبری مربوطه شناسایی گردآوری می‌شوند. نتایج پیاده‌سازی این چارچوب برای کشور ایران از آغاز 1390 تا پایان 1399 براساس اخبار خبرگزاری مهر در بخش‌های بررسی محتوای خبری مرتبط با رخدادهای طبیعی، تحلیل توزیع‌ مکانی و زمانی رخدادها ارائه شده است. طبق نتایج تحقیق، از نظر زمانی تعداد کل رخدادها در ماه‌های آغازین و پایانی سال بیشتر است. از لحاظ مکانی، فارغ از حجم خسارات، استان‌های جنوبی بیشتر از استان‌های شمالی رخداد زمین‌لرزه گزارش می‌شود. در مقابل، تنوع رخدادهای هواشناسی در استان‌های شمالی بیشتر است. خروجی این تحقیق می‌تواند در افزایش کارآمدی مدیریت بحران مورد استفاده قرار گیرد.
کلیدواژه رخداد طبیعی، توزیع مکانی و زمانی، گزارش‌های خبری، متن کاوی، استخراج اطلاعات
آدرس دانشگاه خواجه نصیرالدین طوسی, دانشکده مهندسی نقشه برداری, ایران, دانشگاه خواجه نصیرالدین طوسی, دانشکده مهندسی نقشه برداری, ایران
پست الکترونیکی alesheikh@kntu.ac.ir
 
   analyzing spatial-temporal distribution of natural hazard events in iran (1390-1400 sh) automatically extracted from news stories  
   
Authors shakhesi m. ,alesheikh a. a.
Abstract    introductionanalyzing natural hazards due to economic, environmental, and social effects is necessary for crisis management. however, good analysis comes from good data. in this case, natural hazard databases or inventories that contain all spatial, temporal, and other relevant information for each event are required. to realize that, news and social media, which provide detailed information about the hazards, are two precious resources. nevertheless, most works manually extracted events from these text resources in the inventory development process. this paper presents a framework for extracting natural hazard events automatically from news stories by leveraging text mining techniques. by implementing the framework for the study region of iran, we analyzed the spatial-temporal distribution of natural hazards.materials and methodsaccording to spatial and temporal coverage of mehr news agency, we selected this website as the main resource, and for training machine-learning-based models, we used isna’s news articles. the process starts by mining web pages. all irrelevant records such as the news stories about maneuvers, conferences, and contradicts are removed automatically. then, standardizing the texts of news articles should be accomplished. in the next stage, the text classification technique determines whether a news story is about a newly occurred event or a current event, in which context about the event the news story is published, and which natural hazards are pointed out in the text. for the first and the second text classification task, we used machine-learning-based models which achieved 0.875 and 0.716 for f-score, respectively. for the third task, we developed leveraged a rule-based model. the results of text classifications are used in the proceeding steps, including toponym recognition and resolution, information extraction, and topic detection and tracking.discussion and resultsthe results show that although most natural hazards have a specific temporal distribution, the highest total frequency is for a solar hijri year’s initial and final months. spatially, the storm occurs more in eastern than western provinces. the diversity of other meteorological hazards, except dust, in northern provinces, is more than in southern ones. regardless of the fatalities, the highest frequency of reported earthquake events is for southern provinces.conclusionthis paper presents a framework for automatically extracting natural hazard events from news stories. the framework leverages several text mining techniques such as text classification and information extraction to develop an inventory of the hazards. we implemented the framework to analyze the natural hazards of iran from 1390 to 1400 solar hijri. comparing the number of extracted events with the thematic maps published by the national disaster management organization shows that the differences vary with the province. based on that, the frequency of extracted events for some provinces equals the official statistics; hence the analysis for mined events is generalizable to real-world situations.
Keywords natural hazard ,spatial-temporal distribution ,news stories ,text mining ,information extraction
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved