|
|
تحلیل توزیع مکانی و زمانی رخدادهای طبیعی ایران از سال 1390 تا 1400 بر پایه گزارشهای خبری
|
|
|
|
|
نویسنده
|
شاخصی مهدی ,آل شیخ علی اصغر
|
منبع
|
علوم و فنون نقشه برداري - 1401 - دوره : 12 - شماره : 1 - صفحه:63 -79
|
چکیده
|
رخدادهای طبیعی اغلب با تاثیرات اجتماعی، اقتصادی و محیطی همراه میشوند. هر چند سنجندههای مختلفی در امر پایش این رخدادها میتوانند بکار گرفته شوند ولی تحلیل کارآمد این رخدادها نیازمند توسعه پایگاهدادههایی متشکل از رخدادها و اطلاعات مکانی، زمانی و توصیفی آنها است. برای توسعه سیاهه رخدادها، میتوان از رسانههای جمعی و اجتماعی به خاطر دربرگرفتن اطلاعات جزئیتر در مقایسه با گزارشهای سالیانه، بهره برد. در این پژوهش، با کمک تکنیکهای متنکاوی چارچوبی برای استخراج خودکار رخدادهای طبیعی از گزارشهای خبری توسعه داده شده است. پس از وبکاوی اخبار و حذف موارد غیرمرتبط با رخدادهای طبیعی، استانداردسازی متن انجام میشود. در ادامه، با کمک مدلهای مبتنی بر یادگیری ماشین نخست مشخص میشود که خبر درباره رخدادی جدید یا جاری است و دوم در قالب چه موضوعی به رخداد طبیعی پرداخته شده است (مقادیر 875.0 و 716.0 به ترتیب برای f-score مدلهای طبقهبندی اول و دوم اخذ شده است). همچنین با بهرهگیری از مدلی قاعده محور انواع رخدادهای مطرحشده شناسایی میشود. بعد از تشخیص جاینامهای مدیریتی، به ازای هر «نوع رخداد-جاینام» اطلاعات زمانی و توصیفی از هر خبر استخراج میشود. در آخر، رخدادهای طبیعی به همراه گزارشهای خبری مربوطه شناسایی گردآوری میشوند. نتایج پیادهسازی این چارچوب برای کشور ایران از آغاز 1390 تا پایان 1399 براساس اخبار خبرگزاری مهر در بخشهای بررسی محتوای خبری مرتبط با رخدادهای طبیعی، تحلیل توزیع مکانی و زمانی رخدادها ارائه شده است. طبق نتایج تحقیق، از نظر زمانی تعداد کل رخدادها در ماههای آغازین و پایانی سال بیشتر است. از لحاظ مکانی، فارغ از حجم خسارات، استانهای جنوبی بیشتر از استانهای شمالی رخداد زمینلرزه گزارش میشود. در مقابل، تنوع رخدادهای هواشناسی در استانهای شمالی بیشتر است. خروجی این تحقیق میتواند در افزایش کارآمدی مدیریت بحران مورد استفاده قرار گیرد.
|
کلیدواژه
|
رخداد طبیعی، توزیع مکانی و زمانی، گزارشهای خبری، متن کاوی، استخراج اطلاعات
|
آدرس
|
دانشگاه خواجه نصیرالدین طوسی, دانشکده مهندسی نقشه برداری, ایران, دانشگاه خواجه نصیرالدین طوسی, دانشکده مهندسی نقشه برداری, ایران
|
پست الکترونیکی
|
alesheikh@kntu.ac.ir
|
|
|
|
|
|
|
|
|
analyzing spatial-temporal distribution of natural hazard events in iran (1390-1400 sh) automatically extracted from news stories
|
|
|
Authors
|
shakhesi m. ,alesheikh a. a.
|
Abstract
|
introductionanalyzing natural hazards due to economic, environmental, and social effects is necessary for crisis management. however, good analysis comes from good data. in this case, natural hazard databases or inventories that contain all spatial, temporal, and other relevant information for each event are required. to realize that, news and social media, which provide detailed information about the hazards, are two precious resources. nevertheless, most works manually extracted events from these text resources in the inventory development process. this paper presents a framework for extracting natural hazard events automatically from news stories by leveraging text mining techniques. by implementing the framework for the study region of iran, we analyzed the spatial-temporal distribution of natural hazards.materials and methodsaccording to spatial and temporal coverage of mehr news agency, we selected this website as the main resource, and for training machine-learning-based models, we used isna’s news articles. the process starts by mining web pages. all irrelevant records such as the news stories about maneuvers, conferences, and contradicts are removed automatically. then, standardizing the texts of news articles should be accomplished. in the next stage, the text classification technique determines whether a news story is about a newly occurred event or a current event, in which context about the event the news story is published, and which natural hazards are pointed out in the text. for the first and the second text classification task, we used machine-learning-based models which achieved 0.875 and 0.716 for f-score, respectively. for the third task, we developed leveraged a rule-based model. the results of text classifications are used in the proceeding steps, including toponym recognition and resolution, information extraction, and topic detection and tracking.discussion and resultsthe results show that although most natural hazards have a specific temporal distribution, the highest total frequency is for a solar hijri year’s initial and final months. spatially, the storm occurs more in eastern than western provinces. the diversity of other meteorological hazards, except dust, in northern provinces, is more than in southern ones. regardless of the fatalities, the highest frequency of reported earthquake events is for southern provinces.conclusionthis paper presents a framework for automatically extracting natural hazard events from news stories. the framework leverages several text mining techniques such as text classification and information extraction to develop an inventory of the hazards. we implemented the framework to analyze the natural hazards of iran from 1390 to 1400 solar hijri. comparing the number of extracted events with the thematic maps published by the national disaster management organization shows that the differences vary with the province. based on that, the frequency of extracted events for some provinces equals the official statistics; hence the analysis for mined events is generalizable to real-world situations.
|
Keywords
|
natural hazard ,spatial-temporal distribution ,news stories ,text mining ,information extraction
|
|
|
|
|
|
|
|
|
|
|