|
|
مدیریت مستندات محتوای فارسی رسانه های آنلاین خبری در جامعه اطلاعاتی
|
|
|
|
|
نویسنده
|
میرزائی دهنوی حمید ,کرامتی محمد علی ,عامری حبیب آبادی محمدعلی
|
منبع
|
پژوهش هاي حفاظتي - امنيتي - 1402 - دوره : 12 - شماره : 1 - صفحه:167 -190
|
چکیده
|
عصری که ما در آن زندگی میکنیم، عصر اطلاعات است و برای سازمان ها مهمترین مسئله، اشراف بر همین اطلاعات است. با رشد روزافزون اخبار در دنیای دیجیتال و اینترنت، موضوعی که مهم و حائز اهمیت میشود، دستهبندی این اطلاعات و دسترسی سریع و ارزان ما به آنها میباشد. این مهم به دست نمیآید مگر با انجام روشهایی که از آن بهعنوان دستهبندی متون یاد شده است. هدف این پژوهش دسته بندی متون خبری در دستههای از قبل مشخصشده می باشد که با استفاده از ابزار مدل اتوماتیک که یکی از زیرمجموعه های متنکاوی محسوب میشود صورت می پذیرد. با توجه به اهمیت موضوع و کاری که در این زمینه برای زبانهای دیگر دنیا انجام گرفته است، نیاز به طبقهبندی متون فارسی به خوبی احساس میشود. این نکته قابل توجه می باشد که تحقیقات برای متون انگلیسی توسعه داده شده و به کارگرفته می شود اما از آنجاییکه زبان فارسی پیچیدگی های ساختاری نسبت به سایر زبان ها دارد و همچنین تحقیقات کمتری در این زمینه انجام گرفته است، این پژوهش از نوع کاربردی، توسعه ای می باشد که برای انجام آن می توان به روش پژوهش آزمایشی و استفاده از ابزار متن کاوی اشاره کرد، به این صورت که در یک محیط کاملاً تحت کنترل و با توانایی ثابت نگه داشتن سایر متغیرها انجام می گردد.در جامعه اطلاعاتی دستهبندی متون بهوسیله افراد نخبه و بهصورت دستی انجام میگیرد. دستهبندی متون آنهم با این حجم و بهصورت دستی غیرممکن به نظر میرسد، بنابراین ما ناگزیریم که به دنبال روشهایی برای دستهبندی خودکار متون باشیم. از سوی دیگر ذخیرهسازی، پردازش و تحلیل این حجم از اطلاعات تبدیل به چالشی جدی شده است. با توجه به حجم بالای اخبار، داده ها، اطلاعات، اسناد و پیچیدگی حفظ و نگهداری آنها، لازم است سیستمی جهت مدیریت دریافت، حفظ و نگهداری اخبار موجود، بکار گرفته شود. پیچیدگی سازمان ها نیاز به متمرکز بودن اخبار، اسناد، طبقه بندی درست، گردش صحیح اخبار و سهولت در دسترسی به آنها را ایجاد می نماید. مدیریت مستندات این امکان را برای سازمان های اطلاعاتی فراهم می آورد که اخبار و اسناد دریافتی یا موجود را به درستی طبقه بندی نموده، آنها را حفظ، نگهداری و بازیابی نماید. با بررسی، تحلیل و پردازش در این پژوهش به این نتیجه می رسیم که دقت و نتایج حاصل روش پیشنهادی روی متون خبری برخط نشان میدهد؛ مدل ماشین بردار پشتیبان دارای دقت 93.29، صحت 93.32، فراخوانی 92.96 و خطای 6.71 است.
|
کلیدواژه
|
طبقه بندی، مدیریت مستندات، محتوای فارسی، متن کاوی، اطلاعات و دسته بندی
|
آدرس
|
دانشگاه آزاد اسلامی واحد تهران مرکزی, گروه مدیریت فناوری اطلاعات, ایران, دانشگاه آزاد اسلامی واحد تهران مرکزی, گروه مدیریت صنعتی, ایران, پژوهشگاه علوم انتظامی و مطالعات اجتماعی, گروه مدیریت, ایران
|
پست الکترونیکی
|
m.ali.ameri.h@gmil.com
|
|
|
|
|
|
|
|
|
management of farsi content documentation of online news media in the intelligence society
|
|
|
Authors
|
mirzaei dehnavi hamid ,karamati mohammad ali ,ameri habibabadi mohammad ali
|
Abstract
|
the age we live in is the age of information, and the most important issue for organizations is the mastery of this information. with the ever-increasing growth of news in the digital world and the internet, the issue that becomes important is the classification of this information and our quick and cheap access to it. this importance cannot be achieved except by doing the methods referred to as text classification. the purpose of this research is to classify news texts into predefined categories, which is done using the automatic model tool, which is considered one of the subsets of text mining. considering the importance of the subject and the work that has been done in this field for other languages of the world, the need to classify persian texts is well felt. it is noteworthy that research has been developed and used for english texts, but since the persian language has structural complexities compared to other languages and also less research has been done in this field, this research is of an applied type. it is a development that can be done using the experimental research method and the use of text mining tools, as it is done in a completely controlled environment with the ability to keep other variables constant. in the intelligence society, the classification of texts is done manually by elite people. it seems impossible to categorize texts with this volume manually, so we are forced to look for methods to automatically categorize texts. on the other hand, storing, processing and analyzing this amount of information has become a serious challenge. due to the high volume of news, data, information, documents and the complexity of maintaining and maintaining them, it is necessary to use a system to manage receiving, maintaining and maintaining existing news. the complexity of organizations creates the need for centralization of news, documents, correct classification, correct circulation of news and ease of access to them. document management provides the possibility for information organizations to correctly classify received or existing news and documents, preserve, maintain and retrieve them. by examining, analyzing and processing in this research, we come to the conclusion that the accuracy and results of the proposed method on online news texts show; the support vector machine model has 93.29 precision, 93.32 accuracy, 92.96 recall, and 6.71 error.
|
|
|
|
|
|
|
|
|
|
|
|
|