>
Fa   |   Ar   |   En
   متن کاوی :مفاهیم و روش ها  
   
نویسنده جلالی شیجانی فاطمه ,شیرزاد مجید
منبع ترويج علم - 1400 - دوره : 12 - شماره : 21 - صفحه:157 -171
چکیده    مقدمه: در عصرحاضر، حجم عظیمی از اطلاعات موجود در محیط وب، اسناد و مقالات متنی هستند. متن کاوی، روشی برای استخراج اطلاعات غیرساخت‌یافته و نیمه‌ساخت‌یافته از این حجم اطلاعات موجود در اینترنت و نیز، فرآیند استخراج دانش و الگوهای ناشناخته و غیرقابل فهم و بالقوه، از میان انبوه مجموعه‌های داده‌های متنی است.روش‌ها: این پژوهش از نوع مطالعات کتابخانه‌ای است. با اینکه روش‌های متن‌کاوی اکثراً بر روی منابع لاتین انجام گرفته اند، اما با جستجو در پایگاه‌های اطلاعاتی فارسی، درمی‌یابیم طی یک دهه گذشته، موضوع متن‌کاوی برای محققان ایرانی به خصوص دانشجویان رشته‌های علوم کامپیوتر و فناوری اطلاعات، اهمیتی دوچندان پیدا کرده است؛ به طوری که بخش قابل توجهی از مقالات کنفرانس‌های مربوط به علوم و فنون کامپیوتر را مقالات مربوط به این حوزه تشکیل می‌دهند.یافته‌ها: یافته‌های پژوهش نشان می‌دهد که متن‌کاوی، کاربردی از داده‌کاوی است و تفاوت اصلی این دو، استخراج الگوها از متنی با زبان طبیعی در متن کاوی است درحالیکه داده‌کاوی بر روی پایگاه داده‌های ساخت‌یافته عمل می‌کند. فرایندهای متن‌کاوی دارای دو فاز اصلی پیش‌پردازش مستندات و استخراج دانش هستند. تاکنون هشت تکنیک نیز برای متن‌کاوی معرفی شده است که عبارتنداز: استخراج اطلاعات، بازیابی اطلاعات، خلاصه‌سازی متن، طبقه‌بندی، خوشه‌بندی، بصری سازی، پردازش زبان طبیعی و عقیده‌کاوی.نتیجه‌گیری: در سالیان اخیر، توجه بسیار زیادی در حوزه بین‌المللی و ملی به متن‌کاوی شده است. افزایش چشمگیر داده‌های متنی، پژوهشگران را بر آن داشته است که به دنبال روش‌هایی جهت کاوش در این داده‌ها باشند. طبیعی است که محققان ایرانی نیز ازین امر مستنثنا نبوده‌اند. متن‌کاوی به همراه تمامی روش‌ها و تکنیک‌های آن، کوششی است که پژوهشگران را در استخراج دانش و اطلاعات مفید و باارزش از انبوه متون غیرساخت‌یافته‌ای که در محیط اینترنت پراکنده‌اند، یاری می‌کند.یافته های پژوهش نشان می دهد که متن کاوی، کاربردی از داده کاوی است و تفاوت اصلی این دو، استخراج الگوها از متنی با زبان طبیعی در متن کاوی است، درحالیکه داده کاوی بر روی پایگاه داده های ساخت یافته عمل می کند. آشنایی با فرایندهای متن کاوی و شناسایی تکنیک های آن، از جمله اهداف این پژوهش است. فرایندهای متن کاوی، دارای دوفاز اصلی پیش پردازش مستندات و استخراج دانش هستند. تاکنون هشت تکنیک نیز برای متن کاوی معرفی شده است که عبارتنداز: استخراج اطلاعات، بازیابی اطلاعات، خلاصه سازی متن، طبقه بندی، خوشه بندی، بصری سازی، پردازش زبان طبیعی وعقیده کاوی. با اینکه روش های متن کاوی اکثراً بر روی منابع لاتین انجام گرفته اند، اما با جست وجو در پایگاه های اطلاعاتی فارسی، درمی یابیم طی یک دهه گذشته، موضوع متن کاوی برای محققان ایرانی به خصوص دانشجویان رشته های علوم کامپیوتر و فناوری اطلاعات، اهمیتی دوچندان پیدا کرده است؛ به طوری که بخش قابل توجهی از مقالات کنفرانس های مربوط به علوم و فنون کامپیوتر را مقالات مربوط به این حوزه تشکیل می دهند.
کلیدواژه متن‌کاوی، کشف دانش، دسته‌بندی متن، فناوری اطلاعات، داده‌کاوی
آدرس دانشگاه پیام نور مرکز تنکابن, ایران, دانشگاه پیام نور مرکز تهران, گروه علم اطلاعات و دانش شناسی, ایران
پست الکترونیکی mshm1362@yahoo.com
 
   text mining: concepts and methods  
   
Authors jalali sheyjani ,fatemeh ,shirzad majid
Abstract    literature review is one of the main processes in various researches and fields, and addressing it requires attention and knowledge of the theoretical foundations and how to write literature review. in order to write and collect resources, researchers need to make the discussion of research backgrounds their top priority. therefore, the main purpose of this research is to describe and explain the theoretical foundations of literature review and how to search and collect resources from databases as well as write less defects literature reviews and clear visual presentation there are different types of literature review for researchers. this study has been done by documentary method and different persian and latin sources and databases have been used for this research.the results show, despite the importance and position of literature reviews in research, and a lot of studies have been done about it around the world, but researchers still have problems with what the literature review is and how they can examine and how to write and implement resources, and as perhaps and should not have been considered and analyzed, to be able to practically guide researchers on how to write literature review. studies also show this, some researchers are not familiar enough with the literature review and how to compile them, and most of the research is based on the theoretical foundations of literature review.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved