|
|
متن کاوی :مفاهیم و روش ها
|
|
|
|
|
نویسنده
|
جلالی شیجانی فاطمه ,شیرزاد مجید
|
منبع
|
ترويج علم - 1400 - دوره : 12 - شماره : 21 - صفحه:157 -171
|
چکیده
|
مقدمه: در عصرحاضر، حجم عظیمی از اطلاعات موجود در محیط وب، اسناد و مقالات متنی هستند. متن کاوی، روشی برای استخراج اطلاعات غیرساختیافته و نیمهساختیافته از این حجم اطلاعات موجود در اینترنت و نیز، فرآیند استخراج دانش و الگوهای ناشناخته و غیرقابل فهم و بالقوه، از میان انبوه مجموعههای دادههای متنی است.روشها: این پژوهش از نوع مطالعات کتابخانهای است. با اینکه روشهای متنکاوی اکثراً بر روی منابع لاتین انجام گرفته اند، اما با جستجو در پایگاههای اطلاعاتی فارسی، درمییابیم طی یک دهه گذشته، موضوع متنکاوی برای محققان ایرانی به خصوص دانشجویان رشتههای علوم کامپیوتر و فناوری اطلاعات، اهمیتی دوچندان پیدا کرده است؛ به طوری که بخش قابل توجهی از مقالات کنفرانسهای مربوط به علوم و فنون کامپیوتر را مقالات مربوط به این حوزه تشکیل میدهند.یافتهها: یافتههای پژوهش نشان میدهد که متنکاوی، کاربردی از دادهکاوی است و تفاوت اصلی این دو، استخراج الگوها از متنی با زبان طبیعی در متن کاوی است درحالیکه دادهکاوی بر روی پایگاه دادههای ساختیافته عمل میکند. فرایندهای متنکاوی دارای دو فاز اصلی پیشپردازش مستندات و استخراج دانش هستند. تاکنون هشت تکنیک نیز برای متنکاوی معرفی شده است که عبارتنداز: استخراج اطلاعات، بازیابی اطلاعات، خلاصهسازی متن، طبقهبندی، خوشهبندی، بصری سازی، پردازش زبان طبیعی و عقیدهکاوی.نتیجهگیری: در سالیان اخیر، توجه بسیار زیادی در حوزه بینالمللی و ملی به متنکاوی شده است. افزایش چشمگیر دادههای متنی، پژوهشگران را بر آن داشته است که به دنبال روشهایی جهت کاوش در این دادهها باشند. طبیعی است که محققان ایرانی نیز ازین امر مستنثنا نبودهاند. متنکاوی به همراه تمامی روشها و تکنیکهای آن، کوششی است که پژوهشگران را در استخراج دانش و اطلاعات مفید و باارزش از انبوه متون غیرساختیافتهای که در محیط اینترنت پراکندهاند، یاری میکند.یافته های پژوهش نشان می دهد که متن کاوی، کاربردی از داده کاوی است و تفاوت اصلی این دو، استخراج الگوها از متنی با زبان طبیعی در متن کاوی است، درحالیکه داده کاوی بر روی پایگاه داده های ساخت یافته عمل می کند. آشنایی با فرایندهای متن کاوی و شناسایی تکنیک های آن، از جمله اهداف این پژوهش است. فرایندهای متن کاوی، دارای دوفاز اصلی پیش پردازش مستندات و استخراج دانش هستند. تاکنون هشت تکنیک نیز برای متن کاوی معرفی شده است که عبارتنداز: استخراج اطلاعات، بازیابی اطلاعات، خلاصه سازی متن، طبقه بندی، خوشه بندی، بصری سازی، پردازش زبان طبیعی وعقیده کاوی. با اینکه روش های متن کاوی اکثراً بر روی منابع لاتین انجام گرفته اند، اما با جست وجو در پایگاه های اطلاعاتی فارسی، درمی یابیم طی یک دهه گذشته، موضوع متن کاوی برای محققان ایرانی به خصوص دانشجویان رشته های علوم کامپیوتر و فناوری اطلاعات، اهمیتی دوچندان پیدا کرده است؛ به طوری که بخش قابل توجهی از مقالات کنفرانس های مربوط به علوم و فنون کامپیوتر را مقالات مربوط به این حوزه تشکیل می دهند.
|
کلیدواژه
|
متنکاوی، کشف دانش، دستهبندی متن، فناوری اطلاعات، دادهکاوی
|
آدرس
|
دانشگاه پیام نور مرکز تنکابن, ایران, دانشگاه پیام نور مرکز تهران, گروه علم اطلاعات و دانش شناسی, ایران
|
پست الکترونیکی
|
mshm1362@yahoo.com
|
|
|
|
|
|
|
|
|
text mining: concepts and methods
|
|
|
Authors
|
jalali sheyjani ,fatemeh ,shirzad majid
|
Abstract
|
literature review is one of the main processes in various researches and fields, and addressing it requires attention and knowledge of the theoretical foundations and how to write literature review. in order to write and collect resources, researchers need to make the discussion of research backgrounds their top priority. therefore, the main purpose of this research is to describe and explain the theoretical foundations of literature review and how to search and collect resources from databases as well as write less defects literature reviews and clear visual presentation there are different types of literature review for researchers. this study has been done by documentary method and different persian and latin sources and databases have been used for this research.the results show, despite the importance and position of literature reviews in research, and a lot of studies have been done about it around the world, but researchers still have problems with what the literature review is and how they can examine and how to write and implement resources, and as perhaps and should not have been considered and analyzed, to be able to practically guide researchers on how to write literature review. studies also show this, some researchers are not familiar enough with the literature review and how to compile them, and most of the research is based on the theoretical foundations of literature review.
|
|
|
|
|
|
|
|
|
|
|
|
|