|
|
بررسی رویکردهای متنکاوی و عملکرد آن در کشف و استخراج موضوع
|
|
|
|
|
نویسنده
|
زرمهر فاطمه ,منصوری علی ,کارشناس حسین
|
منبع
|
تعامل انسان و اطلاعات - 1399 - دوره : 7 - شماره : 1 - صفحه:15 -26
|
چکیده
|
زمینه و هدف : در این پژوهش چهار روش متنکاوی بررسی میشود و بر درک و شناسایی خصوصیات و محدودیتهای آنها در کشف موضوع تمرکز میکند. این چهار روش عبارتاند از 1) تجزیهوتحلیل معنایی پنهان(lsa) 2) تحلیل معنایی پنهان احتمالاتی(plsa)، 3) تخصیص دیریکله پنهان(lda) و 4) مدلسازی موضوعی همبسته(ctm). روش پژوهش: پژوهش حاضر از نوع کتابخانهای است که در آن، ادبیات حوزه متنکاوی و مدلسازی موضوعی مرور و تحلیل شده است.یافتهها: تجزیهوتحلیل معنایی پنهان میتواند برای تشخیص موضوعات خاص و منحصربهفرد در مدارکی که تنها به یک موضوع پرداختهاند استفاده شود. سه روش دیگر متنکاوی، بر موضوعات و گرایش کلی متن متمرکز هستند. تحلیل معنایی پنهان احتمالاتی برای مدارکی که به یک موضوع پرداختهاند قابلاستفاده است اما برخلاف تجزیهوتحلیل معنایی پنهان ، این روش در کشف موضوعات و مضامین کلی متن کاربرد دارد. درحالیکه تخصیص دیریکله پنهان در مورد مدارکی که به چندین موضوع پرداختهاند کاربرد بیشتری دارد. روش مدلسازی موضوعی همبسته میتواند در تشخیص ارتباط بین دستههای موضوعی مختلف استفاده شود. نتیجهگیری: رویکردهای متنکاوی به خاطر بهرهگیری از تحلیل معنایی در کشف و استخراج موضوع متون مناسب است
|
کلیدواژه
|
متنکاوی، مدلسازی موضوعی، تحلیل معنایی، کشف موضوع
|
آدرس
|
دانشگاه اصفهان, ایران, دانشگاه اصفهان, گروه علم اطلاعات و دانش شناسی, ایران, دانشگاه اصفهان, گروه هوش مصنوعی, ایران
|
|
|
|
|
|
|
|
|
|
|
A review of text mining approaches and their function in discovering and extracting a topic
|
|
|
Authors
|
Zarmehr Fatemeh ,Mansouri Ali ,Karshenas Hossein
|
Abstract
|
Background and aim: Four text mining methods are examined and focused on understanding and identifying their properties and limitations in subject discovery.Methodology: The study is an analytical review of the literature of text mining and topic modeling. Findings: LSA could be used to classify specific and unique topics in documents that address only a single topic. The other three text mining methods focus on topics and general partiality of the text. PLSA is applicable to documents dealing with a topic, unlike the LSA, it is used to discover general themes and contexts. However, LDA is more applicable to documents that address several issues. The CTM, method can be used to identify relationship between different subject categories.Conclusion: Text mining tactics are suitable for employing analysis in discovering and extracting the text subjects.
|
Keywords
|
Text mining ,Topic Modeling ,Semantic Analysis ,Topic Discovery
|
|
|
|
|
|
|
|
|
|
|