|
|
دستهبندی اسناد الکترونیکی با استفاده از خوشهبندی
|
|
|
|
|
نویسنده
|
صدری علیاکبر ,صدری سحر
|
منبع
|
علوم و فناوري هاي نوظهور و شالوده شكن در حوزه دفاعي - 1403 - دوره : 0 - علوم و فناوری های نوظهور و شالوده شکن در حوزه دفاعی - کد همایش: 03240-67639 - صفحه:0 -0
|
چکیده
|
دستهبندی خودکار در دسترسی سریع و مطلوب به اسناد الکترونیکی، اهمیت ویژهای دارد. روشهای معمول در دستهبندی خودکار اسناد الکترونیکی، روشهای یادگیری ماشین (هوش مصنوعی) هستند. اگر چه خوشهبندی اسناد، بیشتر در حوزههای متنکاوی و بازیابی اطلاعات کاربرد دارد، امروزه از روشهای خوشهبندی، برای افزایش کارایی دستهبندهای متن استفاده میشود. در این مقاله، روشی برای دستهبندی اسناد با استفاده از خوشهبندی اسناد آموزشی براساس مشابهت یا عدم مشابهت کلاسهای اسناد، پیشنهاد شده است. در این روش مجموعه اسناد آموزشی اولیه با یکی از روشهای خوشهبندی (بر اساس مشابهت یا عدم مشابهت کلاسهای اسناد آموزشی) به چند خوشه تقسیم میشود. از روی هر خوشه از اسناد، دستهبندی ساخته شده و با اسناد آزمون مربوط به همان خوشه، ارزیابی میشود. میکرومیانگین نتایج ارزیابی دستهبندهای ساخته شده از روی خوشهها، نسبت به حالتی که فقط یک دستهبند از روی کل مجموعه آموزش ساخته میشود، حدود 15 درصد افزایش کارایی را براساس معیارهای دقت و بازخوانی نشان میدهد.
|
کلیدواژه
|
دستهبندی اسناد، خوشهبندی اسناد، rocchio، بیزین ساده، svm.
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
sadri_sahar@modares.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|