>
Fa   |   Ar   |   En
   بهبود صحت ابهام‌زدایی نام نویسنده با استفاده از خوشه‌بندی تجمّعی  
   
نویسنده مرتضوی محمد ,ندیمی شهرکی محمد حسین ,موسی خانی مصطفی
منبع پردازش علائم و داده ها - 1396 - دوره : 14 - شماره : 4 - صفحه:117 -128
چکیده    امروزه کتابخانه های دیجیتال از مهم ترین و سریع ترین منابع پژوهشی در جهان محسوب می شوند. از نقطه نظر مدیریت تجمیع دانش، توانایی جستجوی صحیح، دقیق و سریع مطالب علمی مد نظر کاربر، اهمیت زیادی دارد. پیچیدگی و وجود تشابه در بانک های اطلاعاتی موجب می گردد این منابع در هنگام بهره برداری با چالش ها و ابهامات زیادی مواجه شوند و همین چالش ها دست مایه پژوهش های گسترده ای را در این حوزه شکل داده است. یکی از مهم ترین این چالش ها، وجود ابهام در نام نویسنده است. در این خصوص روش های بسیاری با بهره گیری از روش های خوشه بندی نسبت به حل نام های مبهم مبادرت ورزیده اند. این روش ها تا حدودی توانسته اند مشکل را برطرف کنند، اما همچنان مسئله تکه تکه بودن خوشه ها و خطا در نتایج تولیدی، از معایب روش های موجود است. از سویی تجربه نشان داده که یک روش به تنهایی نتایجی با صحت بالا نمی تواند تولید کند. بدین منظور در این مقاله مدلی جهت حل مشکل ذکر شده ارائه شده است . راهکار پیشنهادی در دو گام، عملیات ابهام زدایی را انجام می دهد. در گام نخست خوشه های اولیه با استفاده از الگوریتم خوشه بندی سلسله مراتبی تجمعی با پارامترها و توابع اندازه گیری مشابهت مختلف ، تولید می شوند. در گام دوم با بهره گیری از الگوریتم خوشه بندی تجمعی ، خوشه های تولید شده به گونه ای ترکیب می شوند تا خوشه هایی غنی با درصد کمتری از تکه تکه بودن و صحت بالاتر تولید شوند. در ارزیابی الگوریتم پیشنهادی از مجموعه دادگان dblp، تحت معیار k استفاده شده است. نتایج، بهبود قابل توجهی را در ترکیب خوشه های مذکور نشان می دهند.
کلیدواژه کتابخانه‌های دیجیتال، ابهام‌زدایی نام نویسنده، نام مبهم، خوشه‌بندی تجمعی
آدرس دانشگاه آزاد اسلامی واحد نجف آباد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد نجف آباد, ایران, دانشگاه آزاد اسلامی واحد نجف آباد, مرکز تحقیقات مه داده, ایران
 
   Improving the accuracy of the author name disambiguation by using clustering ensemble  
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved