>
Fa   |   Ar   |   En
   داده محکی برای تحلیل مدل‌های دگرنمایی گراف دانش برای مساله پیش‌بینی پیوند در زبان‌های کم‌منبع  
   
نویسنده ترابیان نجمه ,مینایی بیدگلی بهروز ,جهانشاهی محسن
منبع رايانش نرم و فناوري اطلاعات - 1403 - دوره : 13 - شماره : 4 - صفحه:38 -48
چکیده    پیش‌بینی پیوند در بافتار گراف‌های دانش عبارت است از پیش‌بینی موجودیت‌ها یا روابط غیرموجود که معمولاً با استفاده از دگرنمایی گراف دانش است. آموزش این مدل‌ها بر روی گراف‌های دانش استخراج شده از زبان‌های کم‌منبع چالش‌های منحصربه‌فردی را ایجاد می‌کند که در پژوهش‌های پیشین به آن پرداخته نشده است و در نتیجه هیچ داده‌ی محکی نیز برای ارزیابی روش‌های پیش‌بینی پیوند در چنین گراف‌های دانشی وجود ندارد. گراف‌های دانش استخراج‌شده از زبان‌های کم‌منبع به دلیل ویژگی های این زبان‌ها، اغلب توپولوژی منحصربه‌فردی دارند. برای مثال، بسیاری از گراف‌های دانش از دایره‌المعارف‌هایی مانند ویکی‌پدیا استخراج شده‌اند و ویکی‌پدیای مربوط به زبان‌های کم‌منبع معمولا برای موجودیت‌های بسیاری توضیحات نامبسوط ارائه کرده باشد. این مساله باعث می‌شود گراف‌های حاصل از آنها نیز در خصوص بسیاری از گره‌ها یال‌های اندکی داشته باشند و این مساله توپولوژی متفاوتی از گراف‌های دانش معیار برای آنها ایجاد می‌کند. فارس بیس (تنها گراف دانش مرتبط با زبان فارسی)، نمونه‌ای از این گراف‌هاست. این مقاله نسخه‌ای از فارس‌بیس را تحت عنوان «فارس‌پیش‌بین»، به‌عنوان داده‌ی محکی برای دگرنمایی گراف دانش با زبان‌های کم‌منبع معرفی می‌کند. سپس، نویسندگان ادعا و استدلال می‌کنند که در گراف‌های دانش استخراج‌شده از زبان‌های کم‌منبع، مدل‌های فاصله انتقالی از سایر مدل‌های دگرنمایی گراف دانش بهتر عمل می‌کنند. برای آزمودن این فرضیه، مدل‌های دگرنمایی گراف دانش رایج بر روی آن آزمایش و ارزیابی شده و اثبات شد که مدل‌های فاصله انتقالی بهترین عملکرد را روی چنین داده‌ی محکی دارند. این داده‌ی محک انتظار می‌رود که زین‌پس به عنوان یک زیرساخت ارزیابی استاندارد برای پژوهش‌هایی که به پیش‌بینی پیوند در گراف‌های دانش با زبان‌های کم‌منبع خواهند پرداخت استفاده شود.
کلیدواژه پیش‌بینی پیوند، دگرنمایی گراف دانش، داده‌ی محک پیش‌بینی پیوند
آدرس دانشگاه آزاد اسلامی واحد تهران مرکز, دانشکده مهندسی کامپیوتر, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد تهران مرکز, دانشکده مهندسی کامپیوتر, ایران
پست الکترونیکی mjahanshahi@iauctb.ac.ir
 
   a benchmark for analyzing knowledge graph embedding for link prediction problem in low-resource languages  
   
Authors torabian najmeh ,minaei-bidgoli behrooz ,jahanshahi mohsen
Abstract    link prediction in knowledge graphs addresses predicting missing entities or relations of a knowledge graph, typically using knowledge graph embedding techniques. training these models on low-resource-language knowledge graphs presents unique challenges, which have not been thoroughly addressed in the literature, and correspondingly there is no benchmark for evaluating link prediction methods on such graphs. these knowledge graphs often have unique topologies due to the characteristics of low-resource languages. many knowledge graphs are derived from encyclopedias like wikipedia, which in low-resource languages may have many propositions from common subjects and/or facts and few from less common ones, leading to distinctive topologies in the extracted knowledge graph. farsbase, as the knowledge graph related to the persian language, exemplifies these properties. originating from persian wikipedia, it has some relation-types with many numbers of instances and some other relation types with very few instances. this paper introduces &farspishbin,& a lightly-pruned version of farsbase, as a benchmark for low-resource-language knowledge graph embedding. the authors argue that translational models are likely to outperform other embedding models on this benchmark. to check the mentioned hypothesis, the popular embedding models are evaluated on farspishbin and the experiments prove that translational models (as expected) perform best. this benchmark aims to serve as a standard platform for future-coming models addressing link prediction in low-resource-language knowledge graphs.
Keywords link prediction ,knowledge graph embedding ,link prediction benchmark
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved