روش ‌های یادگیری خودکار هستی ‌نگاشت‌ها در حوزۀ مفاهیم قرآنی: مطالعۀ مروری دامنه‌ای

Fa | Ar | En

روش ‌های یادگیری خودکار هستی ‌نگاشت‌ها در حوزۀ مفاهیم قرآنی: مطالعۀ مروری دامنه‌ای


نویسنده	میرعرب علی ,محمدی استانی مرتضی ,طباطبایی امیری فائزه سادات ,دهقانی سانیج سمیه
منبع	پژوهشنامه كتابداري و اطلاع رساني - 1402 - دوره : 13 - شماره : 2 - صفحه:27 -49
چکیده	مقدمه: امروزه فناوری ‌های معنایی رویکرد جدیدی را در پردازش و بازنمون معارف قرآنی با هدف ارائۀ اطلاعات معنادار ارائه می‌دهند. هستی ‌نگاشت‌ها به‌عنوان یکی از فناوری‌های معنایی، ابزاری جهت بیان رسمی مفاهیم و روابط موجود در حوزۀ خاصی بوده که توسعه و کاربرد آن جهت استخراج معارف و علوم قرآنی مورد توجه قرار گرفته است. یادگیری هستی‌نگاشت‌ها و روش‌های آن به‌صورت خودکار جهت استخراج مفاهیم از مباحث مهم در حوزۀ وب معنایی و فناوری‌های آن است. به‌تازگی توسعه و کاربرد یادگیری هستی‌نگاشت‌ها جهت استخراج مفاهیم قرآنی مورد توجه قرار گرفته است. ازاین‌رو، هدف پژوهش حاضر، بررسی جامع یادگیری خودکار هستی‌نگاشت‌ها در حوزۀ استخراج مفاهیم قرآنی به‌منظور شفاف‌سازی وضعیت فعلی و آینده است. معیارهای مورد بررسی مجموعه داده‌ها، روش‌های یادگیری، روش‌های ارزیابی، نتایج و پیشنهاد‌های آتی پژوهش‌ها در حوزۀ یادگیری خودکار هستی‌نگاشت‌های قرآنی بود.روش‌شناسی: روش بررسی پژوهش حاضر، مرور دامنه‌ای بر اساس دستورالعمل‌های پریزما و بر اساس رویۀ استفاده‌شده توسط آرکسی و امالی (2005) است. این فرآیند پروتکلی را به‌منظور تطبیق نتایج پژوهش موجود با سوالات و معیارهای تحقیق توصیف می‌کند. پنج مرحلۀ پیشنهادی آرکسی و امالی عبارت‌اند از: 1. شناسایی و طراحی سوال(ها) پژوهش، 2. انجام استراتژی‌های جستجو برای استخراج مطالعات مرتبط از طریق انتخاب واژه‌های کلیدی مناسب و عملگرهای بولی، 3. انتخاب نهایی پژوهش‌های مرتبط با تعیین معیارهای ورود و خروج، 4. خلاصه‌سازی و گزارش یافته‌ها و درنهایت، 5. گزارش و بحث پیرامون نتایج حاصل. جستجوی منابع در هفت پایگاه دادۀ علمی مشتمل برemerald, science direct, ieee xplore digital library, google scholar, web of science, scopus انجام شد. فرایند جستجو در فروردین 1402 صورت گرفت. تعداد 811 مقاله، بدون توجه به محدودۀ زمانی، مورد ارزیابی و انتخاب قرار گرفت. به‌منظور سازماندهی مقالات بازیابی‌شده، از نرم‌افزار مدیریت منابع اطلاعاتی اندنوت استفاده شد و پس از تطبیق عناوین در پایگاه‌های اطلاعاتی مختلف، تعداد 317 مقاله تکراری حذف گردید. پس از بررسی چکیده‌ها، معیارهای ورود و خروج و کیفیت مقالات اعمال گردید. همچنین به‌منظور جلوگیری از سوگیری در انتخاب مقالات، طی بررسی تصادفی مجددی، توسط دو پژوهشگر مستقل در حوزۀ یادگیری خودکار هستی‌نگاشت نیز ارزیابی صورت گرفت و درنهایت تعداد 25 اثر به‌عنوان ملاک مرور انتخاب گردید.یافته ها: یافته‌ها نشان داد اغلب پژوهش‌ها در حوزۀ مجموعۀ داده‌های قرآنی به زبان‌های انگلیسی و عربی بودند و بخش عمده آن‌ها نیز از ترجمۀ انگلیسی قرآن الهلالی و خان استفاده کرده‌اند. استفاده از مجموعه داده‌های بسیار محدود، مهم‌ترین محدودیت پژوهش‌های انجام شده بود. بخش عمدۀ پژوهش‌ها از روش‌های نرمال‌سازی، خوشه‌بندی و دسته‌بندی متن، خلاصه‌سازی متن، استخراج اطلاعات، تشابه و یافتن موجودیت‌های نامدار استفاده کرده‌اند. البته در برخی پژوهش‌ها، روش‌های هوش مصنوعی نظیر شبکۀ عصبی نیز به کار گرفته شده است. علاوه بر این، یافته‌ها نشان داد که الگوریتم‌های داده‌کاوی مبتنی بر روش‌های آمار و احتمال برای یادگیری و ساخت هستی‌نگاشت‌های خودکار در میان محققان با محبوبیت روبرو شده است. همچنین از روش‌های محاسبۀ دقت، فراخوانی و معیار f برای ارزیابی نتایج کاربرد الگوریتم‌های یادگیری خودکار در هستی‌نگاشت‌های قرآنی استفاده کرده‌اند. پژوهش‌هایی که از روش‌های هوش مصنوعی بهره‌برداری کرده‌اند، با تحلیل معنایی، استنتاج، مدل‌سازی و تایید اعتبار داده‌های استنتاج‌شده به نتایجی مانند تشخیص صوت برای آموزش قرائت قرآن، تشخیص آرایه‌های ادبی و ایجاد ارتباط‌های موضوعی در مفاهیم قرآنی و همچنین ایجاد ارتباط بین این مفاهیم با مفاهیم سایر ادیان نائل شده‌اند. ارزیابی‌ روش‌های ارائه‌شده برای یادگیری خودکار هستی‌نگاشت‌های قرآنی نشان می‌دهد استفاده توامان از روش‌های داده‌کاوی و هوش مصنوعی نتایج بهتری را به‌همراه دارد. بخش عمدۀ نتایج این حوزه در دو دسته کلی قرار دارد. دستۀ اول مبتنی بر به‌کارگیری روش‌های داده‌کاوی، متن‌کاوی و یادگیری ماشین جهت استخراج خودکار مفاهیم و ابعاد سه‌گانه (فعل، فاعل، مفعول) به‌همراه روابط معنایی از متن قرآن بود. دستۀ دیگر به مقایسه عملکرد روش‌ها و الگوریتم‌های مبتنی بر آمار و مشابهت‌یابی نظیر tf، tf-idf، ave-tf، ridf، tim، n-gram، freya، pos taggin، levenshtein، log likelihod، هِرسِت، و جز این‌ها در استخراج مفاهیم خودکار جهت ساخت هستی‌نگاشت قرآنی پرداخته‌اند. یافته‌های حاصل از بررسی کارهای آینده نشان از علاقۀ محققان به الگوریتم‌های هوش مصنوعی و استفاده در یادگیری هستی‌نگاشت و توسعۀ خودکار و نیمه‌خودکار هستی‌نگاشت‌های قرآنی دارد. فقدان مجموعه داده‌های صحیح، دلیل عجز سامانه‌های هوش مصنوعی پیشرفتۀ دنیا مانند جی‌پی‌تی 4 است که در آینده باید به این مهم پرداخته شود.نتیجه‌گیری: نتایج این مطالعه می‌تواند به جهت‌دهی پژوهش‌های آتی درباره بهترین روش‌ها در توسعۀ خودکار هستی‌نگاشت‌های قرآنی کمک کند. این مسئله می‌تواند با طراحی هستی‌نگاشت جامع قرآنی که تمام موضوعات و مفاهیم را با توجه به بافت قرآن، پوشش دهد، مدنظر قرار گرفته و با ایجاد هستی‌نگاشتی جامع از مفاهیم قرآن، کاربران را به‌سمت بازیابی دانش قرآنی رهنمون سازد. همچنین بهره‌برداری بیشتر از روش‌های هوش مصنوعی و پردازش زبان طبیعی نظیر جی.پی.تی. به‌عنوان مدل یادگیری ماشینی برای تولید متن به زبان طبیعی با استفاده از شبکۀ عصبی عمیق، در توسعۀ خودکار هستی‌نگاشت‌های قرآنی ضروری به نظر می‌رسد. با توجه به اینکه یادگیری ماشین مستلزم وجود داده‌های کلان در حوزۀ قرآن است، ساخت مجموعه داده‌های استاندارد ازجمله کارهای آتی محققان است.
کلیدواژه	یادگیری خودکار هستی‌ نگاشت، هستی‌ نگاشت قرآن، فناوری معنایی، استخراج دانش، داده‌ کاوی
آدرس	پژوهشگاه علوم و فرهنگ اسلامی, گروه اشاعۀ اطلاعات و تبادل دانش, ایران, دانشگاه اصفهان, گروه علم اطلاعات و دانش ‌شناسی, ایران, دانشگاه شهید چمران اهواز, ایران, دانشگاه علوم پزشکی ایران, ایران
پست الکترونیکی	so.dehghani@yahoo.com

methods of the ontologyautomatic learning in the fields of quranic concepts: a scoping review study

Authors	mirarab ali ,mohammadi ostani morteza ,tabatabaei amiri faezehsadat ,dehghanisanij somayeh
Abstract	objective: today, semantic technology offers a new approach in organizing quranic knowledge with the aim of providing meaningful information and representing quranic teachings. ontologies are a tool to formally express concepts and relationships in a specificdomain. in the same way, the development of ontology as a tool for representing the effulgenceand extracting the knowledge of the quran is not only valuable, but also necessary. ontologylearning and its methods automatically to extract concepts are important topics in the field ofsemantic web and its technologies. recently, the development and application of ontologieslearning for the extraction of quranic concepts has been considered. therefore, the aim of thecurrent research is to comprehensively investigate the ontologies automatic learning in the fieldof extracting knowledge and quranic concepts in order to clarify the current and futuresituation. the investigated criteria were data set, learning methods, evaluation methods, resultsand future suggestions of studies in the field of ontologies automatic learning of the quran.methodology: the research was conducted by the scoping review method in accordance withprisma guidelines and based on arksey & o’malley procedure. this process describes aprotocol for matching the results of existing studies with research questions and criteria. thefive steps suggested by arksey & o’malley are as follows: 1. identify and design the researchquestion(s), 2. conduct search strategies advocate for relevant studies through the selection ofappropriate keywords and boolean operators, 3. final selection of relevant studies, consideringthe inclusion and exclusion criteria, 4. tabulating the data, and finally, 5. reporting its results.sources were searched in seven scientific databases including emerald, science direct, ieeexplore digital library, google scholar.
Keywords	ontology automatic learning ,quran ontologies ,semantic technology ,knowledge extraction ,data mining