|
|
روش های یادگیری خودکار هستی نگاشتها در حوزۀ مفاهیم قرآنی: مطالعۀ مروری دامنهای
|
|
|
|
|
نویسنده
|
میرعرب علی ,محمدی استانی مرتضی ,طباطبایی امیری فائزه سادات ,دهقانی سانیج سمیه
|
منبع
|
پژوهشنامه كتابداري و اطلاع رساني - 1402 - دوره : 13 - شماره : 2 - صفحه:27 -49
|
چکیده
|
مقدمه: امروزه فناوری های معنایی رویکرد جدیدی را در پردازش و بازنمون معارف قرآنی با هدف ارائۀ اطلاعات معنادار ارائه میدهند. هستی نگاشتها بهعنوان یکی از فناوریهای معنایی، ابزاری جهت بیان رسمی مفاهیم و روابط موجود در حوزۀ خاصی بوده که توسعه و کاربرد آن جهت استخراج معارف و علوم قرآنی مورد توجه قرار گرفته است. یادگیری هستینگاشتها و روشهای آن بهصورت خودکار جهت استخراج مفاهیم از مباحث مهم در حوزۀ وب معنایی و فناوریهای آن است. بهتازگی توسعه و کاربرد یادگیری هستینگاشتها جهت استخراج مفاهیم قرآنی مورد توجه قرار گرفته است. ازاینرو، هدف پژوهش حاضر، بررسی جامع یادگیری خودکار هستینگاشتها در حوزۀ استخراج مفاهیم قرآنی بهمنظور شفافسازی وضعیت فعلی و آینده است. معیارهای مورد بررسی مجموعه دادهها، روشهای یادگیری، روشهای ارزیابی، نتایج و پیشنهادهای آتی پژوهشها در حوزۀ یادگیری خودکار هستینگاشتهای قرآنی بود.روششناسی: روش بررسی پژوهش حاضر، مرور دامنهای بر اساس دستورالعملهای پریزما و بر اساس رویۀ استفادهشده توسط آرکسی و امالی (2005) است. این فرآیند پروتکلی را بهمنظور تطبیق نتایج پژوهش موجود با سوالات و معیارهای تحقیق توصیف میکند. پنج مرحلۀ پیشنهادی آرکسی و امالی عبارتاند از: 1. شناسایی و طراحی سوال(ها) پژوهش، 2. انجام استراتژیهای جستجو برای استخراج مطالعات مرتبط از طریق انتخاب واژههای کلیدی مناسب و عملگرهای بولی، 3. انتخاب نهایی پژوهشهای مرتبط با تعیین معیارهای ورود و خروج، 4. خلاصهسازی و گزارش یافتهها و درنهایت، 5. گزارش و بحث پیرامون نتایج حاصل. جستجوی منابع در هفت پایگاه دادۀ علمی مشتمل برemerald, science direct, ieee xplore digital library, google scholar, web of science, scopus انجام شد. فرایند جستجو در فروردین 1402 صورت گرفت. تعداد 811 مقاله، بدون توجه به محدودۀ زمانی، مورد ارزیابی و انتخاب قرار گرفت. بهمنظور سازماندهی مقالات بازیابیشده، از نرمافزار مدیریت منابع اطلاعاتی اندنوت استفاده شد و پس از تطبیق عناوین در پایگاههای اطلاعاتی مختلف، تعداد 317 مقاله تکراری حذف گردید. پس از بررسی چکیدهها، معیارهای ورود و خروج و کیفیت مقالات اعمال گردید. همچنین بهمنظور جلوگیری از سوگیری در انتخاب مقالات، طی بررسی تصادفی مجددی، توسط دو پژوهشگر مستقل در حوزۀ یادگیری خودکار هستینگاشت نیز ارزیابی صورت گرفت و درنهایت تعداد 25 اثر بهعنوان ملاک مرور انتخاب گردید.یافته ها: یافتهها نشان داد اغلب پژوهشها در حوزۀ مجموعۀ دادههای قرآنی به زبانهای انگلیسی و عربی بودند و بخش عمده آنها نیز از ترجمۀ انگلیسی قرآن الهلالی و خان استفاده کردهاند. استفاده از مجموعه دادههای بسیار محدود، مهمترین محدودیت پژوهشهای انجام شده بود. بخش عمدۀ پژوهشها از روشهای نرمالسازی، خوشهبندی و دستهبندی متن، خلاصهسازی متن، استخراج اطلاعات، تشابه و یافتن موجودیتهای نامدار استفاده کردهاند. البته در برخی پژوهشها، روشهای هوش مصنوعی نظیر شبکۀ عصبی نیز به کار گرفته شده است. علاوه بر این، یافتهها نشان داد که الگوریتمهای دادهکاوی مبتنی بر روشهای آمار و احتمال برای یادگیری و ساخت هستینگاشتهای خودکار در میان محققان با محبوبیت روبرو شده است. همچنین از روشهای محاسبۀ دقت، فراخوانی و معیار f برای ارزیابی نتایج کاربرد الگوریتمهای یادگیری خودکار در هستینگاشتهای قرآنی استفاده کردهاند. پژوهشهایی که از روشهای هوش مصنوعی بهرهبرداری کردهاند، با تحلیل معنایی، استنتاج، مدلسازی و تایید اعتبار دادههای استنتاجشده به نتایجی مانند تشخیص صوت برای آموزش قرائت قرآن، تشخیص آرایههای ادبی و ایجاد ارتباطهای موضوعی در مفاهیم قرآنی و همچنین ایجاد ارتباط بین این مفاهیم با مفاهیم سایر ادیان نائل شدهاند. ارزیابی روشهای ارائهشده برای یادگیری خودکار هستینگاشتهای قرآنی نشان میدهد استفاده توامان از روشهای دادهکاوی و هوش مصنوعی نتایج بهتری را بههمراه دارد. بخش عمدۀ نتایج این حوزه در دو دسته کلی قرار دارد. دستۀ اول مبتنی بر بهکارگیری روشهای دادهکاوی، متنکاوی و یادگیری ماشین جهت استخراج خودکار مفاهیم و ابعاد سهگانه (فعل، فاعل، مفعول) بههمراه روابط معنایی از متن قرآن بود. دستۀ دیگر به مقایسه عملکرد روشها و الگوریتمهای مبتنی بر آمار و مشابهتیابی نظیر tf، tf-idf، ave-tf، ridf، tim، n-gram، freya، pos taggin، levenshtein، log likelihod، هِرسِت، و جز اینها در استخراج مفاهیم خودکار جهت ساخت هستینگاشت قرآنی پرداختهاند. یافتههای حاصل از بررسی کارهای آینده نشان از علاقۀ محققان به الگوریتمهای هوش مصنوعی و استفاده در یادگیری هستینگاشت و توسعۀ خودکار و نیمهخودکار هستینگاشتهای قرآنی دارد. فقدان مجموعه دادههای صحیح، دلیل عجز سامانههای هوش مصنوعی پیشرفتۀ دنیا مانند جیپیتی 4 است که در آینده باید به این مهم پرداخته شود.نتیجهگیری: نتایج این مطالعه میتواند به جهتدهی پژوهشهای آتی درباره بهترین روشها در توسعۀ خودکار هستینگاشتهای قرآنی کمک کند. این مسئله میتواند با طراحی هستینگاشت جامع قرآنی که تمام موضوعات و مفاهیم را با توجه به بافت قرآن، پوشش دهد، مدنظر قرار گرفته و با ایجاد هستینگاشتی جامع از مفاهیم قرآن، کاربران را بهسمت بازیابی دانش قرآنی رهنمون سازد. همچنین بهرهبرداری بیشتر از روشهای هوش مصنوعی و پردازش زبان طبیعی نظیر جی.پی.تی. بهعنوان مدل یادگیری ماشینی برای تولید متن به زبان طبیعی با استفاده از شبکۀ عصبی عمیق، در توسعۀ خودکار هستینگاشتهای قرآنی ضروری به نظر میرسد. با توجه به اینکه یادگیری ماشین مستلزم وجود دادههای کلان در حوزۀ قرآن است، ساخت مجموعه دادههای استاندارد ازجمله کارهای آتی محققان است.
|
کلیدواژه
|
یادگیری خودکار هستی نگاشت، هستی نگاشت قرآن، فناوری معنایی، استخراج دانش، داده کاوی
|
آدرس
|
پژوهشگاه علوم و فرهنگ اسلامی, گروه اشاعۀ اطلاعات و تبادل دانش, ایران, دانشگاه اصفهان, گروه علم اطلاعات و دانش شناسی, ایران, دانشگاه شهید چمران اهواز, ایران, دانشگاه علوم پزشکی ایران, ایران
|
پست الکترونیکی
|
so.dehghani@yahoo.com
|
|
|
|
|
|
|
|
|
methods of the ontologyautomatic learning in the fields of quranic concepts: a scoping review study
|
|
|
Authors
|
mirarab ali ,mohammadi ostani morteza ,tabatabaei amiri faezehsadat ,dehghanisanij somayeh
|
Abstract
|
objective: today, semantic technology offers a new approach in organizing quranic knowledge with the aim of providing meaningful information and representing quranic teachings. ontologies are a tool to formally express concepts and relationships in a specificdomain. in the same way, the development of ontology as a tool for representing the effulgenceand extracting the knowledge of the quran is not only valuable, but also necessary. ontologylearning and its methods automatically to extract concepts are important topics in the field ofsemantic web and its technologies. recently, the development and application of ontologieslearning for the extraction of quranic concepts has been considered. therefore, the aim of thecurrent research is to comprehensively investigate the ontologies automatic learning in the fieldof extracting knowledge and quranic concepts in order to clarify the current and futuresituation. the investigated criteria were data set, learning methods, evaluation methods, resultsand future suggestions of studies in the field of ontologies automatic learning of the quran.methodology: the research was conducted by the scoping review method in accordance withprisma guidelines and based on arksey & o’malley procedure. this process describes aprotocol for matching the results of existing studies with research questions and criteria. thefive steps suggested by arksey & o’malley are as follows: 1. identify and design the researchquestion(s), 2. conduct search strategies advocate for relevant studies through the selection ofappropriate keywords and boolean operators, 3. final selection of relevant studies, consideringthe inclusion and exclusion criteria, 4. tabulating the data, and finally, 5. reporting its results.sources were searched in seven scientific databases including emerald, science direct, ieeexplore digital library, google scholar.
|
Keywords
|
ontology automatic learning ,quran ontologies ,semantic technology ,knowledge extraction ,data mining
|
|
|
|
|
|
|
|
|
|
|