|
|
امکان سنجی توسعه هستی شناسی به روش نیمه خودکار مبتنی بر تحلیل بسامد واژگان: مطالعه موردی بیماری «گلوکوم»
|
|
|
|
|
نویسنده
|
تمجید سمیه ,نوشین فرد فاطمه ,حسینی بهشتی ملوک السادات ,حریری نجلا ,باب الحوائجی فهیمه
|
منبع
|
پژوهشنامه پردازش و مديريت اطلاعات - 1402 - دوره : 39 - شماره : 1 - صفحه:131 -156
|
چکیده
|
تغییر رویکرد نظامهای اطلاعاتی از پردازش واژه به پردازش مفهوم، موجب توجه به هستیشناسیها شده است. در علوم پزشکی و بیماریهای انسان به لحاظ وجود تنوع در اصطلاحات و لزوم اشتراک اطلاعات از طریق نرمافزارهای مختلف مانند پروندههای پزشکی، سامانههای ثبت سوابق بهداشتی و ... بهکارگیری هستیشناسیها ضروری به نظر میرسد. در پژوهش حاضر، رویکردی نیمهخودکار برای توسعه هستیشناسی پیشنهاد شده است که میتواند با استفاده از ابزارهای متنکاوی، شناسایی مولفههای ساختاری هستیشناسی و تعیین نسبی روابط را از متون علمی تسهیل کند. مدل پیشنهادی در قالب کد نرمافزاری با نام اختصاری tmbont_alfa ارائه شده است. این کد با استفاده از رابط کاربر، فایل متنی ورودی را فراخوانی کرده و پس از پردازش بر اساس تنظیمات، اصطلاحات کلیدی برای توسعه هستیشناسی را استخراج میکند. بهمنظور ارزیابی کارایی روش پیشنهادی، مطالعه موردی در حوزه بیماری «گلوکوم» با دادههای متنی مشتمل بر10،000 چکیده مقاله از «پابمد» بر مبنای جستوجوی واژگانی تهیه گردید. پس از مراحل پردازش، مفاهیم و ساختار سلسلهمراتبی هستیشناسی حاصل در نرمافزار «پروتژ» وارد شد. سرانجام، سنجش قیاسی هستیشناسی توسعهیافته با سرعنوانهای موضوعی پزشکی «مش»، «اصطلاحنامه وتوصیفگرهای پزشکی فارسی» و «هستیشناسی بیماریها» و «هستیشناسی زیستپزشکی» نشان داد که میانگین دقت مفاهیم و میانگین دقت مکانی مفاهیم بیش از 70 درصد با هستیشناسیهای بازنماییشده در پایگاههای معتبر هستیشناسی بیماریهای انسانی انطباق داشته و بهطور میانگین بیش از 30 درصد واژگان جدید برای افزودن به دامنه را فراهم کرده است.
|
کلیدواژه
|
هستیشناسی، متنکاوی، بازنمایی دانش، «گلوکوم»، بیماریهای انسان، پروتژ
|
آدرس
|
دانشگاه آزاد اسلامی واحد علوم تحقیقات, ایران, دانشگاه آزاد اسلامی واحد علوم تحقیقات, ایران, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), ایران, دانشگاه آزاد اسلامی واحد علوم تحقیقات, ایران, دانشگاه آزاد اسلامی واحد علوم تحقیقات, ایران
|
پست الکترونیکی
|
f.babalhavaeji@gmail.com
|
|
|
|
|
|
|
|
|
feasibility study of ontological development using semi-automatic method based on lexical frequency analysis: a case study of “glaucoma”
|
|
|
Authors
|
tamjid somayeh ,nooshinfard fatemeh ,hoseini beheshti molouk sadat ,hariri nadjla ,babolhavaeji fahimeh
|
Abstract
|
following recent trends in information management systems, conventional word-based information retrieval methods are changing to concept-based approaches by means of the broad application of ontologies. more specifically, the use of ontologies for knowledge management is significant in the medical sciences and human disease domains due to the diversity and necessity of information sharing between numerous data repositories such as medical records, health record systems, and so on. furthermore, ontologies make natural language processing approaches more feasible by reducing semantic ambiguity and making concepts comprehensible to computer-based deductions. in this research, a semi-automated approach for ontology development is proposed, which assists in identifying structural components of an ontology and determining possible relations between them based on scientific text records. the proposed approach, in a general view, includes the gathering of a large volume of technical data in text format, processing, and extraction of results with a minimal contribution of human-based supervision. the processing stage is coded in matlab code named tmbont_alfa and applies two main techniques including word frequency and lexico-synactic patterns analysis, to identify concepts and relations, respectively. the role of the human supervisor is narrowed to entering target terms, eliminating unnecessary outputs, and finalizing the ontology structure. in order to evaluate the efficiency of the proposed method, a case study for ontological development in the field of glaucoma has been conducted, and results are compared with medical subject headings of mesh descriptors, the persian medical thesaurus, ontology of diseases, and bioassay ontology (bao).according to results, the developed ontology, when compared by glaucoma entry, covered 80% of the medical titles in mesh, 100% of the medical terms developed in the persian medical thesaurus, and 100% of the persian medical descriptors. moreover, the resultant ontology structure is compatible with more than 90% of the same ontology represented in bioassay and 57% of the ontology of diseases (do). it also proposed an average of 30% more terms for existing ontological structures.according to results, the developed ontology, when compared by glaucoma entry, covered 80% of the medical titles in mesh, 100% of the medical terms developed in the persian medical thesaurus, and 100% of the persian medical descriptors. moreover, the resultant ontology structure is compatible with more than 90% of the same ontology represented in bioassay and 57% of the ontology of diseases (do). it also proposed an average of 30% more terms for existing ontological structures.
|
Keywords
|
ontology ,text mining ,information representation ,glaucoma ,eye disease ,medical thesaurus ,protégé
|
|
|
|
|
|
|
|
|
|
|