ساخت هستان شناسی دانش عرفی زبان فارسی با رویکردی تلفیقی

Fa | Ar | En

ساخت هستان شناسی دانش عرفی زبان فارسی با رویکردی تلفیقی


نویسنده	مرادی مهدی ,وزیرنژاد بهرام ,بحرانی محمد
منبع	پژوهشنامه پردازش و مديريت اطلاعات - 1394 - دوره : 31 - شماره : 1 - صفحه:113 -127
چکیده	تجهیز رایانه‌ها به دانش عرفی بشر همواره یکی از جاه‌طلبانه‌ترین اهداف علم هوش مصنوعی بوده است. میلیون‌ها دلار هزینه و هزاران ساعت‌ زمان صرف شده تا رایانه‌ها بفهمند که “اشیا بالا نمی‌روند، بلکه می‌افتند” و “دویدن از راه رفتن سریع‌تر است”. پایگاه‌های دانش عظیمی ساخته شد، روش‌های خودکار و نیمه‌خودکار متن‌کاوی پیشنهاد شده و از انگیزه همکاری کاربران عادی اینترنت به نفع اکتساب این دانش بهره‌ها برده شده است. ولی رسیدن به روشی خودکار، موثر و کم خطا همچنان به‌صورت چالشی بزرگ پیش روی جامعه هوش مصنوعی باقی‌مانده است. هدف این تحقیق ساخت هستان‌شناسی دانش عرفی فارسی به کمک سه روش مبتنی بر الگو، ترجمه ماشینی و استفاده از منابع ساخت‌یافته است. با کمک سه پیکره مختلف فارسی هفت نوع رابطه و در مجموع هفتاد هزار اظهار (رابطه) استخراج شده و در قالب یک هستان‌شناسی ارائه گشت. نتایج بررسی گویش‌وران فارسی نشان داد که میانگین دقت روابط استخراج‌شده این هستان‌شناسی برابر با 75% برای روش مبتنی بر الگو، 70% برای ترجمه ماشینی و 100% برای اطلاعات استخراج‌شده از جعبه اطلاعات بود.
کلیدواژه	دانش عرفی، هستان شناسی، استخراج رابطه
آدرس	دانشگاه صنعتی شریف, ایران, دانشگاه صنعتی شریف, ایران, دانشگاه صنعتی شریف, ایران
پست الکترونیکی	bahrani@sharif.edu

Commonsense knowledge extraction for Persian language: A combinatory approach

Authors	Moradi Mehdi ,Vazirnezhad Bahram ,Mohammd Bahrani
Abstract	Putting human commonsense knowledge into computers has always been a long standing dream of artificial intelligence (AI). The cost of several tens of millions of dollars and times have been covered so that the computers could know about “objects falling, not rising.”,” running is faster than walking. The large database was built, automated and semiautomated methods were introduced and volunteers’ efforts were utilized to achieve this, but an automated, highthroughput and lownoise method for commonsense collection still remains as the holy grail of AI. The aim of this study was to build commonsense knowledge ontology using three approaches namely Hearst method, machine translation and using structured resources. Using three Persian corpuse and Applying aforementioned methods, we could extract 7 different relations. 70000 assertions have been extracted. Finally, average accuracy of Hearst, MT and structured resource were 75%, 75% and 100% respectively.
Keywords