|
|
شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق
|
|
|
|
|
نویسنده
|
سدیدپور سعیده سادات ,حاجی غلامرضا مینا ,محمدزاده محمدرضا ,محمدی محمدرضا ,کیوان راد محمدعلی
|
منبع
|
پدافند الكترونيكي و سايبري - 1401 - دوره : 10 - شماره : 2 - صفحه:43 -56
|
چکیده
|
امروزه، شناسایی متون مشابه، موضوعی با کاربردهای فراوان میباشد که با توجه به اهمیت آن، توسط پژوهشگران زبانهای مختلف مورد تحلیل و بررسی قرار گرفته است. در گذشته اغلب برای درک جملات توسط سامانه های رایانهای، جملات بهصورت مجموعه کلمات مورد بررسی قرار می گرفتند. اما امروزه، با گسترش فناوری و استفاده از شبکه های عصبی عمیق، میتوان از خود جملات، مفهوم اصلی را استخراج نمود. بنابراین، رسیدن به مدلی که بتواند جملات را کدگذاری کرده و مفهوم اصلی جمله را با دقت هر چه بیشتر استخراج نماید، یکی از نیازهای ضروری برای این هدف به شمار می رود. این مقاله قصد دارد تا میزان شباهت جملات را از نقطه نظر معنایی بهدست آورد که از روشهای یادگیری عمیق استفاده میکند. از آنجایی که روشهای یادگیری عمیق نیاز به داده آموزشی زیادی دارند، این مقاله از ایده نگاشت بین زبانی بهره میبرد. روش پیشنهادی، فضای برداری تعبیه کلمات انگلیسی را به فارسی نگاشت کرده و با کمک مدل آموزش داده شده در زبان انگلیسی، شباهت جملات فارسی بهدست میآید. درنهایت، نتایج نهایی با امتیازات انسانی مورد مقایسه قرار گرفته است. نتایج حاصل از روش پیشنهادی، میزان دقت این سامانه پیشنهادی را 89 درصد ارائه میدهد که نسبت به سایر مدل های یادگیری عمیق برتری دارد.
|
کلیدواژه
|
استخراج مفهوم جملات، تعبیه کلمات، یادگیری عمیق، مشابهتیابی، تطبیق فضای برداری
|
آدرس
|
دانشگاه صنعتی مالکاشتر, ایران, دانشگاه صنعتی مالک اشتر, ایران, دانشگاه صنعتی مالک اشتر, ایران, دانشگاه صنعتی مالک اشتر, ایران, دانشگاه صنعتی مالکاشتر, ایران
|
پست الکترونیکی
|
keyvanrad@chmail.ir
|
|
|
|
|
|
|
|
|
investigation of the semantic similarity of persian sentences using vector space adaptation and deep learning
|
|
|
Authors
|
sadidpour s.s ,haji gholamreza m ,mohammadzadeh m.r ,mohammadi mohammad reza ,keyvanrad m.a
|
Abstract
|
nowadays, similar texts recognition is a subject with many applications and due to its significance, has been analyzed and studied in various languages by researchers. in the past, sentences were often used as a set of words to be understood by computer systems. but today, with the spread of technology and the use of deep neural networks, the main concept of sentences can be extracted from the sentences themselves. therefore, achieving a model that can encode sentences and extract the main concept of the sentence as accurately as possible is one of the essential needs for this purpose.this paper intends to use deep learning methods to evaluate the degree of semantic similarity between sentences. as the deep learning methods need many data, this paper employs an inter-linguistic mapping idea. the proposed method maps an english word embedding vector space into persian, and persian sentence similarity is calculated by a trained model in english and finally the outcome is compared with human scores. the results of the proposed method show the accuracy of the proposed system to be 89%, which is superior to other deep learning models.
|
|
|
|
|
|
|
|
|
|
|
|
|