|
|
|
|
تشخیص خودکار متون تولید شده توسط ماشین مبتنی بر مدل های زبانی و یادگیری عمیق
|
|
|
|
|
|
|
|
نویسنده
|
شیرافکن ابوالفضل ,نقوی مهدی ,میرزایی میثم
|
|
منبع
|
پژوهشهاي نظري و كاربردي هوش ماشيني - 1403 - دوره : 2 - شماره : 1 - صفحه:142 -154
|
|
چکیده
|
امروزه با رشد چشمگیر هوش مصنوعی و تولیدات آن، فرصت ها و تهدیدات زیادی به وجود آمده است. یکی از معروفترین و محبوبترین تولیدات هوش مصنوعی تولید متن است که به آن متن ماشینی نیز گفته میشود. در این پژوهش روش جدیدی معرفی میشود که ویژگیهای استخراج شده از متن را با ویژگیهای ساختاری آن ترکیب کرده و به این ترتیب برای تشخیص متن نوشته شده توسط انسان و متن تولیدی هوشمصنوعی، یک متمایزگر خودکار ایجاد میکند. روش معرفی شده متشکل از دو بخش میباشد، بخش اول: مدل توسعه یافتهی (roberta) bert و مدل حافظهای کوتاه مدت بلند مدت دو سویه (bilstm) است که با لایهی ادغام بهبود یافتهاند. بخش دوم: ویژگیهای ساختاری متن با روشی مبتنی بر سبک نوشتار استخراج میشود. در نهایت خروجی بخشهای مدل باهم ترکیب شده و به این ترتیب مدل متن نوشته شده توسط انسان را از متن تولید شده توسط ماشین تشخیص میدهد. نتایج حاصل از این پژوهش نشان میدهد که روش پیشنهادی با دقت 90 درصدی قابلیت تشخیص متون ماشینی را داشته و عملکرد مطلوبی را از خود به نمایش میگذارد.
|
|
کلیدواژه
|
یادگیری عمیق، مدل مبتنی بر سبک نوشتار، roberta ، bilstm
|
|
آدرس
|
دانشگاه جامع امام حسین(ع), دانشکده و پژوهشکده هوش مصنوعی و علوم شناختی, ایران, دانشگاه جامع امام حسین(ع), دانشکده و پژوهشکده هوش مصنوعی و علوم شناختی, ایران, دانشگاه جامع امام حسین(ع), دانشکده و پژوهشکده هوش مصنوعی و علوم شناختی, ایران
|
|
پست الکترونیکی
|
krmmirzai@ihu.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
|
automatic detection of machine-generated texts based on linguistic models and deep learning
|
|
|
|
|
Authors
|
shirafkan abolfazl ,naghavi mahdi ,mirzaee meysam
|
|
Abstract
|
today, with the significant growth of artificial intelligence and its products, many opportunities and threats have emerged. one of the most famous and popular products of artificial intelligence is text generation, also called machine text. in this research, a new method is introduced that combines features extracted from the text with its structural features, thus creating an automatic discriminator to distinguish between human-written text and artificial intelligence-generated text. the introduced method consists of two parts, the first part: the extended bert (roberta) model and the bidirectional long-term short-term memory (bilstm) model, which are improved with the fusion layer. the second part: the structural features of the text are extracted using a writing style-based method. finally, the output of the model parts is combined together, and in this way, the model distinguishes human-written text from machine-generated text. the results of this research show that the proposed method is capable of recognizing machine texts with 90% accuracy and exhibits good performance.
|
|
Keywords
|
deep learning ,writing style based model ,roberta ,bilstm
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|