|
|
|
|
تشخیص هویت نویسنده اسناد متنی مبتنی بر یادگیری عمیق
|
|
|
|
|
|
|
|
نویسنده
|
آهنگری سینا ,مجیدزاده کامبیز ,بابازاده سنگر امین
|
|
منبع
|
سومين كنفرانس ملي كامپيوتر،فناوري اطلاعات و كاربردهاي هوش مصنوعي - 1398 - دوره : 3 - سومین کنفرانس ملی کامپیوتر،فناوری اطلاعات و کاربردهای هوش مصنوعی - کد همایش: 98190-23419 - صفحه:0 -0
|
|
چکیده
|
بطور کلی تشخیص نویسنده متون تلاشی برای نشان دادن خصوصیات تولیدکننده یا نویسنده یک تکه از اطلاعات زبانی تعریف میشود، به طوریکه بتوان بین متون مختلف که نوشته افراد مختلف اند، تمایز قائل شویم .شناسایی نویسنده از روی نثر سبک و شیوه نوشتاری، یا به عبارت دیگر ویژگیهای نهفته در متون نوشته شده توسط وی می باشد.ترکیب خصوصیات نوشتاری مانند طول کلمات، چینش پاراگرافها، پرمایگی واژگان، استفاده از کلمات تابعی و غیره را تشکیل میدهند. از طریق این خصیصه های سبک شناختی، که معمولا در طول نوشتار یک فرد ثابت هستند شناسایی هویت نویسنده متون انجام میگیرد.در ارائه روشهای تشخیص نویسنده متون نکته حائز اهمیت، انتخاب ویژگیهای کلیدی و حذف ویژگیهای اضافی و غیرمرتبط در تشخیص نویسنده متون میباشد. لذا از اینرو ما در این مقاله روشی براساس شبکه های عصبی و یادگیری عمیق برای انتخاب ویژگیها در تشخیص نویسنده اسناد متنی ارائه دادیم. با استفاده از مجموعه داده های روییتر، تعداد متون دسته بندی شده درست، نادرست و مقدار معیارهای ارزیابی دقت، در روش پیشنهادی مورد بررسی و ارزیابی قرار گرفته شده است. ارزیابی نتایج ، بازخوانی، صحت بیانگر دقت بالا و نتایج بهینه روش پیشنهادی درمقایسه با سایر روشهای استخراج ویژگیهای متون درتشخیص هویت نویسنده اسناد متنی میباشد.
|
|
کلیدواژه
|
احراز هویت نویسنده ، حریم خصوصی، شبکه عصبی پیچیده، سبک نوشتاری، افزایش امنیت متون
|
|
آدرس
|
, iran, , iran, , iran
|
|
پست الکترونیکی
|
bsamin2@liveutm.onmicrosoft.com
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|