تشخیص نویسندگان یکسان مبتنی بر روش شبکههای یادگیری عمیق
|
|
|
DOR
|
20.1001.2.0020135610.1400.4.1.209.2
|
نویسنده
|
نیکوند پوریا ,بهرامی بهنام
|
منبع
|
همايش ملي فناوريهاي نوين در مهندسي برق، مكانيك و كامپيوتر ايران - 1400 - دوره : 4 - چهارمین همایش ملی فناوریهای نوین در مهندسی برق، مکانیک و کامپیوتر ایران - کد همایش: 00201-35610
|
چکیده
|
امروزه با توجه به گستردگی شبکههای اجتماعی شاهد فعالیت کاربران با سبکها و سلیقههای نگارشی متعدد در این شبکهها هستیم. یکی از چالشهای مهم در این تشخیص نویسنده متن با توجه به ویژگیهای متنی وی است. به علت نبود محدودیت برای عضویت در این شبکهها برخی افراد با ایجاد شناسههای کاربری متعدد به نوعی هویتهای مختلفی را از خود ارائه می دادند. این مساله در ادامه منجر شد تا در بستر اینترنت، فضایی برای چند هویتی شدن افراد به وجود آید. این موضوع به معنی آن است که افراد با نام و مشخصات فردی مختلف در حال فعالیت و به اشتراک گذاری محتوی در بستر فضای مجازی هستند. حال یکی از مهمترین چالشها در این زمینه شناسایی و تشخیص این نویسندگان و تصدیق چند هویتی بودن یک نویسنده است. ما در این مقاله محتوی و سبک نگارشهای متعدد که در شبکههای اجتماعی توییتر مورد هدف قرار دادیم. در ادامه، مجموعه دادهای را شامل پستهای شبکههای اجتماعی توییتر برای نویسندگان فارسی زبان، که شرایط چند هویتی داشتند را تهیه کردیم. سپس ویژگیهای نویسنده و به نوعی شیوه نگارشی بجا گذاشته شده از وی را در یک فضای ویژگی دسته بندی کردیم. در انتها نیز با استفاده از این ویژگیها، بردار ویژگی برای هر نویسنده بدست آورده و بر اساس آن، نویسندگان یکسان را از میان دیگر نویسندگان تشخیص دادیم.
|
کلیدواژه
|
پردازش زبان طبیعی ,شناسایی نویسنده ,تایید هویت نویسنده ,مشخصه نویسنده ,اِسناد نویسندگی
|
آدرس
|
شهید بهشتی, ایران, تربیتمدرس, ایران
|
پست الکترونیکی
|
behnambahrami31@gmail.com
|
|
|
|
|