|
|
بررسی نظرکاوی جملات فارسی با تکنیک های n-grams
|
|
|
DOR
|
20.1001.2.0020135610.1400.4.1.309.2
|
نویسنده
|
نعمتی عماد ,دانشجو پریسا
|
منبع
|
همايش ملي فناوريهاي نوين در مهندسي برق، مكانيك و كامپيوتر ايران - 1400 - دوره : 4 - چهارمین همایش ملی فناوریهای نوین در مهندسی برق، مکانیک و کامپیوتر ایران - کد همایش: 00201-35610
|
چکیده
|
در سال های اخیر رشد انبوه محتوای تولید شده توسط کاربران مانند شبکه های اجتماعی و سایت های بازاریابی آنلاین به مردم اجازه می دهد تا احساسات و نظرات خود را در بسیاری از نظرهای مربوط به محصولات و خدمات مختلف به اشتراک بگذارند. تجزیه و تحلیل احساسات منبع مهمی برای تصمیم گیری بهتر می باشد که با استفاده از پردازش زبان طبیعی nlp، تکنیک های محاسباتی و تجزیه و تحلیل متن برای استخراج قطبیت اسناد بدون ساختار و روش های یادگیری ماشین تحت نظارت و روش های یادگیری عمیق بررسی می شود. پیچیدگی زبان های انسانی و تحلیل احساسات یک زمینه تحقیقاتی چالش برانگیز در علوم رایانه و زبان شناسی محاسباتی ساخته اند. در این پژوهش با استفاده از نظرات فارسی تلفن همراه سایت دیجی کالا در تکنیک های مختلف n-grams و با الگوریتم های یادگیری ماشین از جمله بیز ساده، ماشین بردار پشتیبان، کاهش گرادیان تصادفی، رگرسیون لجستیک و جنگل تصادفی و هم چنین استفاده این الگوریتم ها در تکنیک های مختلف n-grams در هفت برند مختلف تلفن همراه از جمله huawei، lg، samsung، sony، htc، nokia و apple و به منظور دست یابی به عملکرد آن ها براساس پارامترهایی مانند صحت، بازیابی و دقت مورد بررسی قرار داده-ایم. در نتیجه در همه روش های n-grams به جز روش سه واژه ای دقت و صحت و بازیابی به دست آمده توسط الگوریتم جنگل تصادفی بین 88 تا 91 درصد و هم چنین دقت به دست آمده توسط الگوریتم جنگل تصادفی با میانگین 99 درصد و الگوریتم کاهش گرادیان تصادفی با میانگین 98 درصد در تمام برندهای مختلف عملکرد بهتری نسبت به الگوریتم های دیگر دارند.
|
کلیدواژه
|
شبکه اجتماعی ,الگوریتم هوشمند ,n-grams ,دیجی کالا ,تلفن همراه
|
آدرس
|
دانشگاه آزاد تهران غرب, ایران, دانشگاه آزاد تهران غرب, ایران
|
پست الکترونیکی
|
daneshjoo.p@wtiau.ac.ir
|
|
|
|
|
|
|
|
|
Survey of Persian sentences by N-grams techniques
|
|
|
Authors
|
|
Abstract
|
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|