تحلیل احساسات کاربران در زبان فارسی مبتنی بر ترکیب روابط معنایی و جنگل تصادفی
|
|
|
|
|
نویسنده
|
روستائی محمد ,جوادزاده محمدعلی
|
منبع
|
هشتمين همايش ملي مطالعات و تحقيقات نوين در حوزه علوم كامپيوتر، برق و مكانيك ايران - 1401 - دوره : 8 - هشتمین همایش ملی مطالعات و تحقیقات نوین در حوزه علوم کامپیوتر، برق و مکانیک ایران - کد همایش: 01211-16575 - صفحه:0 -0
|
چکیده
|
امروزه، اگر شرکتها و فروشگاهها برای ارائه خدمات و محصولات بهتر نیاز به دانستن نظرات مشتریان داشته باشند، میتوانند به نظرات ثبتشده افراد در وب سایتهای اینترنتی یا انجمنها مراجعه کنند. بنابراین، بررسی نظرات کاربران نقش مهمی در آگاهی مشتری از محصولات دارد. با توجه به رواجِ عامیانه و محاورهای نوشتن در زبان فارسی و در نتیجه، فقدان ساختار مشخص در متون، مرحله پیشپردازش برای متن، مشکلِ اصلیِ تجزیهوتحلیل احساسات به زبان فارسی محسوب میشود. آنچه این مشکل را تشدید میکند، نبود کتابخانههای مناسب برای پیش پردازش زبان فارسی است. از همین رو در این پژوهش جهت تشخیص احساسات کاربرانِ سایت دیجیکالا، از نظرات ثبت شده در این سایت استفاده شده است. در تحلیل نظر، از یک فرآیند چند مرحلهای بهره گرفته شده است. در مرحلهی نخست عملیات پاکسازی دادهها صورت میگیرد و سپس عملیات استخراج ویژگی براساس روابط معنایی fasttext انجام میپذیرد. در بخش سوم، عملیات کاهشویژگی توسط شبکههای یادگیری عمیق انجام شده است. در بخش پایانی طبقهبندی نظرات با استفاده از الگوریتم جنگل تصادفی انجام گردیده است. معیارهای ارزیابی مورد استفاده در این پژوهش دقت، صحت، فراخوان و معیار f بوده که از نتایج آزمایشات به ترتیب مقادیر 98.5، 97، 98 و 97 به دست آمده است.
|
کلیدواژه
|
تجزیه و تحلیل احساسات، استخراج ویژگی، کاهش ویژگی، شبکههای یادگیری عمیق، طبقهبندی
|
آدرس
|
, iran, , iran
|
|
|
|
|
|
|