پیشنهاد هشتگ در سیستمهای میکروبلاگ توسط بردار موضوعی: مورد کاربرد توئیتر
|
|
|
|
|
نویسنده
|
تاجبخش سامان ,باقرزاده جمشید
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1397 - دوره : 16 - شماره : 4 - صفحه:319 -326
|
چکیده
|
با معرفی وب 2.0، دادههای ایستا که در وب 1.0 وجود داشتند، حالت ساختیافتهتری به خود گرفتند. ویکیها، بلاگها، شبکههای اجتماعی و سیستمهای بوکمارکینگ اجتماعی مثالهایی از آن هستند که کاربران در آنها محتوا تولید میکنند. یکی از مشکلات تولید محتوا توسط کاربر، عدم یکپارچگی محتوای تولیدشده میباشد که باعث تولید دادههای ناهمگون شده و اجرای الگوریتمها و تکنیکهای کامپیوتری را دشوار میسازد. راه حل وب 2.0 برای کاهش اثر این مشکل، استفاده از هشتگ (تگ) برای مطالب منتشرشده توسط کاربر است که خود کاربر به مطالب منتشرشده خود، تگ میزند. این راهکار در میکروبلاگهایی چون توئیتر کماکان رفع نشده است چرا که کاربران با محدودیت کاراکتری (140 کاراکتر برای هر توئیت) مواجه هستند و ممکن است تعداد کاراکترهای محتوا باعث شود که برخی کاراکترهای هشتگ در پست نباشد. در این مقاله سعی شده تا با استفاده از روش تخصیص دیریکله نهفته و نمونهبرداری gibbs فروریخته، مشکل پیشنهاد هشتگ در محیط ناهمگون توئیتر رفع شود. پیشنهاد هشتگ بر روی 8396744 توئیت به زبان انگلیسی پیادهسازی و در آزمایشهای مختلف بین 1 تا 5 مرتبطترین هشتگ پیشنهاد شده است. نتایج در حالات مختلف دقت بالای 20% و فراخوانی بالای 45% را نشان میدهد که نشانگر افزایش دقت از 3% به 21% و افزایش فراخوانی از 32% به 46% در مقایسه با دقیقترین روش بررسیشده پیشنهاد هشتگ توسط lda بدون تغییر، توسط نویسندگان است.
|
کلیدواژه
|
سیستمهای توصیهگر، توصیه هشتگ، بردار موضوعی، تخصیص دیریکله نهفته، نمونهبرداری gibbs، میکروبلاگ، توئیتر
|
آدرس
|
دانشگاه ارومیه, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه ارومیه, دانشکده فنی و مهندسی, ایران
|
پست الکترونیکی
|
j.bagherzadeh@urmia.ac.ir
|
|
|
|
|