طبقهبندی محتوای متنی منتشرشده در شبکههای اجتماعی
|
|
|
DOR
|
20.1001.2.9920026053.1399.1.1.8.7
|
نویسنده
|
بهاریفرد فاطمه ,معتقد وحید
|
منبع
|
دومين كنفرانس ملي انفورماتيك ايران - 1399 - دوره : 2 - کنفرانس ملی انفورماتیک ایران - کد همایش: 99200-26053
|
چکیده
|
با رشد روز افزون شبکههای اجتماعی، میل به تحلیل محتوای منتشرشده برای مقاصد گوناگون افزایش یافته است. یک دسته از عمده فعالیتهایی که در این حوزه انجام میشود شناسایی و دستهبندی محتواهای تولیدشده است. این موضوع به معنی گروهبندی مطالب منتشرشده در دستههایی با موضوعات مشابه میباشد.در این مقاله، الگوریتم جدیدی برای دستهبندی محتوای متنی شبکههای اجتماعی ارائه شده است. در این الگوریتم ابتدا هر متن، پیشپردازش شده و سپس یک گراف ارتباطات جدید مبتنی بر محتوای متنهای منتشر شده ساخته میشود. این گراف وزندار و بیجهت است و روی آن با استفاده از یک روش بدون ناظر، تشکلهای مختلف شناسایی میشوند. برای ارزیابی الگوریتم پیشنهادی، بستر شبکه اجتماعی توییتر انتخاب و با api، دادههای متنی ارسالشده از شهر واشینگتن در یک بازه زمانی، جمعآوری و الگوریتم ارائهشده روی آن اعمال شده است. برای بررسی دقت، نتایج حاصل با دو الگوریتم کلاسیک k-means و lda بر اساس معیار اطلاعات متقابل نرمالشده، مقایسه شده است که نشاندهنده دقت مناسب الگوریتم پیشنهادی است.
|
کلیدواژه
|
شناسایی عنوان ,گراف وزندار ,یادگیری بدون ناظر ,شبکههای اجتماعی ,توییتر
|
آدرس
|
پژوهشگاه دانشهای بنیادی, ایران, پژوهشگاه دانشهای بنیادی, ایران
|
پست الکترونیکی
|
vahid.motaghed.2020@gmail.com
|
|
|
|
|