>
Fa   |   Ar   |   En
   تشخیص موضوع داده های شبکه اجتماعی توییتر با استفاده از گراف دوبخشی ناهمگن و آنتروپی  
   
DOR 20.1001.2.9920064087.1399.4.1.34.8
نویسنده نظری محمد ,آقاجانی محمد ,خنجری میانه عین‌اله
منبع كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي - 1399 - دوره : 4 - چهارمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی - کد همایش: 99200-64087
چکیده    امروزه، با توسعه روزافزون فناوری اطلاعات و استفاده گسترده از آن، اینترنت به عنوان یک حامل اطلاعات، به تدریج جایگزین رسانه‌های سنتی مانند روزنامه و تلویزیون شده است. توییتر به عنوان یک شبکه‌ی اجتماعی سهم فراوانی از داده‌های تولید شده در اینترنت را دارد. به طور متوسط در هر روز 500 میلیون پیام (توییت) توسط مردم ارسال می‌شود. توییت ها شامل گزارشاتی از داستان‌های روزمره زندگی گرفته تا آخرین اخبار و رویداد‌های جهان به ما می‌دهد. شناسایی موضوعات مورد بحث کاربران در زمینه‌های بسیاری مانند هشدار بلایای طبیعی، ارزیابی افکار کاربران و پیش‌بینی ترافیک داده‌ای می‌تواند مورد استفاده قرار بگیرد. در این مقاله، ما برای تشخیص موضوع هر توییت، یک روش بر پایه‌ی گراف‌ دوبخشی ناهمگن ارائه می‌کنیم. در این روش پس از خوشه‌بندی اسناد با روش انتشار برچسب در گراف، با استفاده از معیار معرفی شده بر پایه آنتروپی، سعی می‌کنیم کلیدواژه‌هایی را به عنوان نماینده هر موضوع برگزینیم که تمایز بین خوشه‌ها را نیز به خوبی نشان دهد. ما عملکرد روش ارائه شده را در سه مجموعه داده متفاوت با روش‌های پیشین مقایسه می‌کنیم. با مقایسه‌ی عملکرد روش ارائه شده در این مقاله پی‌می‌بریم که در اسناد با طول کوتاه روش ما می‌تواند دقتی بهتر از روش‌های شناخته شده‌ی lsi و lda ارائه کند.
کلیدواژه تشخیص موضوع ,استخراج موضوع ,مدل‌سازی موضوعی
آدرس دانشگاه علم و صنعت ایران, ایران, دانشگاه علم و صنعت ایران, ایران, دانشگاه علم و صنعت ایران, ایران
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved