تشخیص موضوع داده های شبکه اجتماعی توییتر با استفاده از گراف دوبخشی ناهمگن و آنتروپی
|
|
|
DOR
|
20.1001.2.9920064087.1399.4.1.34.8
|
نویسنده
|
نظری محمد ,آقاجانی محمد ,خنجری میانه عیناله
|
منبع
|
كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي - 1399 - دوره : 4 - چهارمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی - کد همایش: 99200-64087
|
چکیده
|
امروزه، با توسعه روزافزون فناوری اطلاعات و استفاده گسترده از آن، اینترنت به عنوان یک حامل اطلاعات، به تدریج جایگزین رسانههای سنتی مانند روزنامه و تلویزیون شده است. توییتر به عنوان یک شبکهی اجتماعی سهم فراوانی از دادههای تولید شده در اینترنت را دارد. به طور متوسط در هر روز 500 میلیون پیام (توییت) توسط مردم ارسال میشود. توییت ها شامل گزارشاتی از داستانهای روزمره زندگی گرفته تا آخرین اخبار و رویدادهای جهان به ما میدهد. شناسایی موضوعات مورد بحث کاربران در زمینههای بسیاری مانند هشدار بلایای طبیعی، ارزیابی افکار کاربران و پیشبینی ترافیک دادهای میتواند مورد استفاده قرار بگیرد. در این مقاله، ما برای تشخیص موضوع هر توییت، یک روش بر پایهی گراف دوبخشی ناهمگن ارائه میکنیم. در این روش پس از خوشهبندی اسناد با روش انتشار برچسب در گراف، با استفاده از معیار معرفی شده بر پایه آنتروپی، سعی میکنیم کلیدواژههایی را به عنوان نماینده هر موضوع برگزینیم که تمایز بین خوشهها را نیز به خوبی نشان دهد. ما عملکرد روش ارائه شده را در سه مجموعه داده متفاوت با روشهای پیشین مقایسه میکنیم. با مقایسهی عملکرد روش ارائه شده در این مقاله پیمیبریم که در اسناد با طول کوتاه روش ما میتواند دقتی بهتر از روشهای شناخته شدهی lsi و lda ارائه کند.
|
کلیدواژه
|
تشخیص موضوع ,استخراج موضوع ,مدلسازی موضوعی
|
آدرس
|
دانشگاه علم و صنعت ایران, ایران, دانشگاه علم و صنعت ایران, ایران, دانشگاه علم و صنعت ایران, ایران
|
|
|
|
|
|
|