|
|
|
|
توصیه برچسب در شبکههای اجتماعی با کمک خلاصهسازی متن و k-نزدیکترین همسایه
|
|
|
|
|
|
|
|
نویسنده
|
رحیمی رسکتی مهسا ,موتمنی همایون ,اکبری ابراهیم ,نعمت زاده حسین
|
|
منبع
|
پردازش علائم و داده ها - 1403 - شماره : 4 - صفحه:15 -28
|
|
چکیده
|
امروزه استفاده از شبکههای اجتماعی به میزان فزایندهای افزایش یافتهاست. یکی از مهمترین مسائل در این فضا بالابردن میزان بازدید پست یا پیام افراد است و بهترین عاملی که میتواند در این امر کمک کند برچسبها هستند. برچسب ها به طور گسترده ای در نظم دهی و جستوجو در میان داده های عظیم موجود نقش دارند، در حال حاضر ایجاد برچسب بهصورت خودکار بهشدت مورد توجه قرار گرفتهاست. در این مقاله سعی شدهاست تا با کمک خلاصه سازی متن، از روی داده ها، یکسری واژههای کلیدی پیشنهادی ایجاد کرد و با کمک آن یک پیشنهاددهنده برچسب ارائه کرد؛ بنابراین این مقاله با ترکیب روشهای خوشهبندی، خلاصهسازی و توصیه پیشنهاد راهکار جدیدی ارائه دادهاست. در روش پیشنهادی با کمک مدل مخزن واژههای (bow)، تحلیل معنایی آشکار (esa) و ترکیب آن ها با الگوریتم k-نزدیک ترین همسایه (k-nn)، یکسری برچسب پیشنهادی برای شبکه های اجتماعی تهیه شدهاست؛ به این صورت که ابتدا با کمک مدل مخزن واژهها، لغتنامهای از واژهها ایجاد میشود. سپس با کمک الگوریتم k-نزدیک ترین همسایه ترکیبشده با esa خوشهبندی صحیح و قوی از واژهها به وجود میآید و در نهایت منجر به برچسبهای پیشنهادی مناسب میشود. راهکار پیشنهادی بر روی دو دیتاست عمومی مورد بررسی قرار گرفت و نتایج برتری خود را نسبت به سایر روش های مشابه نشان داد. [1] tag[2] bag of words[3] explicit semantic analysis
|
|
کلیدواژه
|
توصیه برچسب، خلاصهسازی متن، تعبیه واژه، k نزدیکترین همسایه، bow
|
|
آدرس
|
آموزش و پرورش استان مازندران, ایران, دانشگاه آزاد اسلامی واحد ساری, دانشکده مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد ساری, دانشکده مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد ساری, دانشکده مهندسی کامپیوتر, ایران
|
|
پست الکترونیکی
|
hn_61@yahoo.com
|
|
|
|
|
|
|
|
|
|
|
|
|
tag recommendation in social networks with the help of text summarization and knn
|
|
|
|
|
Authors
|
rahimi resketi mahsa ,motameni homayun ,akbari ebrahim ,nematzadeh hossein
|
|
Abstract
|
in recent years, the utilization of social networks has surged markedly, with interest in their use escalating daily. a pivotal concern is augmenting the number of views for individuals’ posts or messages to enhance their popularity. the most effective means to achieve this objective is through the use of tags. tags significantly contribute to the organization and retrieval of existing data, and the automatic generation of tags has garnered substantial attention. tag recommendation from textual sources can be approached as a text extraction issue. this paper endeavors to propose a comprehensive set of suggested keywords derived from data via advanced text summarization techniques, culminating in the presentation of a sophisticated tag recommender. consequently, this research introduces an innovative and robust solution by integrating clustering, summarization, and recommendation methodologies. initially, utilizing the bag of words (bow) model, comprehensive word parsing and extraction of word roots are performed. this process yields a bag of words capable of facilitating deep semantic exploration. the data is meticulously simplified to its core elements, with prepositions and repetitions omitted. verbs, due to their high frequency and significance depending on the context of the sentence or post, are mined separately. other words are judiciously selected based on their frequency and importance, and stored with their repetition counts. subsequently, employing the k-nearest neighbor (knn) clustering algorithm, the data is clustered, and the cluster representatives serve as the output tags. a slight modification is made to the knn algorithm by incorporating the explicit semantic analysis (esa) method for precise scale calculations. the proposed solution was rigorously evaluated on two public datasets: tpa, extracted by aminer, and ag, extracted by cometomyhead. the ag dataset comprises 127,600 news articles, categorized into four distinct tag types. each category contains 30,000 training samples and 1,900 test samples, with a total of 31,900 tags representing global, sports, business, and scientific concepts. the findings of this study were compared with those from 13 similar research papers, which fall into four distinct categories: machine learning, long-short-term memory (lstm), convolutional neural network (cnn), and capsule-based models. the comparative analysis revealed that the proposed method demonstrates superior accuracy, comprehensive coverage, and an enhanced f-measure.the integration of advanced text analytics techniques underscores the significance of this study in the broader context of information retrieval and data mining. by harnessing the power of semantic analysis and machine learning, this research provides a novel framework that not only enhances the efficiency of tag recommendation systems but also contributes to the theoretical foundation of automated keyword extraction. the implications of these findings are far-reaching, with potential applications extending beyond social networks to other domains requiring efficient data organization and retrieval.
|
|
Keywords
|
label recommendation ,text summarization ,word embedding ,k-nearest neighbor ,bow
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|