Title of article :
Automatic Hashtag Recommendation in Social Networking and Microblogging Platforms Using a Knowledge-Intensive Content-based Approach
Author/Authors :
Jaderyan, M Department of Computer Engineering - Bu-Ali Sina University, Hamedan, Iran , Khotanlou, H Department of Computer Engineering - Bu-Ali Sina University, Hamedan, Iran
Abstract :
In social networking/microblogging environments, #tag is often used for categorizing messages and
marking their key points. Also, since some social networks such as twitter apply restrictions on the
number of characters in messages, #tags can serve as a useful tool for helping users express their
messages. In this paper, a new knowledge-intensive content-based #tag recommendation system is
introduced. The proposed system works by integrating structured knowledge in every core component.
First, the relevant features, semantic structures and information-content are extracted from messages.
Since little information can often be placed in a message, a content enrichment module is introduced to
identify information structures that can improve the representation of message. The extracted features
are represented by semantic network. Then, a hybrid and multi-layered similarity module identifies the
commonalities and differences of the features, semantics and information-content in messages. At the
end, #tags are recommended to users based on #tags in contextually similar messages. The system is
evaluated on Tweets2011 dataset. The results suggests that the proposed method can recommend suitable
#tags in negligible operational time and when little content is available.
Farsi abstract :
در پلتفرم هاي شبكه هاي اجتماعي يا محيط هاي ميرويلاگ، غالبا از هشتگ براي دسته بندي پيام ها و انتقال محتواي كليدي آنها استفاده مي شود. همچنين برخي شبكه هاي اجتماعي نظير توئيتر محدوديت بر روي تعداد كاراكترهاي پيامها قائل مي شوند. از هشتگ مي توان به عنوان ابزاري مفيد براي كمك به بيان بهتر محتواي پيام هاي كاربران استفاده كرد. در اين مقاله يك سيستم دانش محور و مبتني بر محتواي پيشنهاد دهنده هشتگ معرفي مي شود. سيستم پيشنهادي از طريق يكپارچه سازي دانش ساخت يافته در تمامي واحدهاي روش پيشنهادي عمل مي كند. در مرحله اول ويژگي هاي مرتبط، ساختار هاي معنايي و محتواي اطلاعاتي از پيام ها استخراج مي شوند. از آنجا كه محتواي اندكي در پيام ها وجود دارد، يك واحد غني سازي محتوا ارائه شده است تا ساختارهاي اطلاعاتي را شناسايي نمايد كه مي توانند به سيستم در بهبود نمايش پيام ها كمك نمايند. پيام هاي استخراج شده توسط ساختار شبكه هاي معنايي نمايش داده مي شوند. سپس يك واحد تركيبي و چندلايه محاسبه معنايي شباهت، اشتراكات و تفاوت هاي موجود ميان ويژگي ها، معنا و محتواي اطلاعات در پيام را شناسايي مي كند. در نهايت، هشتگهاي كانديد بر اساس هشتگ هاي موجود در پيام هاي مشابه با پيام كارير پيشنهاد داده مي شوند. براي ارزيابي سيستم پيشنهادي از داده هاي Tweets2017 استفاده شده است. نتايج نشان مي دهد كه سيستم پيشنهادي قادر است تا هشتگ هاي مطلوبي را در زمان عملياتي ناچيز و حتي در شرايطي كه محتواي اندكي در پيام ها موجود است پيشنهاد دهد. واحد غني سازي توانايي مدل سازي دقيق معنا و محتواي اطلاعاتي را دارد. همچنين يكپارچه سازي و احد محاسبه معنايي شباهت با واحد غني سازي، دقت و كيفيت هشتگهاي توليد شده را بهبود مي بخشد. واحدهاي توسعه داده شده در روش پيشنهادي تاثير مثبت و شگرفي بر عملكرد سيستم دارند. سيستم پيشنهادي را مي توان به عنوان توسعه اي موفق از يك سيستم دانش محور پيشنهاد دهنده هشتگ در نظر گرفت.
Keywords :
Structured Knowledge Base , Semantic Network Representation , Ontology , Knowledge-Intensive , Hashtag Recommendation , Content Enrichment