شماره ركورد كنفرانس :
4847
عنوان مقاله :
بهرهگيري از الگوريتم درخت پوشاي بيشينه كروسكال در استخراج خودكار كلمات كليدي از توييتر
پديدآورندگان :
بستان شكوفه sbostan@stu.yazd.ac.ir دانشگاه يزد , قاسمزاده محمد m.ghasemzadeh@yazd.ac.ir دانشگاه يزد
كليدواژه :
توييتر , الگوريتم كروسكال , گراف وزندار جهتدار , كلمه كليدي , رتبهبندي صفحات
عنوان كنفرانس :
چهارمين كنفرانس ملي موضوعات نوين در علوم كامپيوتر و اطلاعات
چكيده فارسي :
در سالهاي اخير ، با توجه به رشد چشمگير حجم اسناد متني در وب، تحليل و استخراج دانش از اين متون بيشازپيش مورد اقبال قرارگرفته است. اغلب اين متون بر روي شبكههاي اجتماعي مانند توييتر و فيسبوك قرار دارند. با توجه به حجم و گوناگوني اين متون، بهكارگيري ابزارهاي پردازش خودكار متون، بيشازپيش ضروري خواهد بود. در اين مقاله، پس از ارائه و تحليل روشهاي اساسي استخراج كلمات كليدي از متون ، يك مدل پيشنهادي بر اساس وزن دهي به كلمات مستخرج از توييت كاربران معرفي ميگردد. در اين رابطه، با استفاده از الگوريتم كروسكال، يك درخت پوشاي بيشينه به دست ميآيد كه با اجراي الگوريتم «رتبهبندي صفحات» بر روي آن ، كلمات كليدي متن اوليه استخراج ميشوند.