شماره ركورد كنفرانس :
5466
عنوان مقاله :
ساخت و جاسازي گراف ناهمگن براي خوشهبندي مؤثر محتواي متني شبكه اجتماعي توييتر
پديدآورندگان :
حيدري دستجردي مليكا melikaheidari@ut.ac.ir دانشگاه تهران،تهران،ايران , معتقد وحيد vahid.motaghed.2020@gmail.com پژوهشگاه دانشهاي بنيادي،تهران،ايران , بهاريفرد فاطمه f.baharifard@ipm.ir پژوهشگاه دانشهاي بنيادي،تهران،ايران
كليدواژه :
گراف ناهمگن , يادگيري بدون ناظر , پردازش زبان طبيعي , الگوريتم خوشهبندي , شبكههاي اجتماعي , توييتر
عنوان كنفرانس :
پنجمين كنفرانس ملي انفورماتيك ايران
چكيده فارسي :
با رشد روزافزون شبكههاي اجتماعي، فعاليتهاي پژوهشي متنوعي براي درك محتواي منتشرشده در آنها انجام شده است. اكثر تحقيقات به صورت يكسان به انواع دادههاي موجود در اين شبكهها نگاه ميكنند و آنها را با گراف همگن مدل ميكنند. اين درحالي است كه اين مجموعه دادهها شامل بيش از يك نوع موجوديت با ارتباطات متنوعي هستند و بهتر است براي مدلكردن آنها از شبكههاي ناهمگن استفاده كرد. در اين مقاله چارچوبي براي ساخت گرافي ناهمگن و چند لايه از دادههاي شبكه اجتماعي توييتر ارائه ميشود كه ميتواند علاوه بر روابط ساختاري موجود بين انواع موجوديتها، ارتباط محتوايي متن پيام را هم در گراف نمايش دهد. در اين روش براي جاسازي رئوس گراف ناهمگن، با در نظر گرفتن فرامسيرهاي احتمالي به عنوان الگويي براي حركت بين انواع رئوس، يك الگوريتم قدمزني تصادفي-احتمالي اجرا ميشود كه ميتواند از ويژگي رئوس براي افزايش دقت فرايند خوشهبندي استفاده كند. چارچوب و الگوريتم ارائهشده روي مجموعهاي با بيش از صد هزار داده واقعي توييتر كه از طريق رابط كاربري توييتر جمعآوري شده، مورد ارزيابي قرار گرفته است كه نتايج حاصل، نشانگر دقت بيشتر روش پيشنهادي نسبت به روشهاي قبلي بدون ناظر كلاسيك و مبتني بر فرامسيرها براي گروهبندي توييتهاي منتشرشده در شبكه اجتماعي توييتر است.