عنوان مقاله :
استفاده از خوشهبندي تكاملي براي تشخيص موضوع در بلاگنويسي كوچك با لحاظ نمودن اطلاعات شبكه اجتماعي
پديد آورندگان :
علوي ، الهام سادات دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر , مشايخي ، هدي دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر , حسنپور ، حميد دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر , رحيمپور كامي ، باقر دانشگاه علوم و فنون مازندران - دانشكده مهندسي برق و كامپيوتر
كليدواژه :
تشخيص موضوع , خوشهبندي تكاملي , شبكه اجتماعي , مدل احتمالاتي
چكيده فارسي :
متون كوتاه رسانههاي اجتماعي مانند توييتر اطلاعات زيادي در مورد موضوعهاي داغ و افكار عمومي ارائه ميدهند. براي درك بهتر اطلاعات دريافتي از شبكههاي اجتماعي، شناسايي و رديابي موضوع امري ضروري است. در بسياري از روشهاي ارائهشده در اين زمينه، تعداد موضوعها بايد از پيش مشخص باشد و نميتواند در طول زمان تغيير كند. از اين منظر، اين روشها براي دادههاي در حال افزايش و پويا مناسب نيستند. همچنين مدلهاي تكاملي موضوعي غير پارامتري به دليل مشكل كمبود دادهها، بر روي متون كوتاه عملكرد مناسبي ندارند. در اين مقاله، يك مدل خوشهبندي تكاملي جديد ارائه كردهايم كه به طور ضمني از فرايند رستوران چيني وابسته به فاصله (dd-CRP) الهام گرفته است. در روش ارائهشده براي حل مشكل كمبود دادهها، از اطلاعات شبكه اجتماعي در كنار شباهت متني، براي بهبود ارزيابي شباهت بين توييتها استفاده شده است. همچنين در روش پيشنهادي، برخلاف اكثر روشهاي مطرحشده در اين زمينه، تعداد خوشهها به صورت خودكار محاسبه ميشود. در واقع در اين روش، توييتها با احتمالي متناسب با شباهتشان به هم متصل ميشوند و مجموعهاي از اين اتصالها يك موضوع را تشكيل ميدهد. براي افزايش سرعت اجراي الگوريتم، از يك روش خلاصهسازي مبتني بر خوشهبندي استفاده نمودهايم. ارزيابي روش بر روي مجموعه داده واقعي كه در طول دو ماه و نيم از شبكه اجتماعي توييتر جمعآوري شده است، انجام ميشود. ارزيابي به صورت خوشهبندي متون و مقايسه بين آنها ميباشد. نتايج ارزيابي نشان ميدهد كه روش پيشنهادي نسبت به روشهاي مقايسهشده داراي انسجام موضوعي بهتري بوده و ميتواند به طور مؤثر براي تشخيص موضوع بر روي متون كوتاه رسانههاي اجتماعي استفاده گردد.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران