شماره ركورد كنفرانس :
5518
عنوان مقاله :
تركيب رويكردهاي استخراجي و انتزاعي به منظور خلاصه سازي خودكار پست هاي شبكه اجتماعي اينستاگرام
پديدآورندگان :
تقنديكي كاظم دانشگاه فني و حرفه اي، تهران , احمدي محمدحسن دانشگاه فني و حرفه اي، تهران
كليدواژه :
خلاصه سازي متن , رويكرد استخراجي , رويكرد انتزاعي , پردازش زبان طبيعي , شبكه هاي اجتماعي
عنوان كنفرانس :
اولين كنفرانس بين المللي و ششمين كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي
چكيده فارسي :
گسترش روزافزون داده ها و اسناد متني مانند مقاله، صفحات وب، كتاب، پست هاي شبكه هاي اجتماعي و ... در اينترنت، باعث ايجاد يك چالش اساسي در حوزه هاي مختلف پردازش متن تحت عنوان خلاصه سازي خودكار متن شده است. پردازش و خلاصه سازي دستي داده هاي متني در حجم زياد، يك فرايند بسيار دشوار، پرهزينه، زمانبر و غيرممكن براي كاربران انساني مي باشد. سيستم هاي خلاصه سازي متن به دو دسته استخراجي و انتزاعي تقسيم مي شوند. در روش خلاصه سازي استخراجي، خلاصه نهايي يك سند متني از جملات با اهميت همان سند بدون هيچ نوع تغييري استخراج مي گردد، در اين روش امكان تكرار يكسري از جملات به شكل مكرر و تداخل ضماير وجود دارد. اما در روش خلاصه سازي انتزاعي، خلاصه نهايي يك سند متني از معنا و مفهوم جملات وكلمات همان سند يا ساير اسناد استخراج مي گردد. بسياري از كارهاي انجام شده از روش هاي استخراجي يا چكيده اي براي خلاصه سازي مجموعه اسناد وب استفاده كرده اند كه هر يك داراي مزايا و معايبي در نتايج بدست آمده از لحاظ شباهت يا اندازه مي باشند. در اين تحقيق پژوهشگر به ترتيب با توسعه يك كرولر، استخراج پست هاي متني محبوب شبكه اجتماعي اينستاگرام، پيش پردازش هاي مناسب و تركيب مجموعه الگوريتم هاي استخراجي و انتزاعي نشان داد كه چگونه مي توان از هر يك از الگوريتم هاي انتزاعي و استخراجي به عنوان مكملي براي افزايش دقت و صحت الگوريتم ديگر استفاده كرد. مشاهدات انجام شده بر روي 820 پست متني محبوب شبكه اجتماعي اينستاگرام نشان از دقت (80%) و صحت (75%) سيستم پيشنهادي مي دهد.