شماره ركورد كنفرانس :
3237
عنوان مقاله :
مدل سازي عدم قطعيت در سنجش شباهت لغوي محتواي منابع وب فارسي
پديدآورندگان :
آهنگربهان حميد دانشگاه تربيت مدرس - دانشكده فني و مهندسي - گروه مهندسي فناوري اطلاعات , منتظر غلامعلي دانشگاه تربيت مدرس - دانشكده فني و مهندسي - گروه مهندسي فناوري اطلاعات
كليدواژه :
دستبرد ادبي , متن فارسي , نظريه مجموعه فازي , سنجه شباهت سنجي , شباهت سنجي لغوي
عنوان كنفرانس :
كنفرانس بين المللي وب پژوهي
چكيده فارسي :
در دنياي كنوني، كاربران به راحتي مي توانند با رونوشت برداري از منابع وبي، سند و نوشته اي بدون ارجاع به مرجع اصلي به نام خودارائه دهند كه اين عمل مصداقي از دستبرد ادبي است. تاكنون روش ها و سنجه هاي مختلفي در سامانه هاي دستبرد ادبي براي ارزيابي مشابهت دو سند و تشخيص دستبرد ادبي ارائه شده كه تنها به صورت قطعي ميزان شباهت بين دو متن را سنجيده و به نوع محتواي متون چندان توجهي نمي كردند. در اين مقاله با توجه به كيفي بودن عوامل اثرگذار بر سنجش شباهت بين دو متن، روش جديدي بااستفاده از نظريه مجموعه فازي ارائه شده است. در اين روش ابتدا، واژه هاي هر متن به دو دسته عمومي و حوزه محور(تخصصي)بخش بندي شده و سپس براي هر دسته سنجه ها و ويژگي ها متناسب آن مستخرج شده و در نهايت با استفاده از سيستم استنتاجفازي، ميزان شباهت لغوي بين دو محتواي صفحه وب ارزيابي مي شود. روش مذكور بر روي مقاله هاي يادگيري الكترونيكي موردارزيابي قرار گرفته كه با دقت بيش از 75 % امكان شناسايي محتواي اسناد مشابه را داراست و به همين دليل توانمندي لازم براياستفاده در حوزه شناسايي محتواي منابع وبي مشابه و همين طور تشخيص دستبرد محتوايي را داراست.