شماره ركورد كنفرانس :
4415
عنوان مقاله :
طبقه بندي محتوايي صفحات وب با استفاده از راهكارهاي خوشه بندي
پديدآورندگان :
رجب زاده شهرستاني معصومه Masoumeh_rajabzadeh@yahoo.com موسسه آموزش عالي ديلمان - لاهيجان , احمدي آبكناري فاطمه Fateme.Abkenari@gilan.pnu.ac.ir دانشگاه پيام نور رشت , اكباتاني فرد غلامحسين Ekbatanifard@gmail.com دانشگاه آزاد اسلامي واحد لاهيجان
كليدواژه :
الگوريتم هاي خوشه بندي , ارزيابي خوشه بندي , بازيابي اطلاعات , طبقه بندي صفحات وب.
عنوان كنفرانس :
نخستين كنفرانس ملي تحقيقات بين رشته اي در مهندسي كامپيوتر، برق، مكانيك و مكاترونيك
چكيده فارسي :
از آنجا كه حجم اطلاعات بر روي وب روز به روز در حال افزايش است سازماندهي اين اطلاعات به منظور دسترسي سريع كاربران به محتواي مورد نظر يك نياز ضروري مي باشد. با توجه به رشد سريع وب، فراهم كردن روشي خودكار براي تقسيم بندي و طبقه بندي صفحات وب يك نياز ضروري مي باشد. در اين مقاله چندين روش خوشه بندي صفحات وب مورد بررسي قرار گرفته است. اين روش ها شامل خوشه بندي اسناد براساس تركيب تگ هاي HTML، روش يادگيري ماشين K نزديكترين همسايه، روش خوشه بندي بر اساس الگوريتم K-Means و خوشه بندي بر اساس پيوندهاي خروجي است. سپس با استفاده از تمامي اين الگوريتم ها، دسته بندي صفحات وب مطابق با گروه بندي هاي از پيش تعيين شده انجام شده و پس از قرارگيري صفحات در گروه ها و دسته هاي مربوط به خود، ميزان درستي كار هر كدام از اين الگوريتم ها را از طريق روش هاي ارزيابي خوشه بندي سنجيده شده و با ساير الگوريتم ها مقايسه شده و درصد موفقيت هر يك را در گروه هاي مختلف محاسبه كرده و در نهايت به معرفي موفق ترين گروه در اين آزمايش پرداخته خواهد شد. اين طبقه بندي بوسيله 100 صفحه وب متعلق به 4 دسته آموزشي، پزشكي، خبري، ورزشي است