شماره ركورد كنفرانس :
3928
عنوان مقاله :
ارائه يك الگوريتم خوشهبندي سلسلهمراتبي سازگار با دادههاي پرت براي متون اخبار
پديدآورندگان :
دامي سينا dami@wtiau.ac.ir استادياردانشگاه آزاد اسلامي، واحد تهران غرب، گروه كامپيوتر، تهران، ايران , عباسي احمد ahmad.abbasi.1987@gmail.com دانشجوي كارشناسي ارشد، دانشگاه آزاد اسلامي، واحد تهران غرب، گروه كامپيوتر، تهران، ايران
كليدواژه :
دادهكاوي , متنكاوي , پردازش زبان طبيعي , دادههاي پرت , خوشهبندي سلسلهمراتبي.
عنوان كنفرانس :
نخستين همايش ملي توسعه پژوهش در كامپيوتر و فناوري اطلاعات
چكيده فارسي :
خوشهبندي يكي از تكنيكهاي حائز اهميت در زمينه داده كاوي است كه در رشتههاي گوناگون مهندسي و علمي بكار گرفته شده است خوشهبندي سلسله مراتبي اين امكان را فراهم ميسازد تا اسناد در قالب يك سلسله مراتب درختي به صورت خوشه و زيرخوشه، سازماندهي شوند. يكي از مشكلاتي كه در اكثر روشهاي موجود براي خوشهبندي سلسله مراتبي متون وجود دارد، اين است كه چنانچه يك سند به اشتباه به يك خوشه اصلي و يا يكي از زيرخوشههاي آن منتسب شود آنگاه امكان تصحيح انتساب سند به يك خوشه مناسبتر در سطح سلسلهمراتب وجود نخواهد داشت و بعلاوه اين روشها عموما نسبت به دادههاي پرت به شدت حساس هستند و در صورت وجود تعداد زيادي از دادههاي پرت، جوابهاي نامناسبي توليد ميكنند. در اين مقاله، روشي براي خوشهبندي سلسله مراتبي متون ارائه خواهد شد كه نيازي به تصحيح انتساب يك سند به يك خوشه را نداشته و امكان سازگاري با دادهاي پرت را نيز دارد. نتايج تجربي نشان داد كه روش پيشنهادي ضمن مواجهه با دادههاي پرت از دقت مناسبي براي انجام خوشهبندي برخوردار است.