كليدواژه :
طبقه بندي اسناد , طبقه بندي نظارت شده , طبقه بندي نظارت نشده , بازيابي اطلاعات , الگوريتم افرازبندي , الگوريتم k-means
چكيده فارسي :
اطلاعاتي كه در زمينه هاي گوناگون توسط كاربران گردآوري شده است نيازمند مديريت و سازماندهي مناسبي هستند تا به صورت استاندارد، ساختار بندي شده و بازيابي آنها نيز راحت تر و سريع تر انجام شود. طبقه بندي از روشهاي مهم در داده كاوي است. طبقه بندي اسناد يكي از روشهاي متداول براي تفكيك موضوعي متن از بين متون علمي، صفحات وب و كتابخانه ديجيتال است. روش ها و تكنيك هاي مختلف با استفاده از الگوريتم هاي گوناگون براي طبقه بندي اسناد پيشنهاد شده اند كه هركدام مزايا و معايبي دارند. در اين مقاله چندين روش طبقه بندي اسناد بصورت نظارت شده و نظارت نشده بررسي و مقايسه شده اند.