شماره ركورد كنفرانس :
3787
عنوان مقاله :
مقايسه زمان اجرا و حافظه مصرفي الگوريتمهاي كاوش الگوهاي نادر بر روي مجموعه دادههاي مختلف
پديدآورندگان :
زماني بروجني فرساد farsad.zamani@yahoo.com دانشگاه آزاد اسلامي واحد اصفهان , حسن پور زينب Zhasanpoor1@gmail.com دانشگاه آزاد اسلامي واحد اصفهان , رشيدي روح الله rashidi@iausemirom.ac.ir دانشگاه آزاد اسلامي واحد سميرم , هاشمي سيد ابراهيم Se.hashemi@khuisf.as.ir دانشگاه آزاد اسلامي واحد اصفهان
كليدواژه :
داده كاوي , الگوي نادر , مجموعه اقلام
عنوان كنفرانس :
اولين همايش ملي فناوري اطلاعات، ارتباطات و محاسبات نرم
چكيده فارسي :
در گذشته كاوش مجموعه اقلام نادر از بين داده¬هاي ذخيره شده، مورد اهميت قرار نميگرفت اما امروزه براي مسائل مختلف داده كاوي از اين الگو استفاده ميشود. با گذشت زمان مسائلي در حوزه داده كاوي مطرح شد، كه نيازمند كشف مواردي بود كه از الگوي عام داده ها تبعيت نميكرد. به دليل تكرار كم اين موارد استفاده از روش هاي معمول كشف الگو كارايي خود را از دست مي دهند. اهميت بحث كشف موارد نادر نه تنها از كشف الگوهاي عام كم اهميت تر نيست، بلكه در مواردي از اهميت بيشتري نيز برخوردار است. در اين مقاله سه الگوريتم AprioriInverse،AprioriRare ,CORI بر روي چهار مجموعه دادهي مختلف، از نظر زمان اجرا و حافظه مصرفي مورد بررسي قرار گرفت. الگوريتم AprioriRare نسبت به ساير الگوريتم¬ها سريعتر اجرا شد، به دليل اينكه اين روش در ابتدا بهينه سازي كرده و سپس به كاوش اقلام نادر ميپردازد. از نظر حافظه مصرفي الگوريتم CORI نسبت به ساير الگوريتم¬ها نتيجه بهتري داشت به دليل اينكه در ابتدا مجموعه دادهها كاهش يافته و سپس ساختار درختي اطلاعات آنها تشكيل ميشود.