عنوان مقاله :
توسعه روش طبقهبندي ديتاستهاي نامتوازن با استفاده از الگوريتمهاي تكاملي چندهدفه
عنوان به زبان ديگر :
Developing a classification Method for Imbalanced Dataset Using Multi-Objective Evolutionary Algorithms
پديد آورندگان :
دانشور، امير دانشگاه آزاد اسلامي تهران - دانشكده مديريت - واحد الكترونيكي , همايونفر، مهدي دانشگاه آزاد اسلامي واحد رشت - دانشكده مديريت و حسابداري , اخوان، الهام دانشگاه آزاد اسلامي تهران - دانشكده مديريت - واحد الكترونيكي
كليدواژه :
الگوريتم ژنتيك با رتبهبندي نامغلوب (NSGA II) , طبقهبندي چند كلاسه , ديتاستهاي نامتوازن , الگوريتم NRGA
چكيده فارسي :
طبقهبندي دادهها از مباحث اساسي علم مديريت است كه از رويكردهاي مختلفي مورد بررسي قرار گرفته است. روشهاي هوش مصنوعي از مهمترين روشهاي طبقهبندي هستند كه اغلب آنها تابع دقت كل را در ارزيابي عملكرد مد نظر قرار ميدهند. از آنجاييكه در ديتاستهاي نامتوازن، اين تابع، هزينه خطاهاي پيشبيني را يكسان در نظر ميگيرد، در اين پژوهش علاوه بر تابع دقت كل، از تابع حساسيت نيز به منظور افزايش دقت در هر يك از كلاسهاي از پيشتعريفشده، استفاده شده است. بهعلاوه، بدليل پيچيدگي فرآيند كسب اطلاعات از تصميمگيرنده، از الگوريتم فرا ابتكاري NSGA II جهت استنتاج مقادير پارامترها، (بردار وزن و سطوح برش بين كلاسها) استفاده گرديده است. در هر تكرار، الگوريتم با استفاده از بردار وزن برآورد شده و ديتاستها، امتياز هر آلترناتيو را با تابع Sum Product محاسبه نموده و در مقايسه با سطوح برش تخميني، آن آلترناتيو را به يكي از دستهها تخصيص ميدهد. سپس با استفاده از توابع برازش، دسته تخميني و دسته واقعي را مقايسه نموده و اين فرايند تا بهينهسازي پارامترها ادامه مييابد. مقايسه نتايج الگوريتمهاي NSGA II و NRGA، نشاندهنده كارايي بالاي الگوريتم ارائه شده است.
چكيده لاتين :
Data classification is one of the main issues in management science which took into account from different approaches. Artificial intelligence methods are among the most important classification methods, most of them consider total accuracy function in performance evaluation. Since in imbalanced data sets this function considers the cost of prediction errors as a fix amount, in this research a sensitivity function in used in addition to the accuracy function in order to increase the accuracy in all of the predefined classes. In addition, due to complexity in process of seeking information from decision maker, NSGA II algorithm is used to extract the parameters (Weight vector and cut levels between classes). In each iteration, based on the estimated weight vector and data sets, the algorithm calculate the score of each alternative using Sum Product function and then allocates the alternative to one of the classes, comparing to the estimated cut levels,. Then, using the fitness functions, the estimation class and the actual class will compare by two algorithms and this process will continue since optimizing the parameters. Comparison of the NSGA II and NRGA algorithms show the high efficiency of the proposed algorithm.
عنوان نشريه :
مطالعات مديريت صنعتي