شماره ركورد كنفرانس :
5332
عنوان مقاله :
انتخاب ويژگي با استفاده از الگوريتم بادبان ماهي و طبقه بندي داده ها با ماشين بردار پشتيبان
عنوان به زبان ديگر :
Feature Selection Using the Sailfish Algorithm And Data Classification With Support Vector Machine
پديدآورندگان :
زندي آرش Arash.Zandi@live.com دانشجوي ارشد كامپيوتر گرايش هوش مصنوعي، دانشگاه آزاد واحد بردسير , شادروان سوده shadravan239@gmail.com عضو هيات علمي دانشگاه آزاد اسلامي واحد بردسير
كليدواژه :
انتخاب ويژگي , الگوريتم بادبان ماهي , طبقه بندي داده ها , روش ماشين بردار پشتيبان , عملكرد محاسباتي
عنوان كنفرانس :
اولين رويداد و همايش ملي علوم و فناوري هاي همگرا و فناوري هاي كوانتومي
چكيده فارسي :
در اين مقاله، روشي جهت انتخاب ويژگي با استفاده از الگوريتم بادبان ماهي و طبقه بندي داده ها با ماشين بردار پشتيبان ارائه شده است. روش پيشنهادي روي مجموعه داده هاي مختلف، پياده سازي و مورد بررسي قرار گرفته است. همه طبقه بندها در ابعاد پايين نتايج قابل قبولي ارائه ميكنند درحاليكه در ابعاد بالا با مشكل بدي بعد روبرو هستند. بنابراين انتخاب ويژگي ميتواند تأثير قابلتوجهي بر نرخ بازشناسي درست الگوريتم طبقه بند، داشته باشد. هدف اصلي از انتخاب ويژگي،كاهش بعد بردار ويژگي در طبقهبندي است بهطوريكه نرخ طبقهبندي قابل قبولي نيز حاصل شود. نتايج بيانگر اين است كه استفاده از الگوريتم بادبان ماهي سبب دستيابي به راه حلي با تعداد ويژگي و نرخ خطاي كمتر نسبت به روشهاي ديگر ميشود. حداقل نرخ خطاي طبقه بندي با بكارگيري روش پيشنهادي برابر 5 درصد است. اين در حالي است كه بدون استفاده از الگوريتم بادبان ماهي، حداقل ميزان خطاي طبقه بندي، 1/10 درصد و بدون استفاده از روش طبقه بندي ماشين بردار پشتيبان، 9/17 درصد مي باشد. همچنين، روش پيشنهادي قادر است بخش غير نرمال و سرطاني سلولها را شناسايي كند. علاوه براين، بررسي خطاي طبقه بندي مربوط به سرطان خون، سرطان پروستات و سرطان ريه با تغيير پارامتر θ ،بيانگر اين است كه تغيير پارامتر θ ،تأثيري در خطاي طبقه بندي ندارد اما با افزايش ويژگي ها، به طور كلي، خطاي طبقه بندي، داراي يك روند نزولي خواهد بود. همچنين، با كاهش پا رامتر e، تعداد تكرارهاي الگوريتم و در نتيجه، زمان محاسبات كاهش مي يابد. اما، مقادير اجزاي تابع هدف براي سرطانهاي مختلف با كاهش پارامتر θ ،افزايش پيدا ميكند. بررسي عملكرد محاسباتي براي مجموعه داده هاي مختلف نيز نشان ميدهد كه خطاي طبقه بندي حتي زماني كه θ افزايش مي يابد؛ ثابت باقي ميماند.
چكيده لاتين :
In this article, a method for feature selection using the fish sail algorithm and data classification with support vector machine is presented. All the classifiers provide acceptable results in low dimensions while they face bad dimension problem in high dimensions. Therefore, feature selection can have a significant effect on the correct recognition rate of the classification algorithm. The main goal of feature selection is to reduce the dimension of the feature vector in classification so that an acceptable classification rate is obtained. The results show that the use of the fish sail algorithm leads to a solution with a lower number of features and a lower error rate than other methods. The minimum classification error rate using the proposed method is equal to 5%. This is despite the fact that without using the fish sail algorithm, the minimum classification error is 10.1% and without using the support vector machine classification method, it is 17.9%. Also, Peisheh Eddy s method is able to identify the abnormal and cancerous part of the cells. In addition, the examination of the classification error related to blood cancer, prostate cancer and lung cancer by changing the θ parameter shows that changing the θ parameter has no effect on the classification error, but with the increase of features, in general, the classification error has It will be a downward trend. Also, by decreasing the parameter e, the number of algorithm repetitions and, as a result, the calculation time decreases. However, the values of the components of the objective function for different cancers increase with the decrease of the θ parameter. Examining the computational performance for different data sets also shows that the classification error increases even when θ increases; Remains constant.