شماره ركورد كنفرانس :
5394
عنوان مقاله :
انتخاب ويژگي با استفاده از الگوريتم هاي فرا ابتكاري در بهينه سازي مقادير SVM در تشخيص سرطان سينه
عنوان به زبان ديگر :
Feature selection using meta-heuristic algorithms in optimization of SVM values in breast cancer diagnosis
پديدآورندگان :
سلطان محمدي مريم maryam_soltanmohammadi@yahoo.com دانشجوي دكترا، دانشكده فني و مهندسي، دانشگاه آزاد اسلامي واحد بيرجند، بيرجند، ايران , خزاعي پور مهدي mkhazaiepoor@gmail.com استاديار، دانشكده فني و مهندسي، دانشگاه آزاد اسلامي واحد بيرجند، بيرجند، ايران
كليدواژه :
سرطان سينه , ماشين بردار پشتيبان , الگوريتم بهينه سازي شاهين هريس , الگوريتم بهينه سازي كوسه سفيد , متعادل سازي مجموعه داده
عنوان كنفرانس :
دومين كنفرانس ملي تحول ديجيتال و سيستم هاي هوشمند
چكيده فارسي :
سرطان پستان سالانه باعث مرگ ميليون ها زن در سراسر دنيا مي شود. بيماري سرطان پستان اگر در مراحل اوليه تشخيص داده شود شانس بقاي بيماران افزايش خواهد يافت. يكي از روشهاي تشخيص بيماري سرطان پستان بكارگيري روش هاي يادگيري ماشين و تحليل داده هاي گردآوري شده توسط مراكز درماني است. ماشين بردار پشتيبان يك ابزار قدرتمند براي طبقه بندي نمونه هاي خوش خيم و بدخيم است. يكي از چالش هاي تشخيص نمونه هاي بدخيم توسط ماشين بردار پشتيبان عدم بهينه بودن پارامترهاي اين روش يادگيري عميق است. يك چالش ديگر براي تشخيص نمونه هاي بدخيم، عدم متعادل سازي مجموعه داده و حجم اندك نمونه ها است. چالش ديگر يادگيري روي همه ويژگي ها است كه خطاي تشخيص نمونه اي بدخيم را افزايش مي دهد. روش پيشنهادي در اين مقاله از توانايي الگوريتم بهينه سازي شاهين و الگوريتم بهينه سازي كوسه سفيد براي بهبود عملكرد ماشين بردار پشتيبان در تشخيص سرطان پستان استفاده مي كند. در روش پيشنهادي در ابتدا توسط روش SMOTE تعداد نمونه ها افزايش و متعادل سازي مي شود. در مرحله دوم با الگوريتم بهينه سازي كوسه سفيد، فاز انتخاب ويژگي اجراء شده و بهينه ترين ويژگي ها براي يادگيري ماشين بردار پشتيبان استفاده مي شود. در مرحله سوم الگوريتم بهينه سازي شاهين هريس براي بهينه سازي پارامترهاي ماشين بردار پشتيبان استفاده مي شود. ارزيابي ها در محيط برنامه نويسي متلب و روي مجموعه داده ويسكانسين انجام شده است. ارزيابي ها نشان مي دهد روش پيشنهادي در تشخيص سرطان سينه داراي دقت، حساسيت و صحتي به ترتيب برابر 99.64%، 99.52% و 99.49% است. روش پيشنهادي براي تشخيص سرطان پستان نسبت به ماشين بردار پشتيبان بدون انتخاب ويژگي و نسبت به حالتي كه متعادل سازي مجموعه داده انجام نشده است داراي دقت بيشتري است.
چكيده لاتين :
Breast cancer kills millions of women worldwide every year. If breast cancer is diagnosed in the early stages, the chances of survival will increase. One of the methods of breast cancer diagnosis is using machine learning methods and analysing data collected by medical centres. Support vector machine is a powerful tool for classifying benign and malignant samples. One of the challenges of detecting malignant samples by support vector machine is the non-optimality of the parameters of this deep learning method. Another challenge in detecting malignant samples is the imbalance of the data set and the small volume of samples. Another challenge is learning all features, which increases the error of detecting a malignant sample. The proposed method in this article uses the ability of the Harris Hawks optimization algorithm and the white shark optimization algorithm to improve the performance of the support vector machine in breast cancer diagnosis. In the proposed method, the number of samples is increased and balanced by the SMOTE method. In the second stage, with the white shark optimization algorithm, the feature selection phase is implemented and the most optimal features are used to support vector machine learning. In the third stage, the optimization algorithm of Shahin Harris is used to optimize the parameters of the support vector machine. The evaluations have been done in the MATLAB programming environment and on the Wisconsin dataset. The evaluations show that the proposed method in breast cancer diagnosis has accuracy, sensitivity and accuracy of 99.64%, 99.52% and 99.49% respectively. The proposed method for breast cancer detection is more accurate than the support vector machine without feature selection compared to the case where the data set balancing is not done.