شماره ركورد :
978360
عنوان مقاله :
تعيين مهم ترين ويژگي هاي كمي و كيفي متمايزكننده سرده Rubus L. در ايران با استفاده از الگوريتم هاي دسته بندي و انتخاب ويژگي
عنوان به زبان ديگر :
Determine the most important quantitative and qualitative features of the genus Rubus L. in Iran using Feature Selection and Classification Algorithms
پديد آورندگان :
شيخ زاده، محمد جواد دانشگاه گنبد كاووس - دانشكده علوم پايه و فني مهندسي
تعداد صفحه :
12
از صفحه :
81
تا صفحه :
92
كليدواژه :
داده كاوي , الگوريتم , ريخت شناسي , كليد شناسايي
چكيده فارسي :
جنس سرده Rubus L. متعلق به تيره Rosaceae و زيرتيره Rosoideae شامل حدود 750 گونه در دنيا است. اين جنس در اكثر نواحي جهان پراكنش دارد. در فلور ايران تعداد هشت گونه و پنج هيبريد (دو رگه) گزارش شده است. تمشك يكي از پر چالش‌ترين جنس‌ها در بين گياهان گل‌دار مي‌باشد. وجود عواملي از جمله پلي‌پلوئيدي، آپوميكسي و دورگه‌گيري زياد در اين جنس باعث مشكلاتي در تشخيص از نظر ريخت شناسي شده است. جمع آوري داده‌هاي كمي و كيفي جهت تشخيص گونه‌ها و روش‌هاي جمع‌آوري مولفه‌هاي ريخت‌ شناسي بسيار زمانبر و پر هزينه است. بنابراين، بكارگيري روش-هاي متفاوت در جهت كاهش زمان و هزينه‌ها همواره مطرح مي‌باشد. در بسياري از موارد، جهت آناليز داده‌هاي زيستي روش‌هاي داده كاوي بكار گرفته مي‌شود. در اين مقاله، از تركيب الگوريتم‌هاي مختلف انتخاب ويژگي و دسته‌بندي براي تشخيص ويژگي‌هاي متمايزكننده بين گونه‌هاي سرده Rubus L. استفاده شد. با بكارگيري روش‌ دسته‌بندي Random Forest و مدل انتخاب ويژگي InfoGainAttributeEval با تعداد 28 ويژگي به دقت 94/05 درصد در دسته‌بندي رسيديم كه بهترين الگوريتم از نظر دقت مي‌باشد و با استفاده از روش MLP و مدل انتخاب ويژگي SymetricalAttributeEval، با تعداد 4 ويژگي دقت دسته‌بندي 84/32 درصد حاصل شد كه بهترين الگوريتم از نظر تعداد اندك ويژگي‌هاي انتخاب شده است. چهار ويژگي فوق توسط اكثر الگوريتم‌هاي استفاده شده در اين مقاله انتخاب شدند. تمامي اين ويژگي‌ها كيفي هستند و جهت بدست آوردن آنها نيازي به هزينه‌ اندازه‌گيري آزمايشگاهي نمي‌باشد. بنابراين مي توانند معيار مناسبي جهت كليد شناسايي باشند.
چكيده لاتين :
The genus Rubus L. (Rosaceae, Rosoideae) includes 750 species. This genus is distributed from Low-TroPical to Sem-Polar region. Eight species and five hybridization varieties were reported in the flora of Iran. Rubus is one of the most challenging genera in flowering plants. Due to polyploids, apomixis and hybridization in the genus mentioned bring challenges in Rubus identification based on morphological characters. Collecting quantitative and qualitative data in plant studies is very time consuming and costly. Therefore, many kinds of research have been conducted on variable methods which are so reliable and economy vantage. Data mining has been applied for many purposes, e.g., bio-data analysis. In the current paper, a combination of different feature selection and classification algorithms was used to recognize the distinctive features of the genus Rubus L. Using the Random Forest classification method and the InfoGainAttributeEval feature selection model, we accurately classified it to 94.05 percent with 28 attributes which is the best algorithm in terms of accuracy and when we applied the MLP method and the SymetricalAttributeEval feature selection model, With only four attributes, the accuracy of the classification was obtained by 84.32 percent which is the algorithm with the least number of selected attributes. Four attributes mentioned were selected by most of the algorithms used in this paper. All of these attributes are qualitative and there is no need for laboratory measurement costs to obtain them. So there can be a suitable criterion for identifying key.
سال انتشار :
1397
عنوان نشريه :
زيست شناسي تكويني
فايل PDF :
3696269
عنوان نشريه :
زيست شناسي تكويني
لينک به اين مدرک :
بازگشت