>
Fa   |   Ar   |   En
   تعیین مهم ترین ویژگی های کمی و کیفی متمایزکننده سرده rubus l. در ایران با استفاده از الگوریتم های دسته بندی و انتخاب ویژگی  
   
نویسنده شیخ زاده محمد جواد
منبع زيست شناسي تكويني - 1397 - دوره : 10 - شماره : 3 - صفحه:81 -92
چکیده    جنس سرده rubus l. متعلق به تیره rosaceae و زیرتیره rosoideae شامل حدود 750 گونه در دنیا است. این جنس در اکثر نواحی جهان پراکنش دارد. در فلور ایران تعداد هشت گونه و پنج هیبرید (دو رگه) گزارش شده است. تمشک یکی از پر چالش‌ترین جنس‌ها در بین گیاهان گل‌دار می‌باشد. وجود عواملی از جمله پلی‌پلوئیدی، آپومیکسی و دورگه‌گیری زیاد در این جنس باعث مشکلاتی در تشخیص از نظر ریخت شناسی شده است. جمع آوری داده‌های کمی و کیفی جهت تشخیص گونه‌ها و روش‌های جمع‌آوری مولفه‌های ریخت‌ شناسی بسیار زمانبر و پر هزینه است. بنابراین، بکارگیری روش-های متفاوت در جهت کاهش زمان و هزینه‌ها همواره مطرح می‌باشد. در بسیاری از موارد، جهت آنالیز داده‌های زیستی روش‌های داده کاوی بکار گرفته می‌شود. در این مقاله، از ترکیب الگوریتم‌های مختلف انتخاب ویژگی و دسته‌بندی برای تشخیص ویژگی‌های متمایزکننده بین گونه‌های سرده rubus l. استفاده شد. با بکارگیری روش‌ دسته‌بندی random forest و مدل انتخاب ویژگی infogainattributeeval با تعداد 28 ویژگی به دقت 94.05 درصد در دسته‌بندی رسیدیم که بهترین الگوریتم از نظر دقت می‌باشد و با استفاده از روش mlp و مدل انتخاب ویژگی symetricalattributeeval، با تعداد 4 ویژگی دقت دسته‌بندی 84.32 درصد حاصل شد که بهترین الگوریتم از نظر تعداد اندک ویژگی‌های انتخاب شده است. چهار ویژگی فوق توسط اکثر الگوریتم‌های استفاده شده در این مقاله انتخاب شدند. تمامی این ویژگی‌ها کیفی هستند و جهت بدست آوردن آنها نیازی به هزینه‌ اندازه‌گیری آزمایشگاهی نمی‌باشد. بنابراین می-توانند معیار مناسبی جهت کلید شناسایی باشند.
کلیدواژه داده کاوی، الگوریتم، ریخت شناسی، کلید شناسایی
آدرس دانشگاه گنبد کاووس, دانشکده علوم پایه و فنی مهندسی, ایران
پست الکترونیکی sheikhzadeh@gonbad.ac.ir
 
   determine the most important quantitative and qualitative features of the genus rubus l. in iran using feature selection and classification algorithms  
   
Authors sheikhzadeh mohammad javad
Abstract    the genus rubus l. (rosaceae, rosoideae) includes 750 species. this genus is distributed from low-tropical to sem-polar region. eight species and five hybridization varieties were reported in the flora of iran. rubus is one of the most challenging genera in flowering plants. due to polyploids, apomixis and hybridization in the genus mentioned bring challenges in rubus identification based on morphological characters. collecting quantitative and qualitative data in plant studies is very time consuming and costly. therefore, many kinds of research have been conducted on variable methods which are so reliable and economy vantage. data mining has been applied for many purposes, e.g., bio-data analysis. in the current paper, a combination of different feature selection and classification algorithms was used to recognize the distinctive features of the genus rubus l. using the random forest classification method and the infogainattributeeval feature selection model, we accurately classified it to 94.05 percent with 28 attributes which is the best algorithm in terms of accuracy and when we applied the mlp method and the symetricalattributeeval feature selection model, with only four attributes, the accuracy of the classification was obtained by 84.32 percent which is the algorithm with the least number of selected attributes. four attributes mentioned were selected by most of the algorithms used in this paper. all of these attributes are qualitative and there is no need for laboratory measurement costs to obtain them. so there can be a suitable criterion for identifying key.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved