|
|
انتخاب ژن های موثر در بروز سرطان پروستات با به کارگیری روش های کاهش ابعاد براساس مدل ماشینبردار پشتیبان
|
|
|
|
|
نویسنده
|
موسوی نیلیا ,گلعلی زاده موسی
|
منبع
|
شانزدهمين كنفرانس آمار ايران - 1401 - دوره : 16 - شانزدهمین کنفرانس آمار ایران - کد همایش: 01220-18271 - صفحه:0 -0
|
چکیده
|
امروزه با گسترش بهره گیری از مجموعه داده های بعد بالا و مواجهه با مشکلات مرتبط با ابعاد بالا، استفادهاز رویکرد کاهشابعاد در مسائل یادگیری ماشین برای یافتن مجموعه ویژگی بهینه و پیش بینی صحیح رده های موردنظر،امری ضروری است. این روش ها، در حذف ویژگی های زائد، افزایش دقت یادگیری و تفسیرپذیری و فهم بهتر نتایجعدچندی، رویکرد دسته ماشین بردار پشتیبان تصادفی به عنوان تاثیرگذارند. در این پژوهش برای مواجهه با مشقت برهیافتی از یادگیری دسته ای، حذف بازگشتی ویژگی مبتنی بر ماشین بردار پشتیبان که از روش های انتخاب ویژگیجانشانی است و ترکیب آزمون تی و الگوریتم حذف بازگشتی ویژگی مبتنی بر ماشین بردار پشتیبان، مورد بررسی قرارمی گیرد. برای آشکارسازی تاثیر این روش ها در بهبود عملکرد رده بندی، داده های بیان ژن سرطان پروستات به کارگرفته می شود. مقایسه نتایج مدل بندی داده های حاضر، نشان می دهد که انتخاب ژن های موثر در بروز سرطان منجر بهافزایش کارایی کلی مدل می شود و استفاده از روش ترکیبی فیلتر کردن ویژگی ها و رویکرد حذف بازگشتی ویژگی، ازلحاظ صحت و تعداد ژن های انتخابی نسبت به دو روش دیگر بهتر عمل می کند.
|
کلیدواژه
|
کاهش ابعاد، دسته ماشین بردار پشتیبان تصادفی، حذف بازگشتی ویژگی مبتنی بر ماشین بردارپشتیبان، آزمون تی، مجموعه ویژگی بهینه.
|
آدرس
|
, iran, , iran
|
|
|
|
|
|
|
|
|
|
|
selection of genes involved in prostate cancer using dimensionalityreduction techniques based on support vector machine
|
|
|
Authors
|
|
Abstract
|
nowadays, with the expansion of high-dimensional data and the problems relatedto high dimensions, it is essential to utilize different dimensionality reduction techniques inmachine learning to find the optimal feature set and classify accurately. these methods areeffective in eliminating redundant features, increasing learning efficiency and interpretabilityof results. in this article, the random support vector machine cluster as an ensemble learningalgorithm, support vector machine recursive feature elimination (svm-rfe), which is oneof the embedded methods, and implementing svm-rfe filtered with the t-test, are investigated.to reveal the effectiveness of these methods in improving classification performance,prostate cancer gene expression data were used. the comparison of results shows that theselection of genes involved in cancer leads to a more accurate model and the combinationof the filtering method and svm-rfe in terms of accuracy and number of selected genes isbetter than the other two methods.keywords: dimensionality reduction, random
|
Keywords
|
dimensionality reduction ,random support vector machine cluster ,svm-rfe ,t-test ,optimal feature set.
|
|
|
|
|
|
|
|
|
|
|