|
|
الگوریتم انتخاب ژن جدید مبتنی برادغام sfe و chi-squared
|
|
|
|
|
نویسنده
|
آقایی لیلا ,محرری صدف
|
منبع
|
اولين همايش ملي داده كاوي در علوم مهندسي و زيستي - 1402 - دوره : 1 - اولین همایش ملی داده کاوی در علوم مهندسی و زیستی - کد همایش: 02230-79497 - صفحه:0 -0
|
چکیده
|
انتخاب ویژگی یکی از روش های پیش پردازش داده ها است که نقش مهمی در افزایش کارایی طبقهبندی دادهها دارد. علاوه بر این، یکی از کاربردهای مهم انتخاب ویژگی، حوزه انتخاب ژن است که کاربرد مهمی در تعیین عامل های و ژن های تاثیر گذار در بیماریهای مختلف از جمله سرطان دارد. برای دستیابی به کارایی بالا در کاربرد انتخاب ژن، به الگوریتم های انتخاب ویژگی دادههای ابعاد بالا نیاز داریم، تا از بین بیش از هزاران ژن بیماری ها که از طریق فناوریهای مختلف از قبیل ریز آرایه ها جمع آوری میشوند، ژنهای مهم و تاثیر گذار در بیماری ها را تشخیص دهند. یکی از الگوریتم هایی که اخیرا برای انتخاب ویژگی دادههای ابعاد بالا ارائه شده است، الگوریتم ساده، سریع و کارا(sfe) است. این الگوریتم نتایج قابل توجهی نسبت به روش های محاسبات تکاملی ارائه کرده است، با این وجود میتوان کارایی آن را با روشهای مختلفی بهبود داد. هدف این مقاله بهبود کارایی این الگوریتم در فازهای انتخاب و عدم انتخاب است. در فاز عدم انتخاب از دو رویکرد متفاوت برای حذف ویژگی های کم اهمیت استفاده میشود. علاوه بر این در فاز انتخاب به جای انتخاب تصادفی ویژگی ها از ویژگی های مهم تعیین شده توسط الگوریتم chi-squared استفاده میشود. کارایی الگوریتم های انتخاب ویژگی ارائه شده با استفاده از 10 مجموعه داده ابعاد بالا با ابعاد مورد بررسی قرار گرفت. مقایسه نتایج الگوریتمهای ارائه شده نشاندهنده این موضوع است که روش ارائه شده میتواند به عنوان یک روش کارا در انتخاب ویژگی داده های با ابعاد بالا در کاربردهای یادگیری ماشین و داده کاوی مورد استفاده قرار گیرد.
|
کلیدواژه
|
انتخاب ویژگی، انتخاب ژن، الگوریتم sfe، الگوریتم chi-squared
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
sadaf.moharreri@iaukhsh.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|