>
Fa   |   Ar   |   En
   ارائه ی روشی جدید برای کشف نشانگرهای زیستی پیش آگاهی دهنده در سرطان ریه  
   
نویسنده کوهسار مرتضی ,مسعودی سبحان زاده یوسف ,مسعودی نژاد علی
منبع ژنتيك نوين - 1400 - دوره : 16 - شماره : 2 - صفحه:103 -112
چکیده    امروزه رویکردهای یادگیری ماشین به‌طور گسترده‌ای در تجزیه و تحلیل داده‌های حجیم استفاده می‌شود. با توجه به فناوری جدید و تولید داده‌های با بازده بالا در زیست شناسی (مانند داده‌های تعیین توالی نسل جدید)، استفاده از روش یادگیری ماشین بر روی داده‌های بزرگ بیولوژیکی می‌تواند به درک مکانیسم بیماری پیچیده مانند سرطان کمک کند. استخراج ژن‌های کاندیدا به‌عنوان یک هدف درمانی یا نشانگرهای زیستی از داده‌های بیولوژیکی حجیم مانند داده‌های بیان ژن را می‌توان به‌عنوان اولین مرحله در درمان سرطان در نظر گرفت. بنابراین، توسعه یک رویکرد کارآمد برای تجزیه و تحلیل چنین داده‌هایی نقشی اساسی در بیوانفورماتیک و زیست‌شناسی محاسباتی دارد. در این مقاله، ما با اعمال الگوریتم رقابت جهانی و ماشین بردار پشتیبان بر روی داده‌های بیان ژن مربوط به سرطان ریه تلاش کرده‌ایم ژن‌های مرتبط با سرطان ریه را به‌عنوان نشانگرهای زیستی بالقوه کشف کنیم. داده‌های مورد استفاده، داده‌های به‌دست آمده از تکنولوژی rnaseq و مربوط به نمونه‌های سرطان ریه و همین‌طور نمونه‌های بافت سالم هستند که از پایگاه داده‌ی tcga دریافت شده‌اند. این داده‌های شامل بیان ژن‌های mrna در نمونه‌های بافت سرطانی و سالم می‌باشند. نتایج بررسی منجر به کشف ژن‌های با اهمیتی شد که با توجه به مقالات قبلی منتشر شده نقش مهمی در شکل‌گیری سرطان دارند و نقش آن‌ها در شکل‌گیری سرطان ریه را نیز می‌تواند در مطالعات آینده مورد بررسی قرار داد. همچنین نتایج اعتبار سنجی روش پیشنهادی نشان دهنده‌ی قدرت روش‌های مبتنی بر یادگیری ماشین در تحلیل داده‌هایی بیان ژن هستند.
کلیدواژه سرطان ریه، الگوریتم رقابت جهانی، ماشین بردار پشتبان، نشانگر زیستی، یادگیری ماشین، داده های بیان ژن
آدرس دانشگاه صنعتی شریف, ایران, دانشگاه علوم پزشکی تبریز, پژوهشکده زیست پزشکی, مرکز تحقیقات ریزفناوری داروئی, ایران, دانشگاه تهران, ایران
پست الکترونیکی amasoudin@ut.ac.ir
 
   Developing a novel algorithm to predict diagnostic biomarkers in lung cancer  
   
Authors Masoudi-Nejad Ali ,Kouhsar Morteza ,Masoudi-Sobhanzadeh Yosef
Abstract    Today, machinelearning approaches are widely used in the analysis of massive data. Due to new technology and the production of highthroughput data in biology (such as nextgeneration sequencing data), the use of machine learning methods on large biological data can help to understand the mechanism of complex diseases such as cancer. Extraction of candida genes as a therapeutic target or biomarkers from highthroughput biological data such as gene expression data considered as the first step in cancer treatment. Therefore, developing an efficient approach to analyzing such data plays a key role in bioinformatics and computational biology. In this paper, we try to identify lung cancerrelated genes as potential biomarkers by applying the WCC algorithm and SVM to lung cancer gene expression data. The data from RNASeq technology used for lung cancer samples as well as healthy tissue samples obtained from the TCGA database. These data include the expression of mRNA genes in cancerous and healthy tissue samples. The results of the study led to important findings such as CASZ1 and ASNS, which according to previously published articles have an important role in the formation of cancer and their role in the formation of lung cancer can be examined in future studies. In addition, the validation results of the proposed method show the power of machine learningbased methods in analyzing gene expression data.
Keywords Lung Cancer ,WCC Algorithm ,Support Vector Machine ,Biomarker ,Machine Learning ,Gene Expression Data
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved