|
|
ارائه ی روشی جدید برای کشف نشانگرهای زیستی پیش آگاهی دهنده در سرطان ریه
|
|
|
|
|
نویسنده
|
کوهسار مرتضی ,مسعودی سبحان زاده یوسف ,مسعودی نژاد علی
|
منبع
|
ژنتيك نوين - 1400 - دوره : 16 - شماره : 2 - صفحه:103 -112
|
|
|
چکیده
|
امروزه رویکردهای یادگیری ماشین بهطور گستردهای در تجزیه و تحلیل دادههای حجیم استفاده میشود. با توجه به فناوری جدید و تولید دادههای با بازده بالا در زیست شناسی (مانند دادههای تعیین توالی نسل جدید)، استفاده از روش یادگیری ماشین بر روی دادههای بزرگ بیولوژیکی میتواند به درک مکانیسم بیماری پیچیده مانند سرطان کمک کند. استخراج ژنهای کاندیدا بهعنوان یک هدف درمانی یا نشانگرهای زیستی از دادههای بیولوژیکی حجیم مانند دادههای بیان ژن را میتوان بهعنوان اولین مرحله در درمان سرطان در نظر گرفت. بنابراین، توسعه یک رویکرد کارآمد برای تجزیه و تحلیل چنین دادههایی نقشی اساسی در بیوانفورماتیک و زیستشناسی محاسباتی دارد. در این مقاله، ما با اعمال الگوریتم رقابت جهانی و ماشین بردار پشتیبان بر روی دادههای بیان ژن مربوط به سرطان ریه تلاش کردهایم ژنهای مرتبط با سرطان ریه را بهعنوان نشانگرهای زیستی بالقوه کشف کنیم. دادههای مورد استفاده، دادههای بهدست آمده از تکنولوژی rnaseq و مربوط به نمونههای سرطان ریه و همینطور نمونههای بافت سالم هستند که از پایگاه دادهی tcga دریافت شدهاند. این دادههای شامل بیان ژنهای mrna در نمونههای بافت سرطانی و سالم میباشند. نتایج بررسی منجر به کشف ژنهای با اهمیتی شد که با توجه به مقالات قبلی منتشر شده نقش مهمی در شکلگیری سرطان دارند و نقش آنها در شکلگیری سرطان ریه را نیز میتواند در مطالعات آینده مورد بررسی قرار داد. همچنین نتایج اعتبار سنجی روش پیشنهادی نشان دهندهی قدرت روشهای مبتنی بر یادگیری ماشین در تحلیل دادههایی بیان ژن هستند.
|
کلیدواژه
|
سرطان ریه، الگوریتم رقابت جهانی، ماشین بردار پشتبان، نشانگر زیستی، یادگیری ماشین، داده های بیان ژن
|
آدرس
|
دانشگاه صنعتی شریف, ایران, دانشگاه علوم پزشکی تبریز, پژوهشکده زیست پزشکی, مرکز تحقیقات ریزفناوری داروئی, ایران, دانشگاه تهران, ایران
|
پست الکترونیکی
|
amasoudin@ut.ac.ir
|
|
|
|
|
|
|
|
|
Developing a novel algorithm to predict diagnostic biomarkers in lung cancer
|
|
|
Authors
|
Masoudi-Nejad Ali ,Kouhsar Morteza ,Masoudi-Sobhanzadeh Yosef
|
Abstract
|
Today, machinelearning approaches are widely used in the analysis of massive data. Due to new technology and the production of highthroughput data in biology (such as nextgeneration sequencing data), the use of machine learning methods on large biological data can help to understand the mechanism of complex diseases such as cancer. Extraction of candida genes as a therapeutic target or biomarkers from highthroughput biological data such as gene expression data considered as the first step in cancer treatment. Therefore, developing an efficient approach to analyzing such data plays a key role in bioinformatics and computational biology. In this paper, we try to identify lung cancerrelated genes as potential biomarkers by applying the WCC algorithm and SVM to lung cancer gene expression data. The data from RNASeq technology used for lung cancer samples as well as healthy tissue samples obtained from the TCGA database. These data include the expression of mRNA genes in cancerous and healthy tissue samples. The results of the study led to important findings such as CASZ1 and ASNS, which according to previously published articles have an important role in the formation of cancer and their role in the formation of lung cancer can be examined in future studies. In addition, the validation results of the proposed method show the power of machine learningbased methods in analyzing gene expression data.
|
Keywords
|
Lung Cancer ,WCC Algorithm ,Support Vector Machine ,Biomarker ,Machine Learning ,Gene Expression Data
|
|
|
|
|
|
|
|
|
|
|