>
Fa   |   Ar   |   En
   ارائه یک روش خودرمزگذار چند مقیاسی جهت بهبود خوشه بندی و تحلیل داده های سلول-منفرد  
   
نویسنده عینی پور امین
منبع انفورماتيك سلامت و زيست پزشكي - 1403 - دوره : 11 - شماره : 1 - صفحه:72 -82
چکیده    مقدمه:  تحلیل داده‌های سلول-منفرد نقش بسزایی در فهم پیچیدگی‌های عملکرد سلول‌ها ایفا می‌کند. تحلیل این داده‌ها با چالش‌هایی مانند کاهش ابعاد ناکارآمد و خوشه‌بندی نامطلوب مواجه هستند. هدف این مقاله ارائه روشی است که ضمن افزایش کیفیت بازسازی و کاهش ابعاد داده ها، خوشه بندی داده های سلول-منفرد را بهبود بخشد.روش کار: در این مطالعه یک روش جدید به نام (single-cell analysis using multi-scale autoencoder) sams  ارائه می شود که از یک مدل خود رمزگذار چندمقیاسی برای بهبود چالش‌های موجود در تحلیل داده‌های سلول-منفرد بهره می‌برد. روش پیشنهادی sams شامل سه مرحله اصلی است: (1) پیش‌پردازش و نرمال‌سازی داده ها، (2) استفاده از مدل شبکه عصبی عمیق برای بازسازی و کاهش ابعاد داده‌ها به کمک خودرمزگذار چندمقیاسی و (3) خوشه‌بندی داده‌های کاهش‌یافته با استفاده از الگوریتم k-means برای ارزیابی عملکرد روش پیشنهادی.یافته‌ها: روش پیشنهادی sams با استفاده از زبان پایتون پیاده سازی شده و نتایج به ‌دست آمده بر روی مجموعه داده های سلول-منفرد  نشان می‌دهد که sams می تواند سلول ها را با کیفیت بالایی در یک فضای دو بُعدی با میانگین نرخ 89% = nne نمایش دهد که نشان دهنده حفظ مناسب ساختار داده ها است. همچنین، شاخص های سیلوئت و دیویس-بولدین در ارزیابی دقت خوشه‌بندی، نشان می دهد که روش پیشنهادی به ترتیب با میانگین 0.66 و 0.50 توانسته بهبود خوبی را در خوشه بندی سلول ها ایجاد کند.نتیجه‌گیری: روش پیشنهادی sams با ترکیب مدل خودرمزگذار چندمقیاسی و الگوریتم  k-meansتوانسته نتایج بهتری نسبت به روش‌های پیشین به دست آورد. به‌کارگیری sams در تحلیل داده‌های سلول-منفرد می‌تواند به پژوهشگران در درک بهتر عملکرد سلول‌ها و کشف الگوهای جدید کمک کند.
کلیدواژه تحلیل سلول-منفرد، کاهش ابعاد، تحلیل خوشه بندی
آدرس دانشگاه آزاد اسلامی واحد اندیمشک, گروه مهندسی کامپیوتر, ایران
پست الکترونیکی a.einipour@gmail.com
 
   providing a multi-scale self-encoding method to improve clustering and analysis of single-cell data  
   
Authors einipour amin
Abstract    introduction: in bioinformatics, analyzing single-cell data is crucial for understanding cellular functions’ complexities. however, this analysis faces challenges like inefficient dimensionality reduction and suboptimal clustering. this study aimed to present a method that enhances the clustering of single-cell data, improves reconstruction quality, and reduces data dimensions.method: this paper introduces sams (single-cell analysis using multi-scale autoencoder), which uses a multi-scale autoencoder model to improve the challenges in single-cell data analysis. the sams method involves three primary steps: (1) data preprocessing and normalization, (2) employing a deep neural network model to reconstruct and reduce data dimensions with the help of a multiscale autoencoder, and (3) clustering the reduced data using the k-means algorithm to assess the method’s performance.results: the sams method was implemented using python on single-cell datasets. the results demonstrate that sams can effectively visualize cells in a two-dimensional space with an average nearest neighbor error (nne) rate of 89%, indicating a strong preservation of data structure. additionally, the silhouette index and davis-bouldin index, which measure clustering accuracy, show significant improvement with averages of 0.66 and 0.50, respectively.conclusion: the proposed sams method by combining the multiscale self-encoder model and the k-means algorithm could obtain better results than the previous methods. its application in single-cell data analysis can aid researchers in gaining deeper insights into cellular functions and discovering new patterns.
Keywords single-cell analysis ,dimensionality reduction ,clustering analysis
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved