|
|
ارائه یک روش خودرمزگذار چند مقیاسی جهت بهبود خوشه بندی و تحلیل داده های سلول-منفرد
|
|
|
|
|
نویسنده
|
عینی پور امین
|
منبع
|
انفورماتيك سلامت و زيست پزشكي - 1403 - دوره : 11 - شماره : 1 - صفحه:72 -82
|
چکیده
|
مقدمه: تحلیل دادههای سلول-منفرد نقش بسزایی در فهم پیچیدگیهای عملکرد سلولها ایفا میکند. تحلیل این دادهها با چالشهایی مانند کاهش ابعاد ناکارآمد و خوشهبندی نامطلوب مواجه هستند. هدف این مقاله ارائه روشی است که ضمن افزایش کیفیت بازسازی و کاهش ابعاد داده ها، خوشه بندی داده های سلول-منفرد را بهبود بخشد.روش کار: در این مطالعه یک روش جدید به نام (single-cell analysis using multi-scale autoencoder) sams ارائه می شود که از یک مدل خود رمزگذار چندمقیاسی برای بهبود چالشهای موجود در تحلیل دادههای سلول-منفرد بهره میبرد. روش پیشنهادی sams شامل سه مرحله اصلی است: (1) پیشپردازش و نرمالسازی داده ها، (2) استفاده از مدل شبکه عصبی عمیق برای بازسازی و کاهش ابعاد دادهها به کمک خودرمزگذار چندمقیاسی و (3) خوشهبندی دادههای کاهشیافته با استفاده از الگوریتم k-means برای ارزیابی عملکرد روش پیشنهادی.یافتهها: روش پیشنهادی sams با استفاده از زبان پایتون پیاده سازی شده و نتایج به دست آمده بر روی مجموعه داده های سلول-منفرد نشان میدهد که sams می تواند سلول ها را با کیفیت بالایی در یک فضای دو بُعدی با میانگین نرخ 89% = nne نمایش دهد که نشان دهنده حفظ مناسب ساختار داده ها است. همچنین، شاخص های سیلوئت و دیویس-بولدین در ارزیابی دقت خوشهبندی، نشان می دهد که روش پیشنهادی به ترتیب با میانگین 0.66 و 0.50 توانسته بهبود خوبی را در خوشه بندی سلول ها ایجاد کند.نتیجهگیری: روش پیشنهادی sams با ترکیب مدل خودرمزگذار چندمقیاسی و الگوریتم k-meansتوانسته نتایج بهتری نسبت به روشهای پیشین به دست آورد. بهکارگیری sams در تحلیل دادههای سلول-منفرد میتواند به پژوهشگران در درک بهتر عملکرد سلولها و کشف الگوهای جدید کمک کند.
|
کلیدواژه
|
تحلیل سلول-منفرد، کاهش ابعاد، تحلیل خوشه بندی
|
آدرس
|
دانشگاه آزاد اسلامی واحد اندیمشک, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
a.einipour@gmail.com
|
|
|
|
|
|
|
|
|
providing a multi-scale self-encoding method to improve clustering and analysis of single-cell data
|
|
|
Authors
|
einipour amin
|
Abstract
|
introduction: in bioinformatics, analyzing single-cell data is crucial for understanding cellular functions’ complexities. however, this analysis faces challenges like inefficient dimensionality reduction and suboptimal clustering. this study aimed to present a method that enhances the clustering of single-cell data, improves reconstruction quality, and reduces data dimensions.method: this paper introduces sams (single-cell analysis using multi-scale autoencoder), which uses a multi-scale autoencoder model to improve the challenges in single-cell data analysis. the sams method involves three primary steps: (1) data preprocessing and normalization, (2) employing a deep neural network model to reconstruct and reduce data dimensions with the help of a multiscale autoencoder, and (3) clustering the reduced data using the k-means algorithm to assess the method’s performance.results: the sams method was implemented using python on single-cell datasets. the results demonstrate that sams can effectively visualize cells in a two-dimensional space with an average nearest neighbor error (nne) rate of 89%, indicating a strong preservation of data structure. additionally, the silhouette index and davis-bouldin index, which measure clustering accuracy, show significant improvement with averages of 0.66 and 0.50, respectively.conclusion: the proposed sams method by combining the multiscale self-encoder model and the k-means algorithm could obtain better results than the previous methods. its application in single-cell data analysis can aid researchers in gaining deeper insights into cellular functions and discovering new patterns.
|
Keywords
|
single-cell analysis ,dimensionality reduction ,clustering analysis
|
|
|
|
|
|
|
|
|
|
|