|
|
examining the impact of variable selection methods on classification outcomes of bcl-2 and bcl-xl isoform-selective ligands
|
|
|
|
|
نویسنده
|
neiband marzieh
|
منبع
|
iranian journal of analytical chemistry - 2024 - دوره : 11 - شماره : 1 - صفحه:44 -53
|
چکیده
|
Feature selection is crucial in quantitative structure-activity relationship (qsar) studies, enhancing learning algorithms’ performance and reducing computational costs. this study evaluates the impact of eight variable selection methods on the classification of isoform-selective ligands for bcl-2 and bcl-xl targets using three machine learning techniques: supervised kohonen network (skn), support vector machine (svm), and partial least squares discriminant analysis (pls-da). classification models were assessed using confusion matrix parameters, 10-fold venetian blind cross-validation, and test sets.the results show that pls-da and svm have comparable classification capabilities, outperforming skn. however, pls-da occasionally leaves some ligands unassigned, making svm a more robust and efficient choice. despite using different variable selection methods, no clear advantage was found for any specific method, with all achieving around 70% classification accuracy in validation and test series. this suggests that the choice of variable selection method does not consistently affect outcomes across all techniques.ensuring the reliability of selected variables involves meticulous data quality assessments, literature review, and robust cross-validation. eliminating redundant features is essential for accurate classification models, as many physicochemical properties may be irrelevant to target bioactivity. while no single method guarantees superior models, selecting important variables is vital for extracting relevant features. this study highlights the importance of careful variable selection in qsar studies, emphasizing its role in reducing dimensionality and improving model interpretability. ultimately, this enhances drug discovery efficiency by identifying safer and more effective compounds, reducing time and cost.
|
کلیدواژه
|
variable selection methods ,qsar ,drug design ,bcl-2 ,bcl-xl
|
آدرس
|
payame noor university university, department of chemistry, iran
|
پست الکترونیکی
|
neiband.mrs@gmail.com
|
|
|
|
|
|
|
|
|
بررسی تاثیر روش های انتخاب متغیر بر نتایج طبقه بندی لیگاندهای ایزوفرم انتخابی bcl-2 و bcl-xl
|
|
|
Authors
|
نی بند مرضیه سادات
|
Abstract
|
انتخاب ویژگیها در مطالعات رابطه کمّی ساختار-فعالیت (qsar) بسیار مهم است، زیرا عملکرد الگوریتمهای یادگیری را بهبود میبخشد و هزینههای محاسباتی را کاهش میدهد. این مطالعه تاثیر هشت روش انتخاب متغیر را بر طبقهبندی لیگاندهای ایزوفورم-انتخابی برای اهداف bcl-2 و bcl-xl با استفاده از سه تکنیک یادگیری ماشین: شبکه کوهونن نظارتشده (skn)، ماشین بردار پشتیبان (svm) و تحلیل تفکیکی حداقل مربعات جزئی (pls-da) ارزیابی میکند. مدلهای طبقهبندی با استفاده از پارامترهای ماتریس سردرگمی، اعتبارسنجی متقاطع 10-تایی و مجموعههای آزمون ارزیابی شدند.نتایج نشان میدهد که pls-da و svm قابلیتهای طبقهبندی مشابهی دارند و از skn بهتر عمل میکنند. با این حال، pls-da گاهی برخی لیگاندها را بدون تخصیص باقی میگذارد، که svm را به یک انتخاب قویتر و کارآمدتر تبدیل میکند. با وجود استفاده از روشهای مختلف انتخاب متغیر، هیچ مزیت واضحی برای هیچ روش خاصی یافت نشد و همه حدود 70٪ دقت طبقهبندی را در سریهای اعتبارسنجی و آزمون به دست آوردند. این نشان میدهد که انتخاب روش انتخاب متغیر به طور مداوم بر نتایج در تمام تکنیکها تاثیر نمیگذارد.اطمینان از قابلیت اطمینان متغیرهای انتخابشده شامل ارزیابی دقیق کیفیت دادهها، مرور ادبیات و اعتبارسنجی متقاطع قوی است. حذف ویژگیهای زائد برای مدلهای طبقهبندی دقیق ضروری است، زیرا بسیاری از خواص فیزیکوشیمیایی ممکن است به فعالیت زیستی هدف مرتبط نباشند. در حالی که هیچ روش واحدی مدلهای برتر را تضمین نمیکند، انتخاب متغیرهای مهم برای استخراج ویژگیهای مرتبط حیاتی است. این مطالعه اهمیت انتخاب دقیق متغیرها در مطالعات qsar را برجسته میکند و نقش آن را در کاهش ابعاد و بهبود تفسیر مدلها تاکید میکند. در نهایت، این کارایی کشف دارو را با شناسایی ترکیبات ایمنتر و موثرتر افزایش میدهد و زمان و هزینه را کاهش میدهد.
|
|
|
|
|
|
|
|
|
|
|
|
|