|
|
بررسی رویکردهای درخت تصمیم در یادگیری ماشین
|
|
|
|
|
نویسنده
|
سلطانپور اکرم
|
منبع
|
اولين كنفرانس ملي پژوهش و نوآوري در هوش مصنوعي - 1402 - دوره : 1 - اولین کنفرانس ملی پژوهش و نوآوری در هوش مصنوعی - کد همایش: 02230-75197 - صفحه:0 -0
|
چکیده
|
دنیای مدرن کنونی در حقیقت دنیای داده گرا است و بشر در محاصره داده های عددی و غیر عددی میباشد. برای اینکه این داده ها را بتوان به عنوان ابزار مناسب در زمینه های مختلف مورد استفاده قرار داد، بایستی آنها را تحلیل و پردازش نمود. درخت تصمیم از عمومی ترین روش های یادگیری طبقه بندی می باشند که ساخت این درخت به صورت پویا و بدون کدنویسی صریح امکانپذیر میباشد، به گونه ای که درخت از روی داده های آموزشی موجود، شاخه ها و برگهای خود را میتواند پیدا کند. ویژگیهای مهم این درخت، سادگی تفسیر، قابلیت کار با انواع مختلف داده های عددی و دسته ای و قابلیت مقابله باداده های ناهمگن است و مزایایی چون دسته بندی دقیق داده ها، مورد استفاده برای حل مسائل باداده های بزرگ وکوچک را دارد اما همچون بقیه روشهای داده کاوی، این روش دسته بندی، معایبی چون داشتن حساسیت به داده های پرت، بزرگ شدن و پیچیده شدن درخت در طی عمل دسته بندی که منجر به افزایش زمان آموزش و بررسی مدل میشود، میباشد. در این پژوهش به بررسی الگوریتم های مورد استفاده پژوهش های پیشین و همچنین کلمات کلیدی مورد توجه پژوهشگران در حوزه درخت تصمیم با استفاده از داده های سایت science data در سالهای اخیر پرداخته شد. در نهایت مزایا و معایب الگوریتمهای موجود در زمینه یادگیری طبقه بندی با درخت تصمیم مورد مطالعه قرار گرفت.
|
کلیدواژه
|
درخت تصمیم، یادگیری ماشین، دادههای بزرگ، طبقهبندی
|
آدرس
|
, iran
|
پست الکترونیکی
|
akram.soltanpour@gmail.com
|
|
|
|
|
|
|
|
|
review of decision tree approaches in machine learning
|
|
|
Authors
|
|
Abstract
|
the modern world is a data-driven world, and humans are surrounded by numerical and non-numerical data. this data must be analyzed and processed to be used effectively in various fields. the decision tree is one of the most general classification learning methods. it can be built dynamically without explicit coding, allowing the tree to find its branches and leaves from the available training data. the decision tree has several important features including, simplicity of interpretation, ability to work with different types of numerical and categorical data, ability to deal with heterogeneous data and accurate classification of data. decision trees can be used to solve a wide range of problems with data, both large and small. however, like other data mining methods, decision trees have some disadvantages such as, sensitivity to outlier data, enlargement and complication of the tree during the classification process, leading to an increase in time and decision trees have been used to model education and examination systems. this research investigated the algorithms used in previous research on decision trees, as well as the keywords of interest of researchers in the field. finally, the research studied the advantages and disadvantages of existing algorithms for classification learning with decision trees.
|
Keywords
|
decision tree ,machine learning ,big data ,classification
|
|
|
|
|
|
|
|
|
|
|