|
|
مقایسة عملکرد مدلهای خطی تعمیمیافته (glm) و جنگل تصادفی (rf) در پیشبینی توزیع صید ماهی سفید (rutilus frisii)
|
|
|
|
|
نویسنده
|
معزی فاتح ,پورباقر هادی ,ایگدری سهیل ,فقهی جهانگیر
|
منبع
|
شيلات - 1402 - دوره : 76 - شماره : 1 - صفحه:27 -38
|
چکیده
|
هدف از انجام مطالعة حاضر، ارزیابی عملکرد مدلهای خطی تعمیمیافته (glm) و جنگل تصادفی (rf) در پیشبینی توزیع صید ماهی سفید دریای خزر (rutilus frisii) بود. بدینمنظور، دادههای صید در واحد تلاش (cpue) ماهی سفید بهعنوان متغیر اصلی و دادههای سنجش از دور 5 متغیر محیطی شامل دمای روزانة سطح آب (sst)، غلظت کلروفیل-a (chl)، ضخامت اپتیک ریزگردها (asl)، محتوای کربن آلی ذرهای (poc) و کربن غیرآلی ذرهای (pic) بهعنوان متغیرهای پیشبین مورد استفاده قرار گرفت. جهت سنجش عملکرد توصیفی و پیشبینی مدلها از شاخصهای ضریب تبیین (r^2)، میانگین خطای مطلق (mae) و ریشة میانگین مربعات خطا (rmse) استفاده گردید. در بهترین مدل glm برازشیافته تنها دو پارامتر log(pic) و poc معنیدار بودند، در حالیکه در مدل rf تمامی متغیرها بکار گرفته شدند. مدل rf از توان توصیفی بیشتری نسبت به مدل glm برخوردار بود (0/053=glm: r^2؛ 0/47=rf:r^2). همچنین، دقت بیشتری برای مدل rf ((kg/hour.seine) 1326/1rmse=؛ 972/4mae=) در مقایسه با glm ((kg/hour.seine) 1465/6rmse=؛ 1328/7mae=) وجود داشت. پارامترهای asl و chl بهترتیب دارای بیشترین (%33/31) و کمترین (%28/87) سهم اهمیت نسبی در مدل rf بودند. براساس مجموعه نتایج بهدست آمده، مدل جنگل تصادفی (rf) بهعنوان یک مدل کارآمد جهت مدلسازی توزیع صید ماهیان پیشنهاد میگردد.
|
کلیدواژه
|
مدل خطی تعمیمیافته، مدل جنگل تصادفی، متغیرهای زیستگاهی، ماهی سفید، دریای خزر
|
آدرس
|
دانشگاه تهران, دانشکده منابع طبیعی, ایران, دانشگاه تهران, دانشکده منابع طبیعی, گروه شیلات, ایران, دانشگاه تهران, دانشکده منابع طبیعی, گروه شیلات, ایران, دانشگاه تهران, دانشکده منابع طبیعی, گروه مهندسی جنگلداری و اقتصاد جنگل, ایران
|
پست الکترونیکی
|
jfeghhi@ut.ac.ir
|
|
|
|
|
|
|
|
|
comparing the performance of generalized linear model (glm) and random forest (rf) models in predicting catch distribution of caspian kutum (rutilus frisii)
|
|
|
Authors
|
moezzi fateh ,poorbagher hadi ,eagderi soheil ,feghhi jahangir
|
Abstract
|
the present study aimed to assess the performance of generalized linear model (glm) and random forest (rf) model in predicting caspian kutum (rutilus frisii) catch distribution. caspian kutum catch per unit of effort (cpue) data was used as the response variable. remotely-sensed data of five environmental parameters were used as model predictors as well, including daily sea surface temperature (sst), chlorophyll-a concentration (chl), aerosol optical thickness (asl), particulate organic carbon (poc) and particulate inorganic carbon (pic) concentrations. the coefficient of determination (r2), mean absolute error (mae), and root mean square error (rmse) scores were used as measures of model performance and accuracy. the best fitted glm had only log(pic) and poc as significant parameters, while the rf model contained all predictors. rf showed higher explaining potential compared to glm (rf: r2=0.47; glm: r2=0.053). also, higher accuracy was observed using rf (mae=972.4; rmse=1326.1 (kg/hour.seine)) than glm (mae=1328.7; rmse=1465.6 (kg/hour.seine)). asl (33.31%) and chl (28.87%) were parameters with the highest and lowest relative influence in the rf model. based on the results, random forest modelling is suggested as a practical technique for predicting fish catch distribution.
|
|
|
|
|
|
|
|
|
|
|
|
|