|
|
پیشبینی فروش سوپرمارکت با استفاده از رگرسیون
|
|
|
|
|
نویسنده
|
طالبی مهدی ,علیزاده قاسم
|
منبع
|
دومين كنفرانس ملي تحول ديجيتال و سيستم هاي هوشمند - 1402 - دوره : 2 - دومین کنفرانس ملی تحول دیجیتال و سیستم های هوشمند - کد همایش: 02231-67491 - صفحه:0 -0
|
چکیده
|
بسیاری از سوپرمارکتها پیشبینی خوبی از فروش سالانه خود ندارند که بیشتر به دلیل کمبود مهارت، منابع و دانش برای تخمین فروش است. امروزه در عصر کلانداده، همراه با دسترسی به توان محاسباتی عظیم، یادگیری ماشین تبدیل به ابزاری برای پیشبینی فروش شده است. رگرسیون یک ابزار قدرتمند در یادگیری ماشین و تحلیل دادهها است که به تجزیه و تحلیل روابط و پیشبینی مقادیر عددی بسیار کمک میکند. در این تحقیق، از مجموعه داده فروش یک سوپرمارکت با 1000 رکورد و 17 فیلد استفاده میشود و در فرآیند ساخت یک مدل پیشبینی فروش، چندین الگوریتم یادگیری ماشین ارزیابی میشوند که هر کدام سطوح متفاوتی از عملکرد را ارائه میدهند. این تحقیق، با زبان برنامهنویسی پایتون پیادهسازی میشود و الگوریتمهای مورد استفاده عبارت هستند از xgboost ، شبکه عصبی (پرسپترون چندلایه)، catboost ، lightgbm ، رگرسیون لاسو، رگرسیون ستیغی، کی-نزدیکترین همسایه، جنگل تصادفی و ماشین بردار پشتیبان. در خروجی انواع نمودارهای نقطهای و هیستوگرام باقیمانده تجزیه و تحلیل میشوند و سپس با استفاده از معیارهای ارزیابی و تجزیه و تحلیل دادهها، بهترین مدل آموزشی انتخاب میگردد. نتایج نشان میدهند که مدل رگرسیون ستیغی برای سادگی، دقت و ثبات آن، بهترین مدل است؛ هر چند مدلهای دیگر مانند جنگل تصادفی و رگرسیون لاسو نیز در ارزیابی، عملکرد خوبی داشتهاند.
|
کلیدواژه
|
یادگیری ماشین، رگرسیون، پیشبینی فروش، مجموعه داده سوپرمارکت
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
qasema1377@gmail.com
|
|
|
|
|
|
|
|
|
supermarket sales prediction using regression
|
|
|
Authors
|
|
Abstract
|
many supermarkets do not have a good prediction of their annual sales, mostly due to lack of skills, resources and knowledge to estimate sales. today, in the age of big data with access to huge computing power, machine learning has become a tool for sales prediction. regression is a powerful tool in machine learning and data analysis that helps to analyze relationships and predict numerical values. in this research, the sales dataset of a supermarket with 1000 records and 17 fields is used, and in the process of building a sales prediction model, several machine learning algorithms are evaluated, each of which provides different levels of performance. this research is implemented with python programming language, and the algorithms used are xgboost, neural network (multilayer perceptron), catboost, lightgbm, lasso regression, ridge regression, k-nearest neighbor, random forest and support vector machine. in the output, all types of scatter plots and residual histograms are analyzed and then the best training model is selected using data analysis and evaluation criteria. the results show that the ridge regression model is the best model for its simplicity, accuracy and stability; however, other models such as random forest and lasso regression have also performed well in evaluation
|
Keywords
|
machine learning ,regression ,sales prediction ,supermarket dataset
|
|
|
|
|
|
|
|
|
|
|