>
Fa   |   Ar   |   En
   پنجاه‌سال علم داده  
   
نویسنده وحیدی اصل محمد‌قاسم
منبع فرهنگ و انديشه رياضي - 1403 - دوره : 43 - شماره : 1 - صفحه:273 -327
چکیده    بیش از ‎50‎ سال پیش، جان توکی فراخوانی برای بازسازی آمار دانشگاهی داد. او در مقالۀ ‎«‎آیندۀ تحلیل داده‌ها‎»‎ به وجود علمی اشاره کرد که آن زمان به رسمیت شناخته نشده بود و موضوع مورد توجه آن یادگیری از داده‌ها یا ‎«‎تحلیل داده‌ها‎»‎ بود. پدیده‌ای مربوط به این اواخر ‎‏که رو به گسترش نیز است‌، ظهور برنامه‌های ‎«‎علم داده‎»‎ در دانشگاه‌های بزرگ است. این مقاله در پی مرور برخی از اجزای ‎«‎برهۀ علم دادهٔ» کنونی، ازجمله بر اظهارنظرهای اخیر دربارۀ علم داده در رسانه‌های همگانی، است که آیا علم داده واقعاً با آمار تفاوت دارد یا خیر و اگر دارد، چگونه. برداشت فعلی از علم داده به‌‌مثابهٔ زبرمجموعه‌ای از رشته‌های آمار و یادگیری ماشین است که مقداری فنّاوری به منظور ‎«‎ارتقای مقیاس‎»‎ آن برای ‎«‎داده‌های بزرگ‎»‎ به آن افزوده شده است. انگیزۀ انتخاب این زبرمجموعه، پیشرفت‌های تجاری است و نه اندیش‌ورزانه. چنین انتخابی محتملاً رویدادهای اندیش‌ورزانۀ مهم ‎50‎ سال آینده را نادیده خواهد گرفت. ازآنجاکه خودِ کلِّ علم به‌زودی بدل به داده می‌شود که می‌توان آن را کاوید، انقلاب در شرف وقوع در علم داده محدود به ‎«‎ارتقای مقیاس‎»‎ نبوده، بلکه در مقابل، در ظهور مطالعات علمی تحلیل داده‌ها در سطح کل علم است. دیدگاهی از علم داده را بر‌اساس فعالیت‌های افرادی که ‎«‎از داده‌ها یاد می‌گیرند‎»‎ ارائه می‌کنم و یک رشتۀ دانشگاهی را که به بهبود این فعالیت به شیوه‌ای مبتنی‌بر شواهد اختصاص دارد توصیف می‌کنم. این رشتۀ جدید وسعت‌بخشی علمی بهتری از آمار و یادگیری ماشین در مقایسه با ابتکارعمل‌های امروزی در علم داده است، و هم‌زمان ‌توان آن را دارد که همان اهداف کوتاه‌مدت را برآورده کند.
کلیدواژه علم داده، یادگیری ماشین، آمار، تحلیل داده‌ها، مدل‌بندی پیشگوگر
آدرس دانشگاه شهید بهشتی, دانشکدهٔ علوم ریاضی, ایران
پست الکترونیکی m-vahidi@sbu.ac.ir
 
   50 years of data science  
   
Authors vahidi-asl m‎. ‎q‎.
Abstract    more than 50 years ago، j. tukey called for a reformation of academic statistics. in the ‎f‎uture of dataanalysis، he pointed to the existence of an as-yet unrecognized science، whose subject of interest waslearning from data، or data analysis. a recent and growing phenomenon has been the emergence of data science programs atmajor universities. this article reviews some ingredients of the current data science moment، including recent commentary about data science in the popular media، and about how/whether data science is really different from statistics. the now-contemplated field of data science amounts to a superset of the fields of statistics and machine learning، which adds sometechnology for scaling up to big data. because all of science itself will soon become data that can be mined، the imminentrevolution in data science is not about mere scaling up، but instead the emergence of scientific studies ofdata analysis science-wide. i present a vision of data science based on the activities of people who are learning from data، and i describe an academic field dedicated to improving that activity in an evidence-basedmanner. this new field is a better academic enlargement of statistics and machine learning than today's data science initiatives، while being able to accommodate thesame short-term goals.
Keywords cross-study analysis ,data analysis ,data science ,meta analysis ,predictive modeling ,quantitative programming environments ,statistics
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved