|
|
|
|
پنجاهسال علم داده
|
|
|
|
|
|
|
|
نویسنده
|
وحیدی اصل محمدقاسم
|
|
منبع
|
فرهنگ و انديشه رياضي - 1403 - دوره : 43 - شماره : 1 - صفحه:273 -327
|
|
چکیده
|
بیش از 50 سال پیش، جان توکی فراخوانی برای بازسازی آمار دانشگاهی داد. او در مقالۀ «آیندۀ تحلیل دادهها» به وجود علمی اشاره کرد که آن زمان به رسمیت شناخته نشده بود و موضوع مورد توجه آن یادگیری از دادهها یا «تحلیل دادهها» بود. پدیدهای مربوط به این اواخر که رو به گسترش نیز است، ظهور برنامههای «علم داده» در دانشگاههای بزرگ است. این مقاله در پی مرور برخی از اجزای «برهۀ علم دادهٔ» کنونی، ازجمله بر اظهارنظرهای اخیر دربارۀ علم داده در رسانههای همگانی، است که آیا علم داده واقعاً با آمار تفاوت دارد یا خیر و اگر دارد، چگونه. برداشت فعلی از علم داده بهمثابهٔ زبرمجموعهای از رشتههای آمار و یادگیری ماشین است که مقداری فنّاوری به منظور «ارتقای مقیاس» آن برای «دادههای بزرگ» به آن افزوده شده است. انگیزۀ انتخاب این زبرمجموعه، پیشرفتهای تجاری است و نه اندیشورزانه. چنین انتخابی محتملاً رویدادهای اندیشورزانۀ مهم 50 سال آینده را نادیده خواهد گرفت. ازآنجاکه خودِ کلِّ علم بهزودی بدل به داده میشود که میتوان آن را کاوید، انقلاب در شرف وقوع در علم داده محدود به «ارتقای مقیاس» نبوده، بلکه در مقابل، در ظهور مطالعات علمی تحلیل دادهها در سطح کل علم است. دیدگاهی از علم داده را براساس فعالیتهای افرادی که «از دادهها یاد میگیرند» ارائه میکنم و یک رشتۀ دانشگاهی را که به بهبود این فعالیت به شیوهای مبتنیبر شواهد اختصاص دارد توصیف میکنم. این رشتۀ جدید وسعتبخشی علمی بهتری از آمار و یادگیری ماشین در مقایسه با ابتکارعملهای امروزی در علم داده است، و همزمان توان آن را دارد که همان اهداف کوتاهمدت را برآورده کند.
|
|
کلیدواژه
|
علم داده، یادگیری ماشین، آمار، تحلیل دادهها، مدلبندی پیشگوگر
|
|
آدرس
|
دانشگاه شهید بهشتی, دانشکدهٔ علوم ریاضی, ایران
|
|
پست الکترونیکی
|
m-vahidi@sbu.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
|
50 years of data science
|
|
|
|
|
Authors
|
vahidi-asl m. q.
|
|
Abstract
|
more than 50 years ago، j. tukey called for a reformation of academic statistics. in the future of dataanalysis، he pointed to the existence of an as-yet unrecognized science، whose subject of interest waslearning from data، or data analysis. a recent and growing phenomenon has been the emergence of data science programs atmajor universities. this article reviews some ingredients of the current data science moment، including recent commentary about data science in the popular media، and about how/whether data science is really different from statistics. the now-contemplated field of data science amounts to a superset of the fields of statistics and machine learning، which adds sometechnology for scaling up to big data. because all of science itself will soon become data that can be mined، the imminentrevolution in data science is not about mere scaling up، but instead the emergence of scientific studies ofdata analysis science-wide. i present a vision of data science based on the activities of people who are learning from data، and i describe an academic field dedicated to improving that activity in an evidence-basedmanner. this new field is a better academic enlargement of statistics and machine learning than today's data science initiatives، while being able to accommodate thesame short-term goals.
|
|
Keywords
|
cross-study analysis ,data analysis ,data science ,meta analysis ,predictive modeling ,quantitative programming environments ,statistics
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|