نوشته‌ها

دیتا ساینس یا علم داده چیست؟

یکی از واژه‌ها و مشاغل پُر جستجو در این روزها در آمریکا، واژه‌ی علم داده یا دیتا ساینس و متخصص علم داده است. این حرفه یا تخصص، امسال، برای چهارمین سال متوالی، جزوه مشاغل پُر درخواست و پُر از موقعیت شغلی در آمریکا و سایر کشورهای صنعتی محسوب می‌شد و گمان می‌کنم به این زودی‌ها، نیاز این کشورها به متخصص علم داده برآورده نشود. پس ورود به این رشته می‌تواند، ضامن داشتن یک شغل خوب با درآمد بالا در آینده، برای دانشجو یا محقق باشد.

اما اینکه دیتا ساینس چیست و دقیقاً قرار است چه کاری بکند، گمان می‌کنم هنوز کاملاً مشخص نیست، چون با توجه به نیازها و موردهای مختلف، ابزار متفاوتی باید بکار گرفته شود. ولی چیزی که واضح است، یک متخصص علم داده یا دیتا ساینس، در سه رشته‌ی:

1- ریاضیات،
2- آمار،
3- علوم کامپیوتر،

اطلاعات نسبتاً خوب و جامعی دارد و می‌تواند بوسیله‌ی این سه شاخه، با ورود به شرکت‌های بزرگ و کارخانجات و با مطالعه و آنالیز داده‌ها، در تصمیم‌گیری‌ها و درآمدزایی بیشتر، نقش بسزایی داشته باشد. اصلی‌ترین ابزار هم در این بین، علم آمار است که بزودی همگان خواهند فهمید، این علم، یکی از بزرگترین دستاوردهای بشر تا به امروز بوده، است و خواهد بود، البته نه آماری که در دانشگاه‌ها صرفاً تدریس می‌شود تا بتواند چند داده محدود را مطالعه و آنالیز نماید، شخص باید از ابزارهای آماری، جهت سر و کله زدن با حجم بسیار بزرگی از داده‌ها، استفاده نماید. سپس از ریاضی و برنامه‌نویسی کامپیوتری، مخصوصاً زبان پایتون (Python)، کمک بگیرد تا بتواند داده‌ها را در مسیر درست مطالعه و بهره‌برداری و اخذ الگوهای مناسب، رده بندی کند و نتیجه مطلوبش را اخذ نماید.

آیا در این رشته کتاب به زبان فارسی وجود دارد؟

اخیراً یک کتاب فارسی با عنوان “علم داده: مفاهیم و مهارت‌ها” به قلم یکی از اعضای هیات علمی دانشگاه تهران همراه با یکی از دانش‌آموختگان کارشناسی ارشد ایشان، خواندم. البته در این کتاب نیز مطلب تخصصی خاصی از این رشته دستگیرم نشد. اما تقریباً اطلاعات عمومی زیادی در خصوص آن کسب کردم. مثلاً اینکه، در آمریکا، اخیراً گرایش خاصی به سمت رشته‌ی آمار، در بین دانشجویان ایجاد شده و اینکه تعداد دانشگاه‌هایی که در حال ایجاد رشته‌ی علم داده یا دیتا ساینس هستند، هر روز رو به افزایش است. تعاریف مختلف از این رشته، بیان شده و … . ولی متاسفانه هیچ بحث عملی، با جزئیات بیشتر برای فهم خواننده از این رشته، عنوان نشده است.

بهرحال باید بدانید که در رشته‌ی علم داده یا دیتا ساینس، در حال حاضر کتاب به زبان فارسی، تقریباً، وجود ندارد. البته چند جلد کتاب در این حوزه دیده‌ام که دوستان در رشته‌های مدیریت یا اقتصاد به رشته‌ی تحریر در آورده‌اند که خیلی مباحث، آماری، ریاضی و کامپیوتری در آنها وجود ندارد. پس اگر بخواهید به عمق تعاریف و تکنیک‌ها در این گرایش پی‌ببرید و تصمیم بگیرید که وارد آن بشوید یا نه، باید چند کتاب به زبان انگلیسی بخوانید. مثلاً من کتاب (The Mathematics of Data) را به تازگی از انتشارات انجمن ریاضی آمریکا (AMS) خریده‌ام که حاوی مباحث بسیار جالب و تخصصی در این زمینه است.

دیتا ساینس یا علمِ داده

کتابی در حوزه‌ی دیتا ساینس یا علمِ داده

آیا رفتن دانشجویان ریاضی به این سمت، مفید است؟

با توجه به اینکه در حال حاضر، دانشجویان بخاطر سیستم غلط آموزشی، از لحاظ فهم ریاضی، افت بسیار شدیدی داشته‌اند، خواندن ریاضی برایشان سخت شده است. پس ورود به رشته‌ایی که هم نزدیک به آن است، هم کاربردی باشد و هم موقعیت شغلی بهتری داشته باشد، صد در صد توصیه می‌شود. اما در ایران، در حال حاضر چنین رشته‌ایی به‌صورت رسمی وجود ندارد (تنها دانشگاه شهید بهشتی در مقطع کارشناسی ارشد در این رشته پذیرش دارد) و متقاضی باید به آمریکا یا سایر کشورهایی که این رشته را دارند، برود.

اما اشتباهی که دانشجویان انجام می‌دهند این است که آنها گمان می‌کنند، برای اینکه وارد مقطع دکتری، بعنوان مثال رشته‌ی علم داده بشوند، همانند ایران اول باید یک مدرک کارشناسی ارشد داشته باشند تا بعد بتوانند در دوره‌ی دکتری پذیرش بگیرند. اما سیستم آموزشی آمریکا اینگونه است که برای پذیرش در مقطع دکتری، فقط از شما یک لیسانس می‌خواهند. دوره‌ی دکتری در آنجا پنج الی شش سال بطول می‌انجامد و در این دوره، تا دو سال واحدهایی را برای شما پیش‌بینی می‌کنند که هم دروس کارشناسی ارشد را پوشش دهد و هم دروس دوره‌ی دکتری را. از سال سوم به بعد هم معمولاً وارد پژوهش می‌شوند تا وقتی که کارشان به نتیجه برسد.

پس، بعد از اخذ لیسانس، اصلاٌ نیازی به این ندارید که بلافاصله وارد مقطع ارشد بشوید. به عقیده‌ی بنده، همین دوسالی را که وقتتان را برای گرفتن ارشد، تلف می‌کنید، وقت بگذارید و آزمون‌های تافل (TOEFL) و جی.آر.ایی. (GRE) را که مهمترین مدارک برای ورود به بهترین و بزرگترین دانشگاه‌های آمریکا است، بگیرید. نگران رزومه قوی هم نباشید. اگر انگیزه قوی و هدف خوبی داشته باشد، و بتوانید یک هدف نامه (Statement of Purpose) خوب بنویسید، قطعاً از یک دانشگاه بسیار بزرگ و به اصطلاح با پرستیز، پذیرش (Admission) خواهید گرفت و کاملاً خرج تحصیلات‌تان را (با توجه به شرایطی) تا پنج سال تمام می‌دهند. حتی ورود به دانشگاه‌های پزشکی در آمریکا هم به همین شکل است. شخص اول باید در یکی از رشته‌های علوم پایه یک مدرک کارشناسی بگیرد، سپس مجاز است که وارد دانشکده‌ی پزشکی بشود. در غیر اینصورت محال است، مگر اینکه از نوع دانشگاه‌هایی باشد که فقط پول می‌گیرند و مدرک چاپ می‌کنند.

البته تنها این رشته مد نظر نیست. لزومی ندارد، کسی که لیسانس ریاضی دارد، تا آخر عمر ریاضی بخواند. می‌تواند وارد رشته‌ی علوم کامپیوتر بشود. یا آمار یا هر رشته‌ی دیگری که به آن علاقمند است و در آن مستعد می‌باشد. ولی بدانید که رشته‌هایی نظیر علم داده، آمار و یا علوم کامپیوتر، در کشورهای صنعتی، تقریباً جزو مشاغل خیلی خوب و با درآمد بالا محسوب می‌شوند. البته به عقیده‌ی بنده، تغییر رشته‌ی دانشجویان ریاضی به رشته‌های دیگر، مثل همین رشته‌هایی که در بالا قید نمودم، مزایای دیگری هم دارد.

بعنوان مثال شما در ایران، در حال حاضر بعید است که حتی با داشتن دکتری در رشته‌ی ریاضی، بتوانید عضو هیات علمی دانشگاه‌ها بشوید چون تعداد افراد و مدارک در این رشته، در حال حاضر زیاد است، (مگر گرایش‌های جدیدی مثل ریاضی مالی، رمز و کد و …) البته امکانش هست که در سال‌های آتی، این تعداد به شدت کاهش یابد و مجدد همان غصه‌‎ها تکرار شوند. ولی بعنوان مثال در رشته‌ایی مثل علوم کامپیوتر، چون اکثر افراد می‎‌توانند خارج دانشگاه، کار کنند و درآمدهای خوبی داشته باشند، معمولاً به هیات علمی شدن، تن نمی‌دهند و تعداد افراد هیات علمی در این رشته، کم است و این بدیهی است که جذب راحت می‌شود، حتی اگر ضعیف باشید. پس فقط باید کسانی این رشته را ادامه دهند که واقعاً ریاضی در خونشان باشد و بتوانند کارهای پژوهشی بسیار خوبی انجام دهند تا به این‌وسیله وارد دانشگاه‌ها شوند، بعنوان یک هیات علمی. در غیر اینصورت باید تغییر رشته بدهید.

این نکته را نیز در ذهن داشته باشید، که دانشجویان ریاضی، چون منطقِ ریاضیِ ذهن‌شان خوب است، نسبت به دانشجویان کامپیوتر و یا حتی آمار، بعد از ورود به این رشته‌ها، موفق‌تر می‌شوند. مثلاً بدانید که بزرگترین برنامه‌نویسان کامپیوتری در دنیا، افرادی بوده‌اند که از ریاضی به سمت این رشته رفتند و هم چنین در رشته‌ی علم داده و یا حتی آمار.

آینده این رشته در ایران چطور خواهد بود؟

قطعاً چون تعداد افرادی که در دیتا ساینس متخصص هستند در کشور بسیار کم است، داشتن دانش و مدرک در این زمینه، در آینده، شخص را در ایران بیکار نخواهد گذاشت. اما همه‌ی اینها بستگی به سواد و روابط فرد دارد. در خیلی از کتاب‌های علم داده یا دیتا ساینس، توصیه می‌شود که شخص باید بتواند قدرت مجاب کردن دیگران را داشته باشد که این مستلزم داشتن روابط اجتماعی بالاست. مثالی هم می‌زنند که فرض کنید شما مسئول یک تیم تحقیقاتی در خصوص خط تولید یک کارخانه هستید. بعد از اینکه اطلاعات را کاملاً آنالیز کردید و نتیجه‌گیری نمودید، باید بیائید و یافته‌هایتان را برای هیات مدیره‌ی آن مجموعه ارائه نمائید و آنها را متقاعد کنید که این داده‌ها و اطلاعات ما را به سمت انجام چنین کاری سوق می‌دهند، باید به آنها ثابت نمائید که انجام اینکار باعث منفعت‌های مادی فراوانی برای مجموعه است، در غیر اینصورت کار شما بی‌فایده است.

با تمام این تفاسیر، داشتنِ دانشِ تخصصی در این رشته در ایران، در سال‌های پیش رو، بسیار مورد نیاز خواهد بود و کسانی که در این زمینه حرفی برای گفتن داشته باشند، هم جایگاه خوبی را کسب خواهند کرد و هم درآمد بالایی خواهند داشت. در حال حاضر در ایران، دانشگاه شهید بهشتی، بعنوان یکی از زیرشاخه‌های رشته‌ی ریاضی کاربردی، این رشته، یعنی دیتا ساینس را راه‌اندازی کرده‌اند. احتمالاً بزودی، سایر دانشکده‌ها، در دانشگاه‌های بزرگ کشور، چنین گرایشی را تعریف و راه‌اندازی نمایند. ولی در حال حاضر، مقطع دکتری این رشته در ایران وجود ندارد.

بنابراین، اگر شما قرار است که از ایران بروید و یک رشته‌ایی را بخوانید و بعدها برگردید تا به میهن و وطن‌تان خدمت کنید، بهتر است بدنبال رشته‌هایی باشید که در کشور وجود ندارند یا افراد متخصص در آنها بسیار کم هستند، یکی از این رشته‌ها علم داده است.

اگر دیدگاه، نظر و یا سؤالی در خصوص دیتا ساینس دارید حتماً در قسمت نظرات منعکس کنید. ما پاسخ شما را می‌دهیم.