پست‌های این دسته در خصوص حوزه‌ی پژوهشی علم داده (Data Science) هستند

با توجه به فراگیر و کاربردی شدن رشته‌ی دیتا ساینس (علم داده) و کمبود منابع لازم برای یادگیری این رشته‌ی بسیار ارزشمند، در ادامه منابعی را برای مطالعه به شما معرفی می‌کنیم.

منابعی برای دیتا ساینس و پایتون:

یکی از بزرگ‌ترین وبسایت‌ها در دنیا که به آموزش آنلاین مشغول است، سایت یودمی می‌باشد. در اکثر دوره‌های آموزشی این سایت، عموماً بزرگان رشته‌ها به آموزش می‌پردازند. اخیراً متوجه شدم که سایت ایرانی پی‌سی دانلود اکثر فیلم‌های آموزشی این وبسایت را آرشیو کرده و بصورت رایگان در اختیار علاقمندان قرار می‌دهد. در ادامه چند لینک از این وبسایت را که به آموزش دیتا ساینس و تحلیل داده‌ها با پایتون می‌پردازند، قرار می‌دهیم:

  1. آموزش آنالیز داده‌ها با پایتون و پانداس.
  2. آموزش شبیه‌سازی کووید 19 با پایتون و علم داده.
  3. آموزش پایتون برای علوم داده و یادگیری ماشین.
  4. آموزش علوم داده و یادگیری ماشین.

به عقیده‌ی بنده با دنبال کردن این مجموعه‌ها، دانش شما برای ورود به دنیای دیتا ساینس و یادگیری ماشین تا حد زیادی افزایش خواهد یافت.

نکته: اگر با دنبال نمودن لینک‌های فوق با خطا مواجه شدید، تنها در گوگل عبارت «آموزش علم داده در یودمی- پی سی دانلود» یا چیزی مشابه با این را تایپ نمائید تا موتورهای جستجو شما را به نتایج بهتری هدایت کنند. توجه کنید که هر کدام از این دوره‌ها در سایت یودمی بعضاً با مبالغ بسیار بالایی بفروش می‌رسند.

یک منبع بسیار مفید برای پایتون:

یک کانال تلگرامی که جدیداً بنده با آن آشنا شدم و به آموزش صفر تا صد پایتون بصورت کاملاً رایگان و با زبان فارسی می‌پردازد، کانال «برنامه‌نویسی | پایتون» هست. در این مجموعه از مقدماتی‌ترین موضاعات تا پیشرفته‌ترین سرفصل‌های پایتون آموزش داده می‌شود.

علاوه بر کانال تلگرامی فوق، می‌توانید به وبسایت «دبلیو-تری-اسکول: w3school» مراجعه و با انتخاب زبان پایتون، تمامی کدهای مد نظر و همچنین آموزش‌های این وبسایت در خصوص زبان برنامه‌نویسی پایتون را مشاهده نمائید. در این وبسایت علاوه بر پایتون، سایر زبان‌های برنامه‌نویسی نیز آموزش داده می‌شود. از طریق این لینک، می‌توانید دوره‌ی آموزشی پایتون در این سایت را دنبال نمائید.

برای یادگیری، شما نیازی به شرکت در کلاس‌های حضوری و یا آنلاین را ندارید، تنها یکی از این دوره‌ها را انتخاب کنید و تا پایان آن را دنبال نمائید. قطعاً به اندازه‌ی یک دانشگاه، این دوره‌ها برای شما اطلاعات و سواد بهمراه خواهند داشت.

 

در صورت داشتن هرگونه سؤال و یا ابهام، با ما از طریق فرم دیدگاه‌ها در ادامه در تماس باشید. همچنین اگر مطلبی دارید که به کامل‌تر شدن این پست کمک می‌کند، حتماً مطرح کنید. 

 

یکی از محبوب‌ترین زبان‌های برنامه‌نویسی برای متخصصین علم داده یا دیتا ساینس، پایتون است. چون نصب پایتون برای عده‌ایی از افراد مبتدی و تازه‌وارد به دنیای کد و برنامه‌نویسی مبهم و پیچیده است، در ادامه به آموزش تصویری نصب پایتون می‌پردازیم.

آموزش نصب پایتون و آناکوندا، چگونه و از کجا شروع کنیم؟

  • ابتدا در گوگل عبارت «Anaconda download» را تایپ نمائید. تصویر ذیل نمایش داده خواهد شد که باید روی لینک اول مطابق با تصویر کلیک کنید.

آموزش تصویری نصب پایتون1

  • وارد سایت شده و طبق تصویر ذیل، نسخه‌ی مناسب سیستم عامل خود را دانلود کنید.

آموزش تصویری نصب پایتون2

  • بعد از نصب فایل دانلود شده، از طریق بخش جستجو در نوار پائین (بعنوان مثال در ویندوز) کلمه‌ی Jupyter را تایپ کنید. سپس مطابق با شکل زیر، روی برنامه‌ی پیشنهاد شده کلیک نمائید.

آموزش تصویری نصب پایتون3

  • بعد از کلیک روی این برنامه، شکل زیر برای شما ظاهر می‌گردد.  شما تنها باید چند لحظه صبر کنید تا این کلیک شما را به بخش مناسب که هدایت به سمت یک مرورگر هست، انتقال دهد.

آموزش تصویری نصب پایتون4

  • بعد از ورود به مرورگر (برای بنده در اینجا فایرفاکس انتخاب شده است) روی دکمه‌های مشخص شده در تصویر کلیک نمائید. تمام شد. شما با موفقیت توانستید یک محیط و مفسر از زبان برنامه‌نویسی پایتون را نصب نمائید.

آموزش تصویری نصب پایتون5 آموزش تصویری نصب پایتون6

 چند نکته:

  •  پایتون 3 در برابر پایتون 2 بر خلاف آنچه که گمان می‌کنیم لزوماً امکانات بیشتری ندارد. بسیاری از برنامه‌نویسان حرفه‌ایی پایتون 2 را به نسخه‌ی 3 ترجیح می‌دهند و برخی از این کدنویسان هم هر دو نسخه را روی سیستم خود نصب می‌کنند.
  • روی برخی از سیستم عامل‌ها (مک) از قبل پایتون نصب می‌باشد.
  • با استفاده از آناکوندا می‌توانید کدنویسی‌های نرم‌افزار R را هم انجام بدهید.
  • عموماً، دیتا ساینتیست‌ها، به محيط فوق، ژوپیتر نوت‌بوک می‌گویند.
  • اگر روی سیستمی مشغول به کدنویسی هستید که روی آن ژوپیتر نوت‌بوک نصب نیست، بصورت آنلاین هم می‌توانید با مراجعه به این آدرس اسکریپت‌های خود را اجرا نمائید.

روش دوم:

شما می‌توانید مستقیماً نرم‌افزار پایتون را از سایت پایتون با توجه به سیستم عامل خود دانلود و نصب کرده. سپس برای تسهیل در کدنویسی، نرم افزار نوت‌پد پلاس پلاس را نیز از این آدرس دانلود نموده و کدنویسی‌های خود را در این محیط انجام دهید. در پایان، اسکریپت‌های خود را با نرم‌افزار پایتون اجرا نمائید تا خروجی مد نظر را مشاهده کنید.

 

در مطالب بعدی، بصورت دقیق و مرحله به مرحله قصد داریم که علم داده یا دیتا ساینس را کاملاً رایگان، آموزش دهیم. در صورت تمایل برای دریافت این مطالب، ایمیل خود را در سایت ثبت‌ نمائید. امیدواریم که از آموزش تصویری نصب پایتون نهایت استفاده را برده باشید.

 

در صورت داشتن هرگونه سؤال یا ابهام، از طریق فرم دیدگاه‌ها در ادامه با من در تماس باشید.

 

پذیرش دانشجو در دوره‌های آنلاین در آمریکا:

دانشگاه وردکوآنت (worldQuant) یک دانشگاه کاملاً مجازی در آمریکاست که دوره‌های کارشناسی ارشد در دو رشته‌ی دیتا ساینس (علم داده) و مهندسی مالی ارائه می‌دهد.

شرایط پذیرش دانشجو در این دانشگاه:

  1. متقاضی باید دارای یک مدرک کارشناسی در یکی از رشته‌های علوم پایه، ترجیحاً علوم ریاضی، آمار و یا کامپیوتر باشد و یا اینکه آشنایی نسبی با مباحث آمار مقدماتی و برنامه‌نویسی کامپیوتری داشته باشد.
  2. شخص درخواست‌کننده باید مدرک زبان معتبری ارائه نماید که البته نمره‌ی این مدرک همانند دانشگاه‌های حضوری نیست. بعنوان مثال نمره‌ي آزمون تافل 71 یا آیلتس 6.5 به بالا قابل پذیرش است، در حالی که در اکثر دانشگاه‌های آمریکا حداقل نمره‌ی زبان تافل 85 است.
  3. شرکت و قبولی در یک آزمون محاسباتی آنلاین که تقریباً سه ساعت زمان لازم دارد.

بعد از پشت سر گذاشتن این موارد، دانشجو در دوره‌ی مد نظر پذیرش می‌شود و زمان‌های حضور در کلاس که در هر هفته بین 8 الی 10 ساعت است با شما هماهنگ خواهد شد.

هزینه‌ی شرکت در دوره:

دوره‌ها كاملاً رايگان بوده، اما براي افرادي كه بخواهند از بسته‌هاي آموزشي مازاد بر ساعت كلاس‌ها استفاده نمايند، حدود 1000 دلار هزينه خواهد برد. اطلاعات تكميلي و كامل‌تر را در پایگاه اینترنتی این دانشگاه، در این آدرس، خواهید دید.

ملاحظات:

  1. متاسفانه دانشجویانی که در زمان درخواست ساکن یکی از کشورهای، شبه‌جزیره‌ی کریمه، کوبا، ایران، کره‌ی شمالی، سودان و سوریه باشند نمی‌توانند درخواست بدهند. احتمالاً متقاضیانی که در ایران ساکن هستند، با استفاده از VPN بتوانند پذیرش بگیرند.
  2. چون این دانشگاه نوپا و تقریباً تازه‌کار است، در حال حاضر هزینه‌ایی از دانشجو نمی‌گیرد. اما بزودی این دانشگاه جزو یکی از فعال‌ترین دانشگاه‌ها و شاید گران‌ترین دانشگاه‌ها در سطح جهان بشود. از این فرصت طلایی استفاده نمائید و یک مدرک کارشناسی ارشد بسیار ارزشمند از یک دانشگاه آمریکایی بگیرید.

 

 

 

 

در این مقاله دلایل متخصص علم داده نشدن را بررسی می‌کنیم. این نوشته، ترجمه‌ایی است از مقاله‌ی

“Nine reasons why you’ll never become a
Data Scientist”

که اخیراً در وب‌سایت بسوی علم داده پست شده است. البته به عقیده‌ی بنده نکات تنها در خصوص علم داده نیستند و حالت کلی دارند.

هدف این نوشته این نیست که شما را ناامید کند و دقیقاً دلایل متخصص علم داده نشدن را بیاموزد. بلکه برعکس، قصد دارد تا با شناساندن برخی از موارد کوچک بشما، یک نقشه‌ی راه دقیق و بهتری را برای آینده شغلی‌تان ترسیم کند.

باید طرز فکرتان را عوض کنید. آرزو دارید که متخصص علم داده شوید، حرفه‌ایی که جذاب‌ترین شغل قرن 21ام طبق نظر مجله‌ی مرور مشاغل هاروارد (Harvard Business Review)، انتخاب شده است. اما علاوه بر تمایل و علاقه‌ی شما برای ورود به این شغل، ممکن است که علم داده برای شما گزینه‌ی خوبی نباشد. در این لحظه، توهمات و کلیشه‌های زیادی دارید. اما کارتان ساده است، کارهایی که باعث عقب ماندن شما است را حذف کنید و شگفت‌زده خواهید شد که با چه سرعتی پیشرفت خواهید نمود.

اما دلایل متخصص علم داده نشدن دقیقاً چیست؟

1- گمان می‌کنید که مدرکتان کافی است:

شما یک مدرک کارشناسی ارشد در یک شاخه‌ی محاسباتی و یا حتی مدرک دکتری دارید و اکنون می‌خواهید که یک سر و گردن از دیگران جلوتر باشید. اما آیا تاکنون از یک شِل (Shell، به زبان بسیار ساده شِل برنامه‌ایی است که دستورات را از صفحه کلید می‌گیرد و آنها را به سیستم عامل جهت اجرا انتقال می‌دهد) استفاده کرده‌اید؟ آیا تابحال ترسی را که از خط-دستوراتِ واسط در هنگام مواجه با خطاها ناشی می‌گردد، حس کرده‌اید؟ آیا تاکنون با پایگاه‌- داده‌های بزرگ، در مقیاس ترابایت، کار کرده‌اید؟

اگر به هر کدام از سئوال‌های فوق پاسخ منفی بدهید، شما هنوز آماده نیستید. شما به مقداری از تجربیات دنیای واقعی و پروژه‌های معنادار نیازمندید. تنها در این صورت است که با مسائلی مواجه می‌شوید که قرار است هر روزه بعنوان یک متخصص علم داده با آنها سر و کار داشته باشید، و تنها در این صورت است که شما مهارت‌هایتان را برای حل آنها توسعه خواهید داد. تبریک می‌گویم بخاطر مدرکتان. حالا بسرعت و قاطعیت، به سختی تلاش کنید.

2- اشتیاق‌تان کم است:

آیا تاکنون کل یک آخر هفته را روی یک پروژه‌ی خسته‌کننده گذرانده‌اید؟ آیا تاکنون شب‌هایتان را در مرور گیت‌هاب (GitHub) در حالی که دوستان‌تان در پارتی‌ها هستند، گذرانده‌اید؟ آیا تاکنون به سرگرمی‌های مورد علاقه‌تان برای اینکه کمی کدنویسی کنید، نه گفته‌اید؟ اگر نتوانید به سئوالات اخیر پاسخ مثبت دهید، شما به اندازه‌ی کافی مشتاق نیستید. علم داده علمی است که با مسائل بسیار سخت مواجه می‌شود و شما باید با آنها سر و کله بزنید تا به یک پاسخ برسید.

اگر به اندازه‌ی کافی مشتاق و علاقمند نباشید، در اولین فرصت و با اولین برخورد با سختی‌ها، از حل آن شانه خالی خواهید کرد. فکر کنید که چه چیزی شما را جذب می‌کند تا یک متخصص علم داده شوید؟ آیا عنوان شغلی جذاب و مسحور کننده‌اش است؟ یا دورنمای شخم زدن حجم عظیمی از داده در جستجوی بینش و آگاهی است؟ اگر این مورد آخری است، شما در مسیر درستی قرار دارید.

3- به اندازه‌ی کافی دیوانه و شیدا نیستید:

تنها ایده‌های دیوانه‌وار، ایده‌های خوبی هستند، و بعنوان یک متخصص داده، شما به تعداد زیادی از آنها نیاز پیدا خواهید کرد. نه تنها نیاز پیدا خواهید کرد که پذیرای نتایج غیرمتقربه‌ایی که زیاد بوجود می‌آیند، باشید، بلکه مجبور خواهید شد که پاسخ‌ به سئوالات واقعاً مشکل را گسترش دهید. این مورد نیاز به یک سطح فوق‌العاده دارد که نمی‌توانید با ایده‌های نرمال به آن دست یابید. اگر مردم مدام بشما می‌گویند که دیوانه شدی، شما در مسیر درست هستید. اگر خیر، شما باید روی شیدایی‌تان کمی کار کنید. البته این نیاز به کمی جسارت دارد. کمی که بی‌قاعدگی‌تان را بروز دادید، ممکن است برخی از مردم سرشان را بخارانند و پشتشان را به شما کنند. اما ارزشش را دارد، چون شما با خودتان صادق هستید و در حال ایجاد و تولید جرقه‌های محشر بودن هستید که بعنوان یک متخصص علم داده، نیازمند آن هستید.

دلایل متخصص علم داده نشدن

همیشه شیدایی به معنای انجام کارهای متفاوت نیست. همین که متفاوت بیاندیشیم، برای شروع کافی است. همیشه حق با اکثریت نیست.

4- از کتاب‌ها و دوره‌های آنلاین یاد می‌گیرید:

برداشت بد نکنید. کتاب‌ها و کلاس‌های آنلاین روش‌های بسیار خوب برای شروع هستند. اما تنها برای شروع. شما در اسرع وقت نیازمند کار روی پروژه‌های واقعی هستید. یادگیری ضمن انجام دادن، کلید کار است. با ساختن پروفایل گیت‌هاب خودتان آغاز کنید. در برخی از رقابت‌های هکاتون (Hackathon، رویدادی که در آن برنامه‌نویسان کامپیوتر و سایر توسعه‌دهندگان نرم‌افزار گرد هم می آیند تا در توسعه پروژه‌های نرم و گاهاً سخت‌افزاری همکاری نمایند) و کگل (Kaggle، بزرگ‌ترین جامعه مهندسان داده و یادگیری ماشین است) شرکت کنید. همچنین درباره‌ی تجربیات‌تان (وبلاگ-نویسی کنید) بنویسید. همه می‌توانند، کتاب‌های درسی بنویسند. برای اینکه یک متخصص علم داده باشید، باید بیشتر انجام دهید.

دلایل متخصص علم داده نشدن

البته هنوز تعریف دقیقی از علم داده وجود ندارد ولی دیاگرام فوق تا حدودی چهارچوب کلی از آن را برای ما ترسیم می‌کند. همان‌طور که ملاحظه می‌کنید علم داده به اطلاعات و تیم کاملی نیازمند است.

5- فکر می‌کنید که در جایی می‌توانید یادگیری را متوقف نمائید:

شما در تعدادی از دوره‌های آنلاین علم داده ثبت نام کرده‌اید و در حال مطالعه‌ی چند کتابِ مرجع هستید. حالا فکر می‌کنید وقتی که آنها را کاملاً یاد بگیرید، به اندازه‌ی کافی برای کشف و توسعه‌ در علم داده آموخته‌اید. اشتباه است. این تنها آغاز است. اگر فکر می‌کنید که تاکنون زیاد آموخته‌اید، فکر کنید که چقدر در طول سه سال آینده خواهید آموخت. اگر شما درنهایت یک متخصص علم داده شوید، ده برابر بیشتر از چیزی که اکنون یاد دارید، خواهید داشت.

این علم، چیزی دائماً در حال تغییر است که تکنولوژی‌های جدید بطور مداوم به آن نیاز دارند. اگر هنگامی که کارتان را یافتید، یادگیری را متوقف کنید، مسیرتان از یک متخصص علم داده‌ی مبتدی به یک متخصص علم داده‌ی مزخرف تبدیل خواهد شد. اگر می‌خواهید که در علم داده برتر باشید نیاز دارید تا با این واقعیت که منحنی یادگیری‌تان با گذشت زمان شیب تندتری پیدا خواهد کرد، مواجه شوید. اگر از زیاد یادگرفتن لذت نمی‌برید، رویای متخصص علم داده شدن را رها کنید.

6- در حوزه‌های دیگر تجربه ندارید:

شما یک یا دو موردی از علوم کامپیوتر بلدید و مهارت‌های ریاضی‌تان هم خیلی بد نیست. آیا قادر خواهید بود که یک شغل در حوزه‌ی علم داده پیدا کنید؟ خیر، نمی‌توانید. مهارت‌های شما در آی.تی. و ریاضی اساسی هستند اما آنقدر کافی نیستند تا خودتان را از بقیه‌ی علاقمندان علم داده جدا کنید. متخصصین علم داده در انواع کمپانی‌ها و اقسام مختلف صنایع کار می‌کنند. برای انتقال نقطه‌نظراتِ کلیدی به مشتری‌هایتان، نیازمند دانش در حوزه‌ی کاری آنها هستید. سعی کنید که خودتان را بعنوان یک متخصص در زمینه‌ی کاری‌تان جا دهید تا بعنوان یک متخصص علم داده‌ی عمومی. به این شکل، شما واقعاً کار پیدا خواهید کرد.

7- کمبود مهارت‌های تجارت و بیزینس دارید:

بنابراین شما بیشتر از نوع تحلیلی می‌باشید. شما عاشق اعداد و آنالیز کمی هستید و از محاسبات نرم و ارتباطات انسانی متنفرید. دوست من، این شما را یک متخصص علم داده‌ی خوب نمی‌کند. مهارت‌های نرم، حتی در مشاغل کمی نیز مهم هستند. مهارت‌های نرم در نهایت باعث می‌شوند که در مصاحبه‌ی شغلی فوق‌العاده باشید. از تمامی مهارت‌های نرم که می‌توانید کسب کنید، مهارتِ تجارت و کسب و کارتان نیاز به یک ترقی دارد. توجه کنید که مشتری‌های شما، رهبران تجاری هستند و در نتیجه آنها نیازمند افرادی‌ می‌باشند که تجارت را بفهمند. تنها از این طریق می‌توانید بینش‌هایی تولید کنید که به مشتری بها می‌دهد.

دلایل متخصص علم داده نشدن

بعضاً همین گپ و گفت‌های کوتاه و دوستانه منجر به ارتباطات عمیق کاری در آینده خواهد شد. پس تا می‌توانید از مهارت ارتباطات بهره ببرید.

8- ارتباطات معناداری ندارید:

شما می‌خواهید شغلی در این زمینه بیابید اما هیچ همکار متخصص داده‌ایی را نمی‌شناسید؟ زمانش رسیده که زود عمل کنید دوست من. به دور همی‌ها و ملاقات‌ها بروید. به گروه‌های مربوط ومناسب در لینکداین ملحق شوید. سعی کنید افراد در هکاتون را بشناسید. افراد درست را در توئیتر دنبال کنید. همکارانتان را در پروژه‌ی گیت‌هاب ملاقات کنید. چیز شگفت‌انگیزی انجام دهید. همانند هر جستجوی شغلی دیگری، 90 درصد موفقیت شما با توجه به گستردگی مهارت‌هایتان تعیین نمی‌شود، توسط افرادی معین می‌شود که می‌توانند منبع و معرف شما باشند و کسانی که بتوانند مقدمه‌ایی به شما بدهند.

اگر ارتباط‌های لینکداین شما محدود به مادر و همکارانتان در یک شغل به بن‌بست رسیده باشد، وقتش رسیده که کمی پروفایلتان را پررنگ‌تر کنید. اگر دنبال‌کنندگان توئیتر شما انگشت‌شمار هستند، شروع کنید به توئیت کردن. اگر وبلاگ‌تان خواننده‌ایی ندارد، شروع کنید به بهینه‌سازی موتورهای جستجو و کمی بازاریابی بخوانید. ارتباطات خواهند آمد. اما شما در وهله‌ی نخست باید خوب و سریع شروع کنید.

9- کارهای کثیف را دوست ندارید:

شما خیلی در خصوص یادگیری ماشین و هوش مصنوعی شنیده‌اید. فکر می‌کنید که علم داده می‌تواند دربِ کار کردن با تکنولوژی‌های بروز را برای شما باز کند؟ من تضمین می‌کنم که شما بیشتر از 5 درصد از وقت‌تان را نمی‌توانید آنرا انجام دهید. به محض اینکه کار رویایی‌تان را یافتید، بخش اعظم زمان‌تان را صرف تمیز کردن داده‌ها خواهید کرد. تبریک می‌گویم. شما هم‌اکنون یک شغل بعنوان فراش مدرسه پیدا کردید. اگر آنرا دوست ندارید، بروید خانه. نباید این پست را بخوانید. اگر شما هنوز دوست دارید که یک متخصص علم داده بشوید، بعد از خواندن کامل این پست، این زمانی که صرف کردید، یعنی شما عاشق کارِ کثیف شدید.

«علم داده یک شغل نیست، یک حرفه و عشق است»

متخصصین علم داده اکثراً بدنبال افرادی هستند که کارهای سطحی انجام می‌دهند. اما برای یافتن یک موقعیت شغلی در این زمینه، کارهای کوچک و سطحی کافی نیستند. شما نیاز دارید که سخت کار کنید. اگر بعد از خواندن این پست متقاعد شده‌اید که هنوز می‌خواهید یک متخصص علم داده شوید، تبریک می‌گویم. شما احتمالاً در یک مسیر خیلی خوب هستید. اگر در این مرحله و نقطه شما مطمئن نیستید از اینکه یک متخصص علم داده شوید، ابتدا بزرگ‌ترین دلایل‌ شک‌هایتان را مشخص کنید. سپس روی آن موارد کار کنید، می‌توانید انجامش دهید.

اینها بزرگترین دلایل متخصص علم داده نشدن بود که بررسی کردیم. امیدوارم با رعایت همین نکات کوچک، بتوانید بهترین و بزرگ‌ترین جایگاه‌ها را از آن خود کنید.

 

دیتا ساینس یا علم داده چیست؟

یکی از واژه‌ها و مشاغل پُر جستجو در این روزها در آمریکا، واژه‌ی علم داده یا دیتا ساینس و متخصص علم داده است. این حرفه یا تخصص، امسال، برای چهارمین سال متوالی، جزوه مشاغل پُر درخواست و پُر از موقعیت شغلی در آمریکا و سایر کشورهای صنعتی محسوب می‌شد و گمان می‌کنم به این زودی‌ها، نیاز این کشورها به متخصص علم داده برآورده نشود. پس ورود به این رشته می‌تواند، ضامن داشتن یک شغل خوب با درآمد بالا در آینده، برای دانشجو یا محقق باشد.

اما اینکه دیتا ساینس چیست و دقیقاً قرار است چه کاری بکند، گمان می‌کنم هنوز کاملاً مشخص نیست، چون با توجه به نیازها و موردهای مختلف، ابزار متفاوتی باید بکار گرفته شود. ولی چیزی که واضح است، یک متخصص علم داده یا دیتا ساینس، در سه رشته‌ی:

1- ریاضیات،
2- آمار،
3- علوم کامپیوتر،

اطلاعات نسبتاً خوب و جامعی دارد و می‌تواند بوسیله‌ی این سه شاخه، با ورود به شرکت‌های بزرگ و کارخانجات و با مطالعه و آنالیز داده‌ها، در تصمیم‌گیری‌ها و درآمدزایی بیشتر، نقش بسزایی داشته باشد. اصلی‌ترین ابزار هم در این بین، علم آمار است که بزودی همگان خواهند فهمید، این علم، یکی از بزرگترین دستاوردهای بشر تا به امروز بوده، است و خواهد بود، البته نه آماری که در دانشگاه‌ها صرفاً تدریس می‌شود تا بتواند چند داده محدود را مطالعه و آنالیز نماید، شخص باید از ابزارهای آماری، جهت سر و کله زدن با حجم بسیار بزرگی از داده‌ها، استفاده نماید. سپس از ریاضی و برنامه‌نویسی کامپیوتری، مخصوصاً زبان پایتون (Python)، کمک بگیرد تا بتواند داده‌ها را در مسیر درست مطالعه و بهره‌برداری و اخذ الگوهای مناسب، رده بندی کند و نتیجه مطلوبش را اخذ نماید.

آیا در این رشته کتاب به زبان فارسی وجود دارد؟

اخیراً یک کتاب فارسی با عنوان “علم داده: مفاهیم و مهارت‌ها” به قلم یکی از اعضای هیات علمی دانشگاه تهران همراه با یکی از دانش‌آموختگان کارشناسی ارشد ایشان، خواندم. البته در این کتاب نیز مطلب تخصصی خاصی از این رشته دستگیرم نشد. اما تقریباً اطلاعات عمومی زیادی در خصوص آن کسب کردم. مثلاً اینکه، در آمریکا، اخیراً گرایش خاصی به سمت رشته‌ی آمار، در بین دانشجویان ایجاد شده و اینکه تعداد دانشگاه‌هایی که در حال ایجاد رشته‌ی علم داده یا دیتا ساینس هستند، هر روز رو به افزایش است. تعاریف مختلف از این رشته، بیان شده و … . ولی متاسفانه هیچ بحث عملی، با جزئیات بیشتر برای فهم خواننده از این رشته، عنوان نشده است.

بهرحال باید بدانید که در رشته‌ی علم داده یا دیتا ساینس، در حال حاضر کتاب به زبان فارسی، تقریباً، وجود ندارد. البته چند جلد کتاب در این حوزه دیده‌ام که دوستان در رشته‌های مدیریت یا اقتصاد به رشته‌ی تحریر در آورده‌اند که خیلی مباحث، آماری، ریاضی و کامپیوتری در آنها وجود ندارد. پس اگر بخواهید به عمق تعاریف و تکنیک‌ها در این گرایش پی‌ببرید و تصمیم بگیرید که وارد آن بشوید یا نه، باید چند کتاب به زبان انگلیسی بخوانید. مثلاً من کتاب (The Mathematics of Data) را به تازگی از انتشارات انجمن ریاضی آمریکا (AMS) خریده‌ام که حاوی مباحث بسیار جالب و تخصصی در این زمینه است.

دیتا ساینس یا علمِ داده

کتابی در حوزه‌ی دیتا ساینس یا علمِ داده

آیا رفتن دانشجویان ریاضی به این سمت، مفید است؟

با توجه به اینکه در حال حاضر، دانشجویان بخاطر سیستم غلط آموزشی، از لحاظ فهم ریاضی، افت بسیار شدیدی داشته‌اند، خواندن ریاضی برایشان سخت شده است. پس ورود به رشته‌ایی که هم نزدیک به آن است، هم کاربردی باشد و هم موقعیت شغلی بهتری داشته باشد، صد در صد توصیه می‌شود. اما در ایران، در حال حاضر چنین رشته‌ایی به‌صورت رسمی وجود ندارد (تنها دانشگاه شهید بهشتی در مقطع کارشناسی ارشد در این رشته پذیرش دارد) و متقاضی باید به آمریکا یا سایر کشورهایی که این رشته را دارند، برود.

اما اشتباهی که دانشجویان انجام می‌دهند این است که آنها گمان می‌کنند، برای اینکه وارد مقطع دکتری، بعنوان مثال رشته‌ی علم داده بشوند، همانند ایران اول باید یک مدرک کارشناسی ارشد داشته باشند تا بعد بتوانند در دوره‌ی دکتری پذیرش بگیرند. اما سیستم آموزشی آمریکا اینگونه است که برای پذیرش در مقطع دکتری، فقط از شما یک لیسانس می‌خواهند. دوره‌ی دکتری در آنجا پنج الی شش سال بطول می‌انجامد و در این دوره، تا دو سال واحدهایی را برای شما پیش‌بینی می‌کنند که هم دروس کارشناسی ارشد را پوشش دهد و هم دروس دوره‌ی دکتری را. از سال سوم به بعد هم معمولاً وارد پژوهش می‌شوند تا وقتی که کارشان به نتیجه برسد.

پس، بعد از اخذ لیسانس، اصلاٌ نیازی به این ندارید که بلافاصله وارد مقطع ارشد بشوید. به عقیده‌ی بنده، همین دوسالی را که وقتتان را برای گرفتن ارشد، تلف می‌کنید، وقت بگذارید و آزمون‌های تافل (TOEFL) و جی.آر.ایی. (GRE) را که مهمترین مدارک برای ورود به بهترین و بزرگترین دانشگاه‌های آمریکا است، بگیرید. نگران رزومه قوی هم نباشید. اگر انگیزه قوی و هدف خوبی داشته باشد، و بتوانید یک هدف نامه (Statement of Purpose) خوب بنویسید، قطعاً از یک دانشگاه بسیار بزرگ و به اصطلاح با پرستیز، پذیرش (Admission) خواهید گرفت و کاملاً خرج تحصیلات‌تان را (با توجه به شرایطی) تا پنج سال تمام می‌دهند. حتی ورود به دانشگاه‌های پزشکی در آمریکا هم به همین شکل است. شخص اول باید در یکی از رشته‌های علوم پایه یک مدرک کارشناسی بگیرد، سپس مجاز است که وارد دانشکده‌ی پزشکی بشود. در غیر اینصورت محال است، مگر اینکه از نوع دانشگاه‌هایی باشد که فقط پول می‌گیرند و مدرک چاپ می‌کنند.

البته تنها این رشته مد نظر نیست. لزومی ندارد، کسی که لیسانس ریاضی دارد، تا آخر عمر ریاضی بخواند. می‌تواند وارد رشته‌ی علوم کامپیوتر بشود. یا آمار یا هر رشته‌ی دیگری که به آن علاقمند است و در آن مستعد می‌باشد. ولی بدانید که رشته‌هایی نظیر علم داده، آمار و یا علوم کامپیوتر، در کشورهای صنعتی، تقریباً جزو مشاغل خیلی خوب و با درآمد بالا محسوب می‌شوند. البته به عقیده‌ی بنده، تغییر رشته‌ی دانشجویان ریاضی به رشته‌های دیگر، مثل همین رشته‌هایی که در بالا قید نمودم، مزایای دیگری هم دارد.

بعنوان مثال شما در ایران، در حال حاضر بعید است که حتی با داشتن دکتری در رشته‌ی ریاضی، بتوانید عضو هیات علمی دانشگاه‌ها بشوید چون تعداد افراد و مدارک در این رشته، در حال حاضر زیاد است، (مگر گرایش‌های جدیدی مثل ریاضی مالی، رمز و کد و …) البته امکانش هست که در سال‌های آتی، این تعداد به شدت کاهش یابد و مجدد همان غصه‌‎ها تکرار شوند. ولی بعنوان مثال در رشته‌ایی مثل علوم کامپیوتر، چون اکثر افراد می‎‌توانند خارج دانشگاه، کار کنند و درآمدهای خوبی داشته باشند، معمولاً به هیات علمی شدن، تن نمی‌دهند و تعداد افراد هیات علمی در این رشته، کم است و این بدیهی است که جذب راحت می‌شود، حتی اگر ضعیف باشید. پس فقط باید کسانی این رشته را ادامه دهند که واقعاً ریاضی در خونشان باشد و بتوانند کارهای پژوهشی بسیار خوبی انجام دهند تا به این‌وسیله وارد دانشگاه‌ها شوند، بعنوان یک هیات علمی. در غیر اینصورت باید تغییر رشته بدهید.

این نکته را نیز در ذهن داشته باشید، که دانشجویان ریاضی، چون منطقِ ریاضیِ ذهن‌شان خوب است، نسبت به دانشجویان کامپیوتر و یا حتی آمار، بعد از ورود به این رشته‌ها، موفق‌تر می‌شوند. مثلاً بدانید که بزرگترین برنامه‌نویسان کامپیوتری در دنیا، افرادی بوده‌اند که از ریاضی به سمت این رشته رفتند و هم چنین در رشته‌ی علم داده و یا حتی آمار.

آینده این رشته در ایران چطور خواهد بود؟

قطعاً چون تعداد افرادی که در دیتا ساینس متخصص هستند در کشور بسیار کم است، داشتن دانش و مدرک در این زمینه، در آینده، شخص را در ایران بیکار نخواهد گذاشت. اما همه‌ی اینها بستگی به سواد و روابط فرد دارد. در خیلی از کتاب‌های علم داده یا دیتا ساینس، توصیه می‌شود که شخص باید بتواند قدرت مجاب کردن دیگران را داشته باشد که این مستلزم داشتن روابط اجتماعی بالاست. مثالی هم می‌زنند که فرض کنید شما مسئول یک تیم تحقیقاتی در خصوص خط تولید یک کارخانه هستید. بعد از اینکه اطلاعات را کاملاً آنالیز کردید و نتیجه‌گیری نمودید، باید بیائید و یافته‌هایتان را برای هیات مدیره‌ی آن مجموعه ارائه نمائید و آنها را متقاعد کنید که این داده‌ها و اطلاعات ما را به سمت انجام چنین کاری سوق می‌دهند، باید به آنها ثابت نمائید که انجام اینکار باعث منفعت‌های مادی فراوانی برای مجموعه است، در غیر اینصورت کار شما بی‌فایده است.

با تمام این تفاسیر، داشتنِ دانشِ تخصصی در این رشته در ایران، در سال‌های پیش رو، بسیار مورد نیاز خواهد بود و کسانی که در این زمینه حرفی برای گفتن داشته باشند، هم جایگاه خوبی را کسب خواهند کرد و هم درآمد بالایی خواهند داشت. در حال حاضر در ایران، دانشگاه شهید بهشتی، بعنوان یکی از زیرشاخه‌های رشته‌ی ریاضی کاربردی، این رشته، یعنی دیتا ساینس را راه‌اندازی کرده‌اند. احتمالاً بزودی، سایر دانشکده‌ها، در دانشگاه‌های بزرگ کشور، چنین گرایشی را تعریف و راه‌اندازی نمایند. ولی در حال حاضر، مقطع دکتری این رشته در ایران وجود ندارد.

بنابراین، اگر شما قرار است که از ایران بروید و یک رشته‌ایی را بخوانید و بعدها برگردید تا به میهن و وطن‌تان خدمت کنید، بهتر است بدنبال رشته‌هایی باشید که در کشور وجود ندارند یا افراد متخصص در آنها بسیار کم هستند، یکی از این رشته‌ها علم داده است.

اگر دیدگاه، نظر و یا سؤالی در خصوص دیتا ساینس دارید حتماً در قسمت نظرات منعکس کنید. ما پاسخ شما را می‌دهیم.