علم داده یا Data Science چیست؟علم داده یا Data Science چیست؟

علم داده یا Data Science چیست؟

نویسنده: حامد هرمزی

دسته بندی: هوش تجاری
8 دقیقه زمان مطالعه
۱۴۰۰/۰۴/۲۹
0 نظر
امتیاز 2.5 از 5

این روزها علم داده یا Data Science یکی از موضوعات بسیار جذاب دنیای IT به شمار می‌رود؛ دانشی برای یک مسیر شغلی جدید که افراد زیادی داوطلب یادگیری آن هستند. داده‌پردازان حرفه‌ای به این نتیجه رسیده‌اند که مهارت‌های سنتی استفاده از Big Data، آنالیز، تحلیل داده‌ها و مهارت‌های برنامه‌نویسی آن‌ها نیازمند به‌روزرسانی و بهبود است. دانشمندان علم داده برای استفاده هوشمندانه از اطلاعات در سازمان خود، باید بر طیف کاملی از چرخه حیات علم داده تسلط داشته و دارای سطح انعطاف‌پذیری و درک بالاتری برای بررسی بازدهی هر مرحله از فرآیند باشند. در این مقاله مختصری درباره دیتاساینس و تاریخچه آن صحبت می‌کنیم و موقعیت‌های شغلی موجود در این زمینه را به شما معرفی خواهیم کرد. 

تاریخچه دیتا ساینس

استفاده از اصطلاح دانشمند داده یا دیتا ساینتیست (data scientist) از سال 2008 رواج پیدا کرد. سازمان‌ها پس از گسترش سریع دانش و افزایش قابل توجه دیتاها به این نتیجه رسیدند که برای سازماندهی، تجزیه و تحلیل و کسب نتیجه کاربردی، نیاز به متخصصانی دارند که بتوانند داده‌هایی با حجم زیاد را پردازش کنند و از میان انبوه اطلاعاتی که ممکن است در نگاه اول حتی کاربردی به نظر نرسند، نتایج مورد انتظار سازمان را استخراج کنند.

در سال 2009 هال واریان (Hal Varian)، اقتصاددان ارشد گوگل و استاد دانشگاه برکلی در زمینه‌های علوم اطلاعات، تجارت و اقتصاد، مقاله‌ای در McKinsey & Company به چاپ رساند و در آن به اهمیت سازگاری با تأثیرات فناوری اشاره و تغییر شکل مجدد صنایع مختلف را پیش‌بینی کرده بود:

«توانایی به دست ‌آوردن دیتا، پردازش آن، ایجاد ارزش از دیتا و قابلیت تجسم بخشیدن به آن برای ایجاد معنا، مهارت بسیار مهمی در دهه‌های آینده خواهد.»

کار یک دیتاساینتیست چیست؟

در طول دهه گذشته و با سپری شدن زمان، دیتاساینتیست‌ها تبدیل به یکی از اجزاء ضروری برای هر سازمانی شده‌اند. این افراد در گردآوری اطلاعات و پردازش داده خبره هستند و دانش فنی بسیار خوبی دارند. آن‌ها با استفاده از الگوریتم‌های پیچیده و دانش بالا، مقادیر زیادی از اطلاعات را پردازش و سازماندهی می‌کنند. سپس با استفاده از این عملیات پاسخ‌های مورد نیاز سازمان را پیدا می‌کنند و در اجرای استراتژی‌های سازمان، نقش موثری خواهند داشت.

یک دیتاساینتیست حرفه‌ای می‌تواند سوالات درستی مطرح کند و به آن‌ها پاسخ دهد. او داده‌ها را از منابع مختلف جمع‌آوری و سازماندهی می‌کند و سپس نتایج را به راه ‌حل تبدیل خواهد کرد. همچنین او یافته‌های خود را به روشی منتقل می‌کند که بر تصمیمات تجاری، تأثیر مثبت بگذارد.

دانشمندان داده باید کنجکاو و نتیجه‌گرا باشند، دانش و مهارت‌های ارتباطی متناسب با صنعت مربوطه را داشته باشند و با داشتن این ویژگی‌ها، می‌توانند نتایج فنی و تخصصی را برای همکاران خود توضیح دهند. به همین دلیل آن‌ها باید دانشی قوی در زمینه آمار و جبر خطی و همچنین برنامه‌نویسی داشته باشند.  

دیتاساینتیست‌ها همچنین باید بتوانند از ابزارها و نرم‌افزارهای کلیدی استفاده کنند، نرم‌افزارهایی مانند موارد زیر در این دانش بیشتر مورد استفاده قرار می گیرند:

کار یک دیتاساینتیست چیست؟

چرا دیتاساینیتست شویم؟

 Glassdoorکه یکی از معتبرترین سایت‌های کاریابی در سراسر اروپا،کانادا و آمریکا است، دیتاساینتیست را برای سومین سال متوالی به عنوان بهترین شغل در آمریکا در سال 2018 انتخاب کرد. با دسترسی بیشتر به داده‌ها، شرکت‌های بزرگ فناوری دیگر تنها گروهی نیستند که به دانشمندان داده احتیاج دارند.

تقاضای فزاینده‌ای برای جایگاه شغلی متخصصان علوم داده در صنایع کوچک و بزرگ دیده می‌شود. کمبود نیروی متخصص در این حوزه یک چالش برای سازمان‌ها به شمار می‌رود.دیتاساینتیست به عنوان یکی از مورد نیازترین مشاغل در سال 2017 و 2018 معرفی شده است. از این عنوان شغلی به همراه مهارت‌های متعدد مرتبط با علوم داده، به عنوان یکی از بیشترین درخواست‌های شرکت‌ها نام برده شده است. 

آماری که در ادامه مشاهده می‌کنید، تقاضای قابل توجه و رو به رشد برای استخدام دانشمندان داده را نشان می‌دهد:

چرا دیتاساینیتست شویم؟

موقعیت‌‌های شغلی در حوزه علم داده

داده‌ها گسترده هستند و در همه جا دیده می‌شوند. تعاریف شغلی و موقعیت‌های کاری متنوعی در رابطه با استخراج، نظم‌دهی، تجزیه و تحلیل و تفسیر داده‌ها وجود دارد که اغلب به جای یکدیگر استفاده می‌شوند. در ادامه به بررسی تعدادی از اصطلاحات مورد استفاده در این حوزه می‌پردازیم:

دانشمند داده (Data Scientist)

یک دانشمند داده بررسی می‌کند که به کدام یک از سوالات باید پاسخ داده شود و از کجا می‌توان داده‌های مربوطه را پیدا کرد. او باید مهارت‌هایی مانند تجزیه و تحلیل‌، استخراج ، جداسازی و ارائه اطلاعات برخوردار باشد. سازمان‌ها از دانشمندان داده برای تهیه، مدیریت و تجزیه و تحلیل مقدار زیادی از داده‌های غیر ساختاری بهره ‌می‌برند. این نتایج برای تصمیم‌گیری استراتژیک در سازمان استفاده می‌شود.

مهارت‌های مورد نیاز برای یک دانشمند داده یا دیتا ساینتیست شامل موارد زیر می‌شود:

  • مهارت‌های برنامه‌نویسی (SAS, R, Python )
  • مهارت‌های آماری و ریاضی
  • مهارت‌های کلامی و تجسم داده‌ها
  • Hadoop 
  • SQL 
  • ماشین لرنینگ

تحلیلگر داده (Data Analyst)

تحلیلگران داده، فاصله بین تحلیلگران تجارت و منطق موجود در داده‌ها را برطرف می‌کنند. سوالاتی که در سازمان نیاز به پاسخ دارد، به آن‌ها ارجاع داده می‌شود. تحلیلگران، داده‌ها را سازماندهی و تجزیه و تحلیل می‌کنند تا نتایجی را پیدا کنند که با استراتژی‌ها و نیازهای کسب و کار همسو باشد. تحلیل‌گران داده وظیفه دارند تجزیه و تحلیل‌های تخصصی خود را به صورت اقدامات کیفی و قابل اجرا بیان کنند و یافته‌ها را به سازمان ارائه دهند.

مهارت‌های مورد نیاز برای یک تحلیلگر داده شامل موارد زیر می‌شود:

  • مهارت‌های برنامه‌نویسی (SAS, R, Python )
  • مهارت‌های آماری و ریاضی
  • مهارت‌های کلامی و تجسم داده‌ها 
  • مهندس داده (Data Engineer)

مهندسان داده، مقادیر داده‌ها را که به سرعت در حال تغییر است، مدیریت می‌کنند. آن‌ها بر توسعه، بهره‌برداری، مدیریت و بهینه‌سازی جریان داده‌ها تمرکز دارند و زیرساخت‌های مورد نیاز برای تبدیل و انتقال داده‌ها به دانشمندان داده را فراهم می‌کنند.

مهارت‌های مورد نیاز برای یک مهندس داده شامل موارد زیر می‌شود:

  • زبان‌های برنامه‌نویسی (جاوا ، اسکالا)
  • آشنایی با دیتابیس‌ NoSQL (MongoDB, Cassandra DB)
  • فریم ورک‌ها (Apache Hadoop) 

جمع‌بندی

در این مقاله سعی کردیم درباره علم داده، مسیرهای شغلی و مهارت‌های مورد نیاز آن توضیحاتی ارائه کنیم. داده‌ها در دنیای امروز و برای هر کسب وکاری حیاتی هستند و تمام تصمیم‌گیری‌ها و نتایج، با توجه به اطلاعات سنجیده می‌شوند. در ایران نیز استفاده از علم داده هر روز  اهمیت بیشتری پیدا می‌کند و سازمان‌ها نیاز و علاقه بیشتری برای استفاده از مهارت متخصصان این حوزه پیدا می‌کنند. فرصت‌های شغلی بسیار خوبی در انتظار کسانی خواهد بود که در زمینه دیتا ساینس مهارت‌های لازم را کسب کرده باشند. در صورتی که تجربه کار در این حوزه را دارید یا در سازمان خود از علم داده استفاده می‌کنید، خوشحال می‌شویم تجربه خود را با ما و خوانندگان این مقاله به اشتراک بگذارید.