این روزها علم داده یا Data Science یکی از موضوعات بسیار جذاب دنیای IT به شمار میرود؛ دانشی برای یک مسیر شغلی جدید که افراد زیادی داوطلب یادگیری آن هستند. دادهپردازان حرفهای به این نتیجه رسیدهاند که مهارتهای سنتی استفاده از Big Data، آنالیز، تحلیل دادهها و مهارتهای برنامهنویسی آنها نیازمند بهروزرسانی و بهبود است. دانشمندان علم داده برای استفاده هوشمندانه از اطلاعات در سازمان خود، باید بر طیف کاملی از چرخه حیات علم داده تسلط داشته و دارای سطح انعطافپذیری و درک بالاتری برای بررسی بازدهی هر مرحله از فرآیند باشند. در این مقاله مختصری درباره دیتاساینس و تاریخچه آن صحبت میکنیم و موقعیتهای شغلی موجود در این زمینه را به شما معرفی خواهیم کرد.
تاریخچه دیتا ساینس
استفاده از اصطلاح دانشمند داده یا دیتا ساینتیست (data scientist) از سال ۲۰۰۸ رواج پیدا کرد. سازمانها پس از گسترش سریع دانش و افزایش قابل توجه دیتاها به این نتیجه رسیدند که برای سازماندهی، تجزیه و تحلیل و کسب نتیجه کاربردی، نیاز به متخصصانی دارند که بتوانند دادههایی با حجم زیاد را پردازش کنند و از میان انبوه اطلاعاتی که ممکن است در نگاه اول حتی کاربردی به نظر نرسند، نتایج مورد انتظار سازمان را استخراج کنند.
در سال ۲۰۰۹ هال واریان (Hal Varian)، اقتصاددان ارشد گوگل و استاد دانشگاه برکلی در زمینههای علوم اطلاعات، تجارت و اقتصاد، مقالهای در McKinsey & Company به چاپ رساند و در آن به اهمیت سازگاری با تأثیرات فناوری اشاره و تغییر شکل مجدد صنایع مختلف را پیشبینی کرده بود:
«توانایی به دست آوردن دیتا، پردازش آن، ایجاد ارزش از دیتا و قابلیت تجسم بخشیدن به آن برای ایجاد معنا، مهارت بسیار مهمی در دهههای آینده خواهد.»
کار یک دیتاساینتیست چیست؟
در طول دهه گذشته و با سپری شدن زمان، دیتاساینتیستها تبدیل به یکی از اجزاء ضروری برای هر سازمانی شدهاند. این افراد در گردآوری اطلاعات و پردازش داده خبره هستند و دانش فنی بسیار خوبی دارند. آنها با استفاده از الگوریتمهای پیچیده و دانش بالا، مقادیر زیادی از اطلاعات را پردازش و سازماندهی میکنند. سپس با استفاده از این عملیات پاسخهای مورد نیاز سازمان را پیدا میکنند و در اجرای استراتژیهای سازمان، نقش موثری خواهند داشت.
یک دیتا ساینتیست حرفهای میتواند سوالات درستی مطرح کند و به آنها پاسخ دهد. او دادهها را از منابع مختلف جمعآوری و سازماندهی میکند و سپس نتایج را به راه حل تبدیل خواهد کرد. همچنین او یافتههای خود را به روشی منتقل میکند که بر تصمیمات تجاری، تأثیر مثبت بگذارد.
دانشمندان داده باید کنجکاو و نتیجهگرا باشند، دانش و مهارتهای ارتباطی متناسب با صنعت مربوطه را داشته باشند و با داشتن این ویژگیها، میتوانند نتایج فنی و تخصصی را برای همکاران خود توضیح دهند. به همین دلیل آنها باید دانشی قوی در زمینه آمار و جبر خطی و همچنین برنامهنویسی داشته باشند.
دیتاساینتیستها همچنین باید بتوانند از ابزارها و نرمافزارهای کلیدی استفاده کنند، نرمافزارهایی مانند موارد زیر در این دانش بیشتر مورد استفاده قرار می گیرند:
چرا دیتاساینیتست شویم؟
Glassdoor که یکی از معتبرترین سایتهای کاریابی در سراسر اروپا،کانادا و آمریکا است، دیتاساینتیست را برای سومین سال متوالی به عنوان بهترین شغل در آمریکا در سال ۲۰۱۸ انتخاب کرد. با دسترسی بیشتر به دادهها، شرکتهای بزرگ فناوری دیگر تنها گروهی نیستند که به دانشمندان داده احتیاج دارند.
تقاضای فزایندهای برای جایگاه شغلی متخصصان علوم داده در صنایع کوچک و بزرگ دیده میشود. کمبود نیروی متخصص در این حوزه یک چالش برای سازمانها به شمار میرود.دیتاساینتیست به عنوان یکی از مورد نیازترین مشاغل در سال ۲۰۱۷ و ۲۰۱۸ معرفی شده است. از این عنوان شغلی به همراه مهارتهای متعدد مرتبط با علوم داده، به عنوان یکی از بیشترین درخواستهای شرکتها نام برده شده است.
آماری که در ادامه مشاهده میکنید، تقاضای قابل توجه و رو به رشد برای استخدام دانشمندان داده را نشان میدهد:
موقعیتهای شغلی در حوزه علم داده
دادهها گسترده هستند و در همه جا دیده میشوند. تعاریف شغلی و موقعیتهای کاری متنوعی در رابطه با استخراج، نظمدهی، تجزیه و تحلیل و تفسیر دادهها وجود دارد که اغلب به جای یکدیگر استفاده میشوند. در ادامه به بررسی تعدادی از اصطلاحات مورد استفاده در این حوزه میپردازیم:
دانشمند داده (Data Scientist)
یک دانشمند داده بررسی میکند که به کدام یک از سوالات باید پاسخ داده شود و از کجا میتوان دادههای مربوطه را پیدا کرد. او باید مهارتهایی مانند تجزیه و تحلیل، استخراج ، جداسازی و ارائه اطلاعات برخوردار باشد. سازمانها از دانشمندان داده برای تهیه، مدیریت و تجزیه و تحلیل مقدار زیادی از دادههای غیر ساختاری بهره میبرند. این نتایج برای تصمیمگیری استراتژیک در سازمان استفاده میشود.
مهارتهای مورد نیاز برای یک دانشمند داده یا دیتا ساینتیست شامل موارد زیر میشود:
- مهارتهای برنامهنویسی (SAS, R, Python)
- مهارتهای آماری و ریاضی
- مهارتهای کلامی و تجسم دادهها
- Hadoop
- SQL
- ماشین لرنینگ
تحلیلگر داده (Data Analyst)
تحلیلگران داده، فاصله بین تحلیلگران تجارت و منطق موجود در دادهها را برطرف میکنند. سوالاتی که در سازمان نیاز به پاسخ دارد، به آنها ارجاع داده میشود. تحلیلگران، دادهها را سازماندهی و تجزیه و تحلیل میکنند تا نتایجی را پیدا کنند که با استراتژیها و نیازهای کسب و کار همسو باشد. تحلیلگران داده وظیفه دارند تجزیه و تحلیلهای تخصصی خود را به صورت اقدامات کیفی و قابل اجرا بیان کنند و یافتهها را به سازمان ارائه دهند.
مهارتهای مورد نیاز برای یک تحلیلگر داده شامل موارد زیر میشود:
- مهارتهای برنامهنویسی (SAS, R, Python )
- مهارتهای آماری و ریاضی
- مهارتهای کلامی و تجسم دادهها
- مهندس داده (Data Engineer)
مهندسان داده، مقادیر دادهها را که به سرعت در حال تغییر است، مدیریت میکنند. آنها بر توسعه، بهرهبرداری، مدیریت و بهینهسازی جریان دادهها تمرکز دارند و زیرساختهای مورد نیاز برای تبدیل و انتقال دادهها به دانشمندان داده را فراهم میکنند.
مهارتهای مورد نیاز برای یک مهندس داده شامل موارد زیر میشود:
- زبانهای برنامهنویسی (جاوا ، اسکالا)
- آشنایی با دیتابیس NoSQL (MongoDB, Cassandra DB)
- فریم ورکها (Apache Hadoop)
جمعبندی
در این مقاله سعی کردیم درباره علم داده، مسیرهای شغلی و مهارتهای مورد نیاز آن توضیحاتی ارائه کنیم. دادهها در دنیای امروز و برای هر کسب وکاری حیاتی هستند و تمام تصمیمگیریها و نتایج، با توجه به اطلاعات سنجیده میشوند. در ایران نیز استفاده از علم داده هر روز اهمیت بیشتری پیدا میکند و سازمانها نیاز و علاقه بیشتری برای استفاده از مهارت متخصصان این حوزه پیدا میکنند. فرصتهای شغلی بسیار خوبی در انتظار کسانی خواهد بود که در زمینه دیتا ساینس مهارتهای لازم را کسب کرده باشند. در صورتی که تجربه کار در این حوزه را دارید یا در سازمان خود از علم داده استفاده میکنید، خوشحال میشویم تجربه خود را با ما و خوانندگان این مقاله به اشتراک بگذارید.