همه چیز درباره علم داده یا Data Science

دسته بندی: هوش تجاری (BI)
7 دقیقه زمان مطالعه
1400/04/16
0 نظر

ین روزها علم داده یا Data Science یکی از موضوعات بسیار جذاب دنیای IT به شمار می‌رود؛ دانشی برای یک مسیر شغلی جدید که افراد زیادی داوطلب یادگیری آن هستند. داده‌پردازان حرفه‌ای به این نتیجه رسیده‌اند که مهارت‌های سنتی استفاده از کلان داده (Big Data)، آنالیز، تحلیل داده‌ها و مهارت‌های برنامه‌نویسی آن‌ها نیازمند به‌روزرسانی و بهبود است. دانشمندان علم داده برای استفاده هوشمندانه از اطلاعات در سازمان خود، باید بر طیف کاملی از چرخه حیات علم داده تسلط داشته و دارای سطح انعطاف‌پذیری و درک بالاتری برای بررسی بازدهی هر مرحله از فرآیند باشند. در این مقاله درباره دیتاساینس و تاریخچه آن صحبت می‌کنیم و موقعیت‌های شغلی موجود در این زمینه را به شما معرفی خواهیم کرد. 

تاریخچه دیتا ساینس

استفاده از اصطلاح دانشمند داده یا دیتا ساینتیست (Data Scientist) از سال ۲۰۰۸ رواج پیدا کرد. سازمان‌ها پس از گسترش سریع دانش و افزایش قابل توجه داده‌ها به این نتیجه رسیدند که برای سازماندهی، تجزیه و تحلیل و کسب نتیجه کاربردی، نیاز به متخصصانی دارند که بتوانند داده‌هایی با حجم زیاد را پردازش کنند و از میان انبوه اطلاعاتی که ممکن است در نگاه اول حتی کاربردی به نظر نرسند، نتایج مورد انتظار سازمان را استخراج کنند.

در سال ۲۰۰۹ هال واریان (Hal Varian)، اقتصاددان ارشد گوگل و استاد دانشگاه برکلی در زمینه‌های علوم اطلاعات، تجارت و اقتصاد، مقاله‌ای در McKinsey & Company به چاپ رساند و در آن به اهمیت سازگاری با تأثیرات فناوری اشاره و تغییر شکل مجدد صنایع مختلف را پیش‌بینی کرده بود:

«توانایی به دست ‌آوردن داده، پردازش آن، ایجاد ارزش از داده و قابلیت تجسم بخشیدن به آن برای ایجاد معنا، مهارت بسیار مهمی در دهه‌های آینده خواهد بود.»

کار یک دانشمند داده چیست؟

در طول دهه گذشته و با سپری شدن زمان، دیتاساینتیست‌ها تبدیل به یکی از اجزاء ضروری برای هر سازمانی شده‌اند. این افراد در گردآوری اطلاعات و پردازش داده خبره هستند و دانش فنی بسیار خوبی دارند. آن‌ها با استفاده از الگوریتم‌های پیچیده و دانش بالا، مقادیر زیادی از اطلاعات را پردازش و سازماندهی می‌کنند. سپس با استفاده از این عملیات پاسخ‌های مورد نیاز سازمان را پیدا می‌کنند و در اجرای استراتژی‌های سازمان، نقش موثری خواهند داشت.

یک دیتا ساینتیست حرفه‌ای می‌تواند سوالات درستی مطرح کند و به آن‌ها پاسخ دهد. او داده‌ها را از منابع مختلف جمع‌آوری و سازماندهی می‌کند و سپس نتایج را به راه ‌حل تبدیل خواهد کرد. همچنین او یافته‌های خود را به روشی منتقل می‌کند که بر تصمیمات تجاری، تأثیر مثبت بگذارد.

ویژگی‌های یک دانشمند داده چیست؟

دانشمندان داده باید:

  • کنجکاو و نتیجه‌گرا باشد.
  • دانش و مهارت‌های ارتباطی متناسب با صنعت مربوطه را داشته باشد.
  • با داشتن این ویژگی‌ها، بتواند نتایج فنی و تخصصی را برای همکاران خود توضیح دهد.
  • دانشی قوی در زمینه آمار و جبر خطی و همچنین برنامه‌نویسی داشته باشد.  

دیتاساینتیست‌ها همچنین باید بتوانند از ابزارها و نرم‌افزارهای کلیدی استفاده کنند. نرم‌افزارهایی مانند موارد زیر در این دانش بیشتر مورد استفاده قرار می گیرند:

کار یک دیتاساینتیست چیست؟

چرا دیتاساینیتست شویم؟

Glassdoor که یکی از معتبرترین سایت‌های کاریابی در سراسر اروپا،کانادا و آمریکا است، دیتاساینتیست را برای سومین سال متوالی به عنوان بهترین شغل در آمریکا در سال ۲۰۱۸ انتخاب کرده بود. با دسترسی بیشتر به داده‌ها، شرکت‌های بزرگ فناوری دیگر تنها گروهی نیستند که به دانشمندان داده احتیاج دارند.

تقاضای فزاینده‌ای برای جایگاه شغلی متخصصان علوم داده در صنایع کوچک و بزرگ دیده می‌شود. کمبود نیروی متخصص در این حوزه هم یک چالش برای سازمان‌ها به شمار می‌رود.

دیتاساینتیست به عنوان یکی از مورد نیازترین مشاغل در سال ۲۰۱۷ و ۲۰۱۸ معرفی شده است. از این عنوان شغلی به همراه مهارت‌های متعدد مرتبط با علوم داده، به عنوان یکی از بیشترین درخواست‌های شرکت‌ها نام برده شده است. 

آماری که در ادامه مشاهده می‌کنید، تقاضای قابل توجه و رو به رشد برای استخدام دانشمندان داده را نشان می‌دهد:

چرا دیتاساینیتست شویم؟

موقعیت‌‌های شغلی در حوزه علم داده

داده‌ها گسترده هستند و در همه جا دیده می‌شوند. تعاریف شغلی و موقعیت‌های کاری متنوعی در رابطه با استخراج، نظم‌دهی، تجزیه و تحلیل و تفسیر داده‌ها وجود دارد که اغلب به جای یکدیگر استفاده می‌شوند. در ادامه به بررسی تعدادی از اصطلاحات مورد استفاده در این حوزه می‌پردازیم:

دانشمند داده (Data Scientist)

یک دانشمند داده بررسی می‌کند که به کدام یک از سوالات باید پاسخ داده شود و از کجا می‌توان داده‌های مربوطه را پیدا کرد. او باید مهارت‌هایی مانند تجزیه و تحلیل‌، استخراج ، جداسازی و ارائه اطلاعات برخوردار باشد.

سازمان‌ها از دانشمندان داده برای تهیه، مدیریت و تجزیه و تحلیل مقدار زیادی از داده‌های غیر ساختاری بهره ‌می‌برند. این نتایج برای تصمیم‌گیری استراتژیک در سازمان استفاده می‌شود.

مهارت‌های مورد نیاز برای یک دانشمند داده یا دیتا ساینتیست شامل موارد زیر است:

  • مهارت‌های برنامه‌نویسی (SAS, R, Python)
  • مهارت‌های آماری و ریاضی
  • مهارت‌های کلامی و تجسم داده‌ها
  • Hadoop 
  • SQL 
  • یادگیری ماشین یا همان ماشین لرنینگ

تحلیلگر داده (Data Analyst)

تحلیلگران داده، فاصله بین تحلیلگران تجارت و منطق موجود در داده‌ها را برطرف می‌کنند. سوالاتی که در سازمان نیاز به پاسخ دارد، به آن‌ها ارجاع داده می‌شود. تحلیلگران، داده‌ها را سازماندهی و تجزیه و تحلیل می‌کنند تا نتایجی را پیدا کنند که با استراتژی‌ها و نیازهای کسب و کار همسو باشد. تحلیل‌گران داده وظیفه دارند تجزیه و تحلیل‌های تخصصی خود را به صورت اقدامات کیفی و قابل اجرا بیان کنند و یافته‌ها را به سازمان ارائه دهند.

مهارت‌های مورد نیاز برای یک تحلیلگر داده شامل موارد زیر است:

  • مهارت‌های برنامه‌نویسی (SAS, R, Python )
  • مهارت‌های آماری و ریاضی
  • مهارت‌های کلامی و تجسم داده‌ها 
  • مهندس داده (Data Engineer)

مهندسان داده، مقادیر داده‌ها را که به سرعت در حال تغییر است، مدیریت می‌کنند. آن‌ها بر توسعه، بهره‌برداری، مدیریت و بهینه‌سازی جریان داده‌ها تمرکز دارند و زیرساخت‌های مورد نیاز برای تبدیل و انتقال داده‌ها به دانشمندان داده را فراهم می‌کنند.

مهارت‌های مورد نیاز برای یک مهندس داده هم شامل موارد زیر است:

  • زبان‌های برنامه‌نویسی (جاوا ، اسکالا)
  • آشنایی با دیتابیس‌ NoSQL (MongoDB, Cassandra DB)
  • فریم ورک‌ها (Apache Hadoop) 

رابطه دیتا ساینس و ماشین لرنینگ

علم داده و یادگیری ماشین دو مفهومی هستند که جزئی از حوزه فناوری و استفاده از داده‌ها قرار می‌گیرند و برای ایجاد و نوآوری محصولات، خدمات، سیستم‌های زیرساختی و موارد دیگر استفاده می‌شوند. هر دو این حوزه‌ها تقاضاهای زیاد و درآمدهای بالایی دارند. 

نحوه شباهت دو حوزه را می‌توان با این جمله نشان داد که «مربع‌ها مستطیل هستند، اما مستطیل‌ها مربع نیستند.»

در واقع علم داده یک مستطیل فراگیر است، در حالی که یادگیری ماشین مربعی است که موجودیت خودش را دارد. هر دو علم داده و ماشین لرنینگ، ابزار کار دانشمندان داده هستند و به سرعت در تمام صنایع مورد پذیرش قرار می‌گیرند. 

به عبارت ساده، علم داده حوزه‌ای است که داده‌ها و چگونگی استخراج معنا را از آن مطالعه می‌کند، در حالی که یادگیری ماشین زیرشاخه هوش مصنوعی است که به درک و ساخت روش‌هایی اختصاص دارد که از داده‌ها برای بهبود عملکرد یا پیش‌بینی‌ها استفاده می‌کند. 

در سال‌های اخیر، یادگیری ماشین و هوش مصنوعی (AI) بخش‌هایی از علم داده بوده و نقش مهمی در تجزیه و تحلیل داده‌ها و هوش تجاری بازی می‌کنند. همچنین یادگیری ماشینی فرآیند تجزیه و تحلیل داده‌ها را خودکار می‌کند و پیش‌بینی‌هایی را بر اساس جمع‌آوری و تجزیه و تحلیل مقادیر زیادی از داده‌ها روی جمعیت‌های خاص انجام می‌دهد. 

مسیر یادگیری دیتا ساینس

قبل از این که درباره مسیر یادگیری علم داده صحبت کنیم، یک قدم به عقب برگردید و به این سوال فکر کنید که چرا می‌خواهید وارد کار در حوزه علم داده شوید؟ پاسخ این سوال مهم است؛ چرا که به شما کمک می‌کند تا متوجه شوید که در مسیر یادگیری علم داده روی چه حوزه‌هایی باید بیشتر تمرکز کنید.

به این فکر کنید که چه چیزی در علم داده یا همان دیتا ساینس شما را هیجان‌زده می‌کند؟ کار کردن با داده‌های خام و تبدیل آن‌ها به اطلاعات مفید یا تعامل با بخشی از کار که منتج به قابلیت‌های جدید در یک کسب و کار می‌شود؟ آیا ارائه و تصویرسازی از نتایج کاوش در داده‌ها برای شما جذاب است؟

همچنین باید به این موضوع فکر کنید که کار کردن با چه نوع داده‌ها را بیشتر دوست دارید؟ بعضی از افراد به کار کردن در یک حوزه خاص بیشتر از حوزه‌های دیگر علاقه دارند. مثلا بیشتر دوست دارید در حوزه پزشکی و داده‌های مربوط به آن کار کنید یا با داده‌های مالی سر و کار داشته باشید؟

خلاصه اینکه علم داده، مهارت پیشرفته‌ایست که قبل از ورود باید هدف خود را از یادگیری آن مشخص کنیم تا بتوانیم به یک حرفه‌ای در این حوزه تبدیل شویم. حال وقت آن است که درباره مسیر یادگیری علم داده و مهارت‌های مورد نیاز برای کار در این حوزه را با هم مرور کنیم. 

مسیر یادگیری علم داده از یادگیری زبان پایگاه داده SQL و آموزش برنامه‌نویسی با زبان پایتون شروع می‌شود و با آموزش تجزیه و تحلیل داده با پایتون، یادگیری ماشین لرنینگ و عمیق شدن در آن ادامه پیدا می‌کند. نکته مهم این که با توجه به این که حوزه‌های مربوط به تکنولوژی هر روز در حال رشد هستند، باید در نظر داشته باشید که تمرین و یادگیری را نباید متوقف کنید. 

علاوه بر این برای تبدیل شدن به این متخصص و حرفه‌ای در زمینه علم داده چند مهارت کلیدی باید داشته باشید. برنامه‌نویسی، SQL، ریاضیات، آمار، داده کاوی، تجسم و تصویرسازی داده‌ها و یادگیری ماشین از جمله این مهارت‌ها هستند. 

درامد و بازار کار دیتا ساینس در ایران 

وقتی درباره وضعیت بازار کار دانشمند داده در ایران جستجو می‌کنیم، به وضوح می‌بینیم که مرز بین شغل‌های داده‌محور مختلف به قدری باریک است که گاهی حتی این مرز دیده نمی‌شود. با سرچ عنوان شغلی «دانشمند داده» یا «دیتا ساینس» در پلتفرم‌های کاریابی داخلی، تعداد کمی از عناوین شغلی را دقیقا با همین عبارت‌ها می‌بینیم؛ البته این به این دلیل نیست که نیاز برای دانشمندان داده در ایران وجود ندارد، بلکه دقیقا به این علت است که معمولا با عناوین دیگری مثل مهندس داده، تحلیلگر داده و امثالهم ترکیب می‌شود. 

با این حال با کمی بررسی بیشتر متوجه می‌شویم که شرکت‌های بزرگ داده محور که با حجم زیادی از داده‌ها سر و کار دارند، به دنبال دانشمندان داده هم هستند. به دلیل این که دانشمندان داده باید به دانشی مرکب از آمار، ریاضیات و علوم کامپیوتر مسلط باشند و از توانایی‌های تحلیلی خوبی هم برخوردار باشند، شرکت‌ها حاضرند پرداختی‌های خوبی هم به شاغلان در حوزه داده داشته باشند. 

پس اگر به دنبال یک درآمد ماهیانه نسبتا قابل توجه هستید و در عین حال از ریاضیات، آمار و علوم کامپیوتر لذت می‌برید، کار کردن در حوزه علم داده می‌تواند گزینه خوبی برای شما باشد. همچنین با سر زدن به بخش «همکاری با ما» می‌توانید فرصت‌های شغلی یک دانشمند داده در ویستا سامانه آسا را هم ببینید و در صورت تمایل رزومه‌تان را برای ما ارسال کنید. 

جمع‌بندی

در این مقاله سعی کردیم درباره علم داده، مسیرهای شغلی و مهارت‌های مورد نیاز آن توضیحاتی ارائه کنیم. داده‌ها در دنیای امروز و برای هر کسب وکاری حیاتی هستند و تمام تصمیم‌گیری‌ها و نتایج، با توجه به اطلاعات سنجیده می‌شوند. در ایران نیز استفاده از علم داده هر روز  اهمیت بیشتری پیدا می‌کند و سازمان‌ها نیاز و علاقه بیشتری برای استفاده از مهارت متخصصان این حوزه پیدا می‌کنند. فرصت‌های شغلی بسیار خوبی در انتظار کسانی خواهد بود که در زمینه دیتا ساینس مهارت‌های لازم را کسب کرده باشند. در صورتی که تجربه کار در این حوزه را دارید یا در سازمان خود از علم داده استفاده می‌کنید، خوشحال می‌شویم تجربه خود را با ما و خوانندگان این مقاله به اشتراک بگذارید.

۵/۵ - (۱ امتیاز)
نویسنده: مهندس نرم‌افزاری که داده‌ها را خوب می‌شناسد و سال‌هاست که در صنعت فین‌تک ایران فعالیت می‌کند.

مطالب مرتبط