DataOps

از ویکی‌پدیا، دانشنامهٔ آزاد

DataOps مجموعه ای از روشها، فرآیندها و تکنولوژی‌هایی است که دیدگاهی یکپارچه و فرآیندگرا در ارتباط با داده‌ها را با خودکارسازی روش‌های سریع مهندسی نرم‌افزار برای توسعه و بهبود کیفیت، سرعت و همکاری و ترویج فرهنگ توسعه مداوم در زمینه تحلیل داده‌ها ترکیب میکند.[۱] DataOps که بصورت مجموعه ای از بهترین شیوه‌ها شروع بکار کرد، اکنون به یک رویکرد جدید و مستقل برای  تحلیل داده‌ها تبدیل شده است.[۲] DataOpsبرای کل چرخه داده[۳] از آماده‌سازی داده تا گزارش‌دادن اعمال می‌شود و ماهیت به‌هم‌پیوسته تیم  تحلیل داده‌ها و عملیات فناوری اطلاعات را نیز تشخیص می‌دهد.[۴]

DataOps اصول Agile را برای کوتاه‌تر کردن چرخه زمانی توسعه تجزیه و تحلیل در راستای اهداف تجاری ترکیب می‌کند.[۳]

DevOps با استفاده از منابع IT بر پایه تقاضا و خودکارسازی آزمون‌ها و گسترش نرم‌افزارها بر تحویل مداوم و یکپارچه تمرکز دارد. این ادغام توسعه نرم‌افزار و عملیات‌های IT، سرعت، کیفیت، قابلیت پیش‌بینی و مقیاس مهندسی نرم‌افزار و گسترش و استقرار را بهبود بخشیده است. DataOps با استفاده از روش‌های DevOps، به دنبال ایجاد همین پیشرفت‌ها در تحلیل داده‌ها است.[۴]

DataOps از کنترل آماری فرایندها (SPC) برای نظارت و کنترل بر خط لوله تحلیل داده‌ها استفاده می‌کند. باوجود SPC داده هایی که از طریق یک سیستم عملیاتی جریان میابند، دائماً تحت نظارت هستند و فعال بودن آن‌ها تأیید می‌شود. اگر ناهنجاری‌ای رخ دهد، تیم تحلیل داده توسط هشدار خودکاری مطلع می‌شوند.[۵]

DataOps به یک فناوری، معماری، ابزار، زبان و یا چهارچوب خاص وابسته نیست. ابزارهایی که از DataOps پشتیبانی می‌کنند، همکاری، هماهنگی، کیفیت، امنیت، دسترسی و آسانی استفاده را بهبود بهبود می‌بخشند و ارتقاء می‌دهند.[۶]

تاریخچه[ویرایش]

DataOps اولین بار توسط Lenny Liebman، ویراستار کمکی در مجله اینفورمیشن‌ویک، در یک پست وبلاگی در IBM Big Data & Analytics Hub با عنوان " ۳ دلیل برای اینکه چرا DataOps برای موفقیت کلان‌داده ضروری است" در ۱۹ ژوئن ۲۰۱۴ معرفی شد.[۷] اصطلاح DataOps بعدها توسط Andy Palmer از Tamr and Steph رایج شد.[۸][۴] DataOps کوتاه شده و نام خودمانی "Data Operations" است.[۳] سال ۲۰۱۷ با توسعه قابل توجه اکوسیستم، پوشش تحلیل‌گران، افزایش جستجوی کلمات کلیدی، نظرسنجی‌ها، انتشارات و پروژه‌های منبع‌باز، سال مهمی برای DataOps بود.[۹] گارتنر DataOps را در چرخه محبوبیت برای مدیریت داده در سال ۲۰۱۸ نام برد.[۱۰]

اهداف و فلسفه[ویرایش]

Dataops

پیش‌بینی می‌شود که حجم داده‌ها تا سال ۲۰۲۵ با نرخ ۳۲ درصد CAGR به ۱۸۰ زتابایت افزایش یابد( منبع: IDC).[۶] DataOps به‌دنبال ارائه ابزارها، فرآیندها و ساختارهای سازمانی است تا از عهده این افزایش قابل‌توجه داده‌ها بربیاید.[۶] خودکارسازی، نیازهای روزانه مدیریت پایگاه‌ داده‌های یکپارچه بزرگ را ساده می‌کند و تیم داده را آزاد می‌کند تا تجزیه و تحلیل‌های جدید را به روشی کارآمدتر و مؤثرتر توسعه دهند.[۱۱][۴] DataOps به دنبال افزایش سرعت، قابلیت اطمینان و کیفیت  تحلیل داده‌ها است.[۱۲] این بر ارتباط، همکاری، ادغام، خودکارسازی، اندازه‌گیری و همکاری بین دانشمندان داده، تحلیل‌گران داده، مهندسین داده/ETL(extract, transform, loadفناوری اطلاعات(IT) و تضمین کیفیت/نظارت تأکید دارد.

اجرا[ویرایش]

Toph Whitmore در Blue Hill Research این اصول رهبری DataOps را برای بخش فناوری اطلاعات ارائه می‌دهد:[۲]

  • "اندازه گیری پیشرفت و عملکرد را در هر مرحله از گردش داده تصدیق کنید. در صورت امکان، زمان‌های چرخه گردش داده‌ها را در معیار قرار دهید.
  • با انجام "eyeball test" اعتبارسنجی کنید: حلقه‌های بازخورد انسانی مبتنی بر بهبود مستمر را شامل شود. مصرف‌کنندگان باید بتوانند به داده‌ها اعتماد کنند و این فقط با اعتبارسنجی افزایشی حاصی می‌شود.
  • تا جایی که ممکن است مراحل گردش داده از جمله هوش تجاری، علم داده و تحلیل داده را خودکار کنید.
  • با استفاده از معیار اطلاعات عملکرد، تنگناها را شناسایی کرده و سپس آن‌ها را بهینه کنید. این ممکن است نیاز به سرمایه‌گذاری در لوازم سخت‌افزار یا خودکارسازی یک مرحله علوم‌داده که قبلاً توسط انسان در این فرآیند ارائه می‌شد داشته باشد.
  • فرآیندی برای رشد و توسعه‌پذیری طراحی کنید. مدل گردش داده باید طوری طراحی شود که حجم و تنوع داده‌ها را در خود جای دهد. اطمینان حاصی کنید که فناوری‌های فعال قیمت مقرون به صرفه‌ای دارند تا با رشد داده‌های آن سازمان تناسب داشته باشند."

رویدادها[ویرایش]

منایع[ویرایش]

  1. Ereth, Julian (2018). "DataOps-Towards a Definition" (PDF). Proceedings of LWDA 2018: 109.
  2. ۲٫۰ ۲٫۱ "DataOps – It's a Secret". www.datasciencecentral.com (به انگلیسی). Retrieved 2017-04-05.
  3. ۳٫۰ ۳٫۱ ۳٫۲ "What is DataOps (data operations)? - Definition from WhatIs.com". SearchDataManagement (به انگلیسی). Retrieved 2017-04-05.
  4. ۴٫۰ ۴٫۱ ۴٫۲ ۴٫۳ "From DevOps to DataOps, By Andy Palmer - Tamr Inc". Tamr Inc. (به انگلیسی). 2015-05-07. Archived from the original on 12 July 2018. Retrieved 2017-03-21.
  5. DataKitchen (2017-03-07). "Lean Manufacturing Secrets that You Can Apply to Data Analytics". Medium. Retrieved 2017-08-24.
  6. ۶٫۰ ۶٫۱ ۶٫۲ "What is DataOps? | Nexla: Scalable Data Operations Platform for the Machine Learning Age". www.nexla.com (به انگلیسی). Retrieved 2017-09-07.
  7. "3 reasons why DataOps is essential for big data success". IBM Big Data & Analytics Hub (به انگلیسی). Retrieved 2018-08-10.
  8. Mango Solutions: #DataOps - it's a thing (honest) (به انگلیسی), retrieved 2021-06-28
  9. DataKitchen (2017-12-19). "2017: The Year of DataOps". data-ops. Retrieved 2018-01-24.
  10. "Gartner Hype Cycle for Data Management Positions Three Technologies in the Innovation Trigger Phase in 2018". Gartner (به انگلیسی). Retrieved 2019-07-19.
  11. "5 trends driving Big Data in 2017". CIO Dive (به انگلیسی). Retrieved 2017-09-07.
  12. "Unravel Data Advances Application Performance Management for Big Data". Database Trends and Applications (به انگلیسی). 2017-03-10. Retrieved 2017-09-07.
  13. "DataOpticon - YouTube". www.youtube.com. Retrieved 2021-06-28.
  14. "DataOps Summit". www.dataopssummit-sf.com. Archived from the original on 2 July 2021. Retrieved 2021-06-28.
  15. Intelligence, Corinium Global. "DataOps Champions Online 2021 | Corinium". dco-dataops.coriniumintelligence.com (به انگلیسی). Retrieved 2021-06-28.