داده خوب با حاکمیتِ خوب شروع میشود
نوشته: الیاس بالتاسیس، آنتوان گورویتچ و لوکاس کوارتا
هنوز خیلی از آن زمان نگذشته که این صدای صاحبنظران طنینانداز شد که در عصر نوین کلانداده همه اطلاعات یک شرکت همراه با دادههای فراوان موجود در جهان، در قالب یک موتور رشد عالی برای شرکتها در سراسر جهان، گردآوری خواهد شد. به خاطر اعتباری که این صاحبنظران داشتند، بسیاری از شرکتها به حرفشان اهمیت دادند و هوشیار شدند. امروزه، این باور پذیرفته شده که دادهها و تجزیه و تحلیل، ابزار مهمی برای مزیت رقابتی هستند.
هنوز خیلی از شرکتها دادهها را با آغوش باز میپذیرند و روی آن تمرکز دارند. مطمئناً، شرکتهای پیشرو در هر صنعت ــ از جمله خردهفروشی، ارتباطات راه دور، داروسازی، و بانکداری و بیمه ــ از روشهای تحلیل پیشرفته و قابلیتهای مدیریت دادهها با کارایی بالا برای بهبود عملکرد هزینه و افزایش درآمد استفاده کردهاند. در واقع، بسیاری با مجموعهای از برنامههای تحلیلی به موفقیتهای کوچک و اولیه دست یافتهاند، اما گسترش و بسط این موفقیتها، به توسعه مجموعه کاملی از قابلیتهای داده در داخل شرکت احتیاج دارد. در سالهای آینده، شرکتهایی که بهترین قابلیتهای داده و بهترین کیفیت داده را دارند (بر بازار) سلطه خواهند داشت. بوستون کانسولینگ گروپ بر اساس کار مشتریهای خود، چارچوب ساختاری را ایجاد کرده است که قابلیتهای لازم را برای تحول مدل عملیاتی یک شرکت و موفقیت در مسابقه امروز بر سر داده تعریف میکند (شکل 1 را ببینید).
در قلب این موضوع، حاکمیت دادهها از چهار بلوک ساختمانی تشکیل میشود: ساختارهای داده، خط مشیهای داده، ابزارهای داده، و شرکتکنندگان سازمان و مدل عملیاتی هدف (TOM).
حاکمیت دادهها بر کل سازمان تأثیر میگذارد
حاکمیت دادهها ممکن است شامل عناصر سازمانی و تکنولوژیکی باشد که بهبود پایدار کیفیت دادههای یک شرکت را تسهیل میکند. تعریف نسبتاً گسترده ما از کیفیت دادهها شامل کامل بودن داده، صحت، انسجام، در دسترس بودن و کیفیتهایی است که برای یک کسبوکار خاص مهم هستند و در نهایت توسط آن شرکت تعیین میشوند.
دادههای خوب مهم هستند ــ بهخصوص برای رعایت قانون و تعالی عملیاتی. بعضی از صنایع، مانند بانکداری و داروسازی، مشمول مقرراتی هستند که آنها را ملزم میکند دادههای خود را به روشی پایدار بهبود بخشند. اما علاوه بر پایبندی به تعهدات قانونی، دادههای پاک به سازمان اجازه میدهد تا کارایی را بهینه کند، سفرهای مشتری را مدرن و کارآمد کند، نیازها و خواستههای مشتری را از طریق تجزیه و تحلیل پیشرفته و هوش مصنوعی اثرگذار پیشبینی کند و حتی کسبوکارهای جدیدی ایجاد کند. دادههای خوب فرصتهای بیشماری را برای خلق ارزش ارائه میدهند.
یک بانک بزرگ اروپایی بعد از بهبود فرایند افشای دادهها و کاهش ذخیرههای احتیاطی سرمایه قانونی، چند میلیارد دلار از سرمایهاش را آزاد کرد. یک شرکت بزرگ کالاهای مصرفی، بعد از اجرای یک رویکرد فوق شخصیسازی شده، که دادههای مشتری را با ادغام با دادههای خارجی در مدلهای هوش مصنوعی افزایش میدهد، سالانه صدها میلیون دلار درآمد تولید میکند.
یک تولیدکننده جهانی فولاد با سادهسازی دادههای زنجیره تأمین، یکپارچهسازی جریانهای دادههای داخلی و خارجی و استفاده از دادهها برای بهینهسازی عملیات خود، صدها میلیون دلار از هزینههایش را کاهش داد. حاکمیت دادههایی که بر کیفیت داده متمرکز باشد، اگر بهدرستی اجرا شود، میتواند به شرکتها کمک کند تا از مزایای بیشمار و فوقالعادهای بهرهمند شوند.
شکایات زیادی درباره کیفیت، انسجام و درستی دادههای شرکت و دشواری دسترسی به آن میشنویم. در عین حال، خیلیها، دادههای دردسرساز را به خاطر ناتوانی خود در استفاده از تجزیه و تحلیل پیشرفته و هوش مصنوعی سرزنش میکنند. بوستون کانسولینگ گروپ در مطالعه معیاریابی اخیر که بیش از 600 شرکت را مورد بررسی قرار داد، متوجه شد بیش از 60 درصد از این شرکتها قابلیتهای حاکمیت دادههای خود را در سطوح مختلف توسعهنیافته ارزیابی کردهاند.
موانع سازمانی که باید از پیش پا برداشته شوند
چه چیزی شرکتها را از توسعه حاکمیت دادهها که میتواند کیفیت دادههای آنها را بهبود بخشد، باز میدارد؟ سه دلیل اصلی وجود دارد:
- انتظاراتی که دائماً بالاتر میروند: وقتی شرکتها تأثیر مثبت برنامههای تحلیل و هوش مصنوعی را مشاهده میکنند، تمایلشان برای بالاتر بردن کیفیت دادهها و افزایش سرعت تحویل بیشتر و بیشتر میشود.
- منابع و قابلیتهایی که دائماً کمتر میشوند: بیشتر شرکتها تجربه نسبتاً کمی در استفاده از حاکمیت دادهها در سراسر شرکت دارند. به این ترتیب، چه در داخل و چه در خارج از سازمان، تعداد مدیران اجرایی دارای تجربه و تخصص لازم برای هدایت عملیات حاکمیت دادهها کم است.
- عدم درک مشترک از «مالکیت» دادهها. عدم تشخیص اینکه دادهها یک دارایی مهم کسبوکارند، میتواند بزرگترین مشکل همه باشد. بسیاری از شرکتها هنوز بر این باورند که هر چیزی حاوی واژه «داده» باشد، منحصراً متعلق به فناوری اطلاعات است. به این ترتیب، یک رویکرد مبتنی بر فناوری اطلاعات را برای حاکمیت دادهها اتخاذ میکنند که اصل ماجرا را رها میکند و باعث میشود ارتباطشان با ارزش بالقوهای که میتواند برای کسبوکار تولید کند، قطع شود.
عدم اجرای حاکمیت دادهها عواقبی واقعی و بلندمدت دارد. شرکتهایی را دیدهایم که پروژههای چندساله را آغاز کردهاند، با قوانین و مقررات مبارزه میکنند، قوانین غیرضروری را برای حاکمیت دادهها وضع میکنند و میلیونها دلار را صرف ابزارهایی میکنند که تأثیر مهمی روی بهبود کیفیت داده یا خلق ارزش ندارند.
چهار بلوک ساختمانی حاکمیت دادهها
بهترین اقدامات محیط بهینهای را برای پروژههای داده موفق ایجاد میکنند (شکل 2 را ببینید).
ساختارهای دادهها: اینجا نقطه شروع است. ساختارهای داده به ایجاد فهرست دادهها و زبان مشترک درباره دادهها کمک میکند. آنها شامل توضیحاتی از دادههای شرکت هستند که در واژهنامهها، دامنهها، خانوادهها، مدلها، فرهنگ لغتها و جریانها، تعریف و طبقهبندی شدهاند. اما این کار جدیدی نیست: دهها سال است که شرکتها از چنین ابزارهایی استفاده میکنند. با این حال، اغلب آنها قدیمی و ناقصاند و برای هدف مناسب نیستند.
از جمله ساختارهای بسیار مهم، واژهنامههای داده و دامنههای داده است که به تعریف، سازماندهی و تخصیص مدیریت دادههای شرکت کمک میکند.
واژهنامه دادهها یک اقدام مهم در معناشناسی است. واژهنامه فهرستی از اصطلاحاتی است که دادههای شرکت بر اساس آن دستهبندی میشوند، بنابراین انتخاب اصطلاحات برای نحوه انجام کسبوکار بسیار مهم است و سازمان را با معنا و کاربرد آنها هماهنگ میکند. به عنوان مثال، یک بانک مهم که در زمینه بانکداری خرد فعالیت میکند، چند ماه سرمایهگذاری کرد تا از مشتریان «فردی» به مشتریان «خانوار» تغییر جهت بدهد و تصمیم بگیرد چه دادههایی مربوط به این مشتریان است.
یک خودروساز جهانی به همین تلاش برای تعریف و دستهبندی «قطعات یدکی» نیاز داشت. یک شرکت پیشرو در زمینه کالاهای لوکس با «نقاط فروش» مشکل داشت. البته بوتیکهایی که مالکیت کامل آنها در اختیار شرکت است، نقطه فروش هستند، اما غرفههای متعدد در یک فروشگاه بزرگ چطور؟ آیا هر کدام از اینها به عنوان یکی از چند نقطه فروش عمل میکنند؟ آیا باید با دادههای مشابه توصیف شوند؟ و «فروش» چگونه تعریف میشود؟ درآمد اسمی؟ درآمد اسمی منهای تخفیف؟ منهای کمیسیون؟ اینها چند نگرانی هستند که واژهنامههای داده به آنها پاسخ میدهند.
دامنههای دادهها بر روی جایی تمرکز میکنند که دادهها در آن قرار دارند و مالکیت دادههای تعریفشده در واژهنامه را مشخص میکنند. این طبقهبندی سطح بالا و تهاجمی، امکان ایجاد هر گونه شکاف یا همپوشانی را از بین میبرد. گفتن این کار خیلی آسانتر از پیادهسازی آن است. بعضی از دادههای حیاتی در موارد استفاده مختلف و با درک متفاوت از معنا و هدفشان استفاده میشوند. بنابراین به نظر میرسد به خیلی از افراد یا نهادهای شرکتی تعلق داشته باشند. مثلاً چه کسی مالک دادههای مشتری است؟ واحد فروش؟ بازاریابی؟ واحد مالی؟ وقتی دادههای حیاتی طبقهبندی شدند، مالکان داده به هر دامنه اختصاص داده میشوند و مسئولیت نهایی تصمیمگیریهای مربوط به کیفیت داده را با توجه به نیازهای خاصِ کیفیت دادههای حوزه کسبوکارشان به عهده میگیرند.
توجه کنید که بسیار مهم است مسأله موارد استفاده همپوشان و متضاد دادهها را حل کنید و همه دادهها را به دامنههای کاملاً تعریفشده، اختصاص دهید. وقتی دادهها در دامنهها پخش شده باشد، مسئولیتپذیری کمتر میشود و تصمیمات و اقدامات لازم برای کیفیت دامنه بهراحتی نادیده گرفته میشود. حوزههای دادهها نقش مفیدی در شناسایی زمینههای بهبود کیفیت داده ایفا میکنند. تطبیق دادن دامنهها ــ و زیرشاخهها و خانوادههای آنها ــ با دادههای مورد استفاده در پروژههای مختلفِ در حال انجام و آینده نزدیک، راهی ساده و بسیار مؤثر برای اولویتبندی حوزههایی است که اقدامات حاکمیت دادهها باید روی آنها متمرکز شود (شکل 3 را ببینید). بنابراین، این رویکرد تأثیر زیادی روی کارایی یک سازمان دارد.
فرهنگ لغت داده (نباید با واژهنامه دادهها اشتباه گرفته شود) روی دادههای مربوط به دادهها ـ فراداده ـ تمرکز میکند. فراداده میتواند تشریحی و مرتبط با مدلهای داده، محدودیتهای امنیتی، شاخصهای کیفیت و حاکمیت دادهها باشد. یک فرهنگ لغت داده یا منفعل است (جدا از مجموعه دادهای که توصیف میکند، نگهداری میشود) یا فعال است (در صورت تغییر ساختار مجموعه داده به طور خودکار بهروز میشود).
جریان دادهها به ذینفعان کمک میکند مسیرهایی را که دادهها در یک سازمان طی میکند، بشناسند. مکان و وضعیت دادهها را قابل مشاهدهتر میکند و ردیابی خطا تا منبع خطا را ساده میکند. جریانهای داده برای مدیریت دادههای شرکتهایی که مشمول مقررات عمومی حفاظت از دادههای اتحادیه اروپا هستند، اهمیت فزایندهای پیدا کردهاند. بعضی از حقوق مطرح شده در مقررات اتحادیه اروپا تنها به جریانهای بهروز داده تعلق میگیرند.
سیاستهای داده: وقتی شرکتی دادههای خود را سازماندهی و شفاف کرد، باید قواعد مربوط به مثلاً فرآیندها، اقدامها، نقشها و اصول تخصیص بودجه خود را تدوین کند. چند شرکت را دیدیم که رویکرد اشتباهی در این زمینه اتخاذ کردهاند و اقدامهای چندسالهای را برای توسعه سیاستهایشان در مورد همه چیز شروع کردند. این امر همواره منجر به اقدام بوروکراتیک و ناکارآمد «وزارت داده» میشود. بعد چون چنین ابتکارهایی هیچ ارزشی خلق نمیکنند، مدیریت ارشد به طور کلی آنها را متوقف میکند. موضع ما در این باره روشن است: همه شرکتها به تعاریف روشن و بدون ابهام کیفیت دادهها، دستورالعملهای اندازهگیری، و نقشها و مسئولیتهای کلیدی حاکم بر بهبود نیاز دارند. اما حداقل دو جین مجموعه معیار برای توصیف کیفیت دادهها در دسترس هستند. آنها از مواردی بسیار ابتدایی که بهآسانی با شاخصهای کلیدی کیفیت ساده اندازهگیری میشوند، مثل«کامل بودن» تا موارد بسیار پیچیدهای که فقط با اعمال قوانین کسبوکار پیچیده، مثل «درستی» قابل اندازهگیریاند، متغیر هستند. یک شرکت باید از کدام معیار و چه تعداد از آنها استفاده کند؟ سادگی را انتخاب کنید. شرکتها بر اساس نیازها و موارد استفاده دادهها، باید تعداد محدودی از معیارها را انتخاب کرده و آنها را به عنوان تعریف کیفیت دادهها در نظر بگیرند. در مرحله بعد، شرکت باید روشهای اعمال و اندازهگیری این معیارها را مشخص کند و مبنایی برای وضعیت فعلی ایجاد کند.
به این نکته باید توجه شود که معیارها در دامنههای مختلف، به یک اندازه مهم نیستند. مثلاً کیفیت آدرسهای ایمیل مشتریان احتمالاً اهمیت کمتری نسبت به کیفیت دادههای فروش دارد. با اینکه معیارها یکساناند، ممکن است اهداف شاخصهای کلیدی کیفیت که منعکسکننده سطوح مختلف کیفیت مورد نیاز برای هر نوع داده هستند، متفاوت باشند. وظیفه همه مالکان داده است که اهداف کیفی را برای دامنههای خاص خود تعریف کنند.
سیاست کیفیت دادهها باید فرآیندهای تعریف و اندازهگیری شاخصهای کلیدی کیفیت، نقشها و مسئولیتهای افرادی که در بهبود آنها مشارکت میکنند، فرآیند تخصیص بودجه برای این فعالیتها، و به طور کلی، همه عناصر سازمانی و فنی لازم برای نظارت مستمر و بهبود پایدار کیفیت دادهها را هم شرح دهند.
سیاستهای دیگر ممکن است لازم باشند یا نباشند. اگر شرکتی با دادههای مرجع خود (مرجعی برای دادههای دیگر) مشکل داشته باشد، احتمالاً به سیاست مدیریت داده اصلی (MDM)) نیاز دارد. اگر مشکل مهم و قابل توجهی نداشته باشد، نیازی به MDM ندارد. شرکتهایی که با مشکلات دسترسی به داده سروکار دارند باید یک سیاست حقوق دسترسی کاربر تدوین کنند. بهعنوان یک قاعده کلی، سیاستهای داده باید متناسب با مشکلات خاص دادههای شرکت و علل ریشهای آن باشند و آنها را حلوفصل کند. آنها ابزاری برای رسیدن به هدفاند و نقش مهمی در عملکرد روان، تثبیت و سادهسازی اقدامات مربوط به داده ایفا میکنند. فراتر از این چیزی نیست. اما عواقب فراموش کردن این موضوع میتواند اقدامات غیرضروری، اتلاف منابع و بوروکراسی بیش از حد باشد. شرکتهایی را دیدهایم که سیاستهای داده متعددی را توسعه میدهند، اما خیلی نادر است که شرکتها به بیش از چهار یا پنج سیاست برای حاکمیت مؤثر دادهها احتیاج داشته باشند.
ابزارهای داده: همانطور که سیاستهای داده نیازمند رویکرد سادهسازی هستند، رویکرد حاکمیت دادهها هم به مجموعههای بیشماری از ابزار نیاز ندارد. با این حال، لازم است دو نوع را در نظر بگیرید: سلامت اولیه داده و ابزارهای پیشرفته. میتوان با استفاده از هر نوع نرمافزار گرافیکی، فهرستی از دامنههای داده یا فرهنگ لغت داده با استفاده از صفحه گسترده یا نمایش دادن جریان داده ایجاد کرد. با این حال، اشتراکگذاری و بهروزرسانی چنین عناصری در جامعهای متشکل از صدها کاربر در چندین مکان، اگر کاملاً غیرممکن نباشد، میتواند دشوار و بسیار پیچیده باشد.
ابزارهای سلامت داده را وارد کنید. این ابزارهای نسبتاً پایه و هدفمند، به شرکتها کمک میکنند تا ساختارهای داده، واژهنامههای داده، فرهنگ لغتها و جریانهای خود را به طور کارآمد بسازند و حفظ کنند.
ابزارهای پیشرفته کارهای پیچیدهای را انجام میدهند. برخی از ابزارها، مثلاً آنهایی که بر روی یک منطقه خاص مانند MDM یا خط داده متمرکز شدهاند، یک هدف واحد را دنبال میکنند، در حالی که برخی دیگر که چندمنظورهاند، طیف کامل کارکردهای داده مثل محاسبه شاخصهای کلیدی کیفیت و مدیریت جریان کار را پوشش میدهند. اجرای ابزارهای داده نوشدارو نیست و میتواند منابعی را مصرف کند که بهتر است برای انجام دیگر کارهای مرتبط به دادهها استفاده کرد. ابزارهای داده باید با نیازهای هر شرکت تطبیق داده شوند و به اجرای سیاستهای داده آن کمک کنند.