"لدينا بيانات" — أكبر كذبة في مشاريع الذكاء الاصطناعي

"لدينا بيانات". هذه الجملة أسمعها في أول اجتماع في كل مشروع ذكاء اصطناعي تقريباً. عادةً ما يقولها شخص من الإدارة العليا أو مدير تكنولوجيا المعلومات. يقولها بثقة. وفي كل مرة تقريباً يتبين أنها غير صحيحة.

ليس لأنه يكذب. بل لأن "لدينا بيانات" في فهم المؤسسة تعني شيئاً مختلفاً تماماً عن "لدينا بيانات جاهزة للاستخدام من قبل الذكاء الاصطناعي".

أربعة أنظمة، صفر اتساق

السيناريو النموذجي الذي أراه في الشركات المتوسطة والكبيرة يبدو هكذا: بيانات العملاء في نظام إدارة علاقات العملاء (CRM)، والبيانات التشغيلية في نظام تخطيط الموارد (ERP)، والبيانات المالية في نظام منفصل، والتقارير تُنشأ في Excel بناءً على تصديرات من هذه المصادر الثلاثة. لم يجلس أحد قط ليوفق بين هذه البيانات. كل نظام له منطقه الخاص، وصيغه الخاصة، وتعريفاته الخاصة للحقول.

عندما تطلب جمع هذه البيانات في مكان واحد، يتبين أن:

نفس العميل لديه ثلاثة معرفات مختلفة في ثلاثة أنظمة.
بيانات العناوين بصيغ مختلفة ودرجات مختلفة من التحديث.
بعض الحقول مملوءة وبعضها لا — ولا أحد يعرف السبب.
لا يوجد توثيق لبنية البيانات، أو يوجد من عام 2019 ولا يتطابق مع الوضع الفعلي.

هذا ليس استثناءً. هذا هو الوضع الطبيعي.

الحقيقة تظهر عندما يجلس الإنسان إلى البيانات

اللحظة التي تنهار فيها وهم "لدينا بيانات" هي دائماً نفسها: عندما يجلس شخص ما — إنسان لا آلة — ويحاول تنفيذ مهمة محددة على هذه البيانات. ليس تقريراً. وليس لوحة معلومات. مهمة تجارية محددة كان من المفترض أن يؤتمتها الذكاء الاصطناعي.

وعندها تبدأ سلسلة الأسئلة: "من أين آخذ هذه القيمة؟"، "لماذا هذا الحقل فارغ؟"، "هل هذا حالي أم تاريخي؟"، "من هو مالك هذه البيانات؟". لا أحد يعرف إجابات معظم هذه الأسئلة — لأن أحداً لم يطرحها من قبل. البيانات كانت موجودة، والأنظمة كانت تعمل، والناس كانوا يتدبرون أمرهم بحلول مؤقتة تلو الأخرى.

الذكاء الاصطناعي لا يعمل بالحلول المؤقتة. الذكاء الاصطناعي يحتاج إلى بيانات متسقة وكاملة بهيكل واضح. وهنا تبدأ المشكلة.

"لدينا بيانات" مقابل "البيانات جاهزة"

هاتان جملتان مختلفتان اختلافاً جوهرياً. "لدينا بيانات" تعني: في مكان ما في المؤسسة توجد سجلات رقمية تتعلق بنشاطنا. "البيانات جاهزة" تعني: هذه السجلات متسقة وكاملة وموثقة ومتاحة في مكان واحد وصالحة للاستخدام لغرض محدد.

بين الأولى والثانية هوة سحيقة. وهذه الهوة مكلفة. رأيت مشاريع ذهب فيها 70% من ميزانية "تطبيق الذكاء الاصطناعي" لترتيب البيانات. ليس للنموذج، وليس للتكامل، وليس لتجربة المستخدم — بل لمجرد أن يكون هناك ما يمكن العمل عليه.

هذا ليس سيناريو سيئاً. هذا سيناريو صادق. السيناريو السيئ هو ذلك الذي لا يتحقق فيه أحد من البيانات، ويبني إثبات المفهوم على بيانات تجريبية، ثم يتفاجأ بأن لا شيء يعمل في الإنتاج.

لماذا تكذب الشركات على نفسها

لأن الحقيقة غير مريحة. أن تقول للإدارة "ليست لدينا بيانات جاهزة للذكاء الاصطناعي" يعني أن سنوات الاستثمار في أنظمة تكنولوجيا المعلومات لم توفر الأساس الذي نحتاجه. هذه محادثة صعبة. من الأسهل بكثير أن تقول "لدينا بيانات" وتنتقل إلى الشريحة التالية مع جدول التنفيذ.

لكن هذه السهولة تنتهي عند أول محاولة لاستخدام هذه البيانات عملياً. وعندها إما يتوقف المشروع (وهو مكلف لكنه صادق)، أو — وهو الأسوأ — يستمر بالقوة، منتجاً نتائج تبدو جيدة لكنها لا تعكس الواقع.

ماذا تفعل بدلاً من ذلك

قبل أن تبدأ أي مشروع ذكاء اصطناعي، قم بإجراء تدقيق جاهزية البيانات. ليس تدقيق تكنولوجيا المعلومات. وليس مراجعة الأنظمة. تدقيق يجيب على أسئلة بسيطة:

أين توجد البيانات اللازمة لهذه المهمة المحددة؟ ليس "ما هي البيانات التي لدينا" — لأن هذا السؤال لا يقود إلى أي مكان. السؤال هو: ما هي البيانات التي نحتاجها لهذا الاستخدام المحدد الواحد وأين توجد.
هل هذه البيانات متسقة بين الأنظمة؟ هل العميل X في نظام CRM هو نفس العميل X في نظام ERP؟ هل القيم تتطابق؟ هل الصيغ متوافقة؟
هل يوجد توثيق؟ ليس "توثيق عام للنظام"، بل وصف: ماذا يعني كل حقل، من يملؤه، كم مرة يُحدَّث، ما هي القيم المسموح بها.
من هو مالك البيانات؟ من المسؤول عن جودتها؟ من يقرر التغييرات؟ إذا كانت الإجابة "لا أحد" — فهذا أول شيء يجب إصلاحه.
هل يستطيع الإنسان تنفيذ المهمة على هذه البيانات؟ هذا الاختبار الذي كتبت عنه في المقال السابق. إذا لم يستطع الخبير، فالذكاء الاصطناعي لن يصنع معجزة.

النهج الصادق أرخص

أعلم أن هذا ليس ما تريد الإدارة سماعه في انطلاقة مشروع الذكاء الاصطناعي. لكن التقييم الصادق لحالة البيانات في البداية أرخص بمراحل من اكتشاف الحقيقة في منتصف المشروع. المشاريع التي أقضي فيها مع العميل الشهر الأول في تشخيص دقيق للبيانات تنتهي بنجاح أكثر بكثير من تلك التي نبني فيها النموذج فوراً "لأن البيانات لدينا".

صناعة الذكاء الاصطناعي تعشق قصص النجاح. لا أحد يتحدث عن المشاريع التي ماتت لأن البيانات تبين أنها غير صالحة. وهذه المشاريع هي الأغلبية الساحقة.

في المرة القادمة التي يقول فيها شخص ما في اجتماع "لدينا بيانات" — اسأل: "أرني. على ماذا بالتحديد سيعمل الذكاء الاصطناعي؟ من أين سنحصل على هذه البيانات؟ من المسؤول عنها؟". إذا لم تأتِ الإجابات بسرعة وبشكل محدد — فهذه إشارة إلى أنه يجب البدء من الأساسيات، لا من النموذج.

إذا أردت تقييماً صادقاً لما إذا كانت بيانات مؤسستك جاهزة لمشروع ذكاء اصطناعي، أدعوك للتواصل — ليشيك غيزا.

"لدينا بيانات" — أكبر كذبة في مشاريع الذكاء الاصطناعي

أربعة أنظمة، صفر اتساق

الحقيقة تظهر عندما يجلس الإنسان إلى البيانات

"لدينا بيانات" مقابل "البيانات جاهزة"

لماذا تكذب الشركات على نفسها

ماذا تفعل بدلاً من ذلك

النهج الصادق أرخص

مهتم بالاستشارات في الذكاء الاصطناعي؟

مقالات ذات صلة

أربعة أنظمة، صفر اتساق

الحقيقة تظهر عندما يجلس الإنسان إلى البيانات

"لدينا بيانات" مقابل "البيانات جاهزة"

لماذا تكذب الشركات على نفسها

ماذا تفعل بدلاً من ذلك

النهج الصادق أرخص

مهتم بالاستشارات في الذكاء الاصطناعي؟

مقالات ذات صلة

إذا لم يستطع الإنسان فعل ذلك ببياناتك، فالذكاء الاصطناعي لن يستطيع أيضاً

لا تحتاج المزيد من أدوات الذكاء الاصطناعي — تحتاج شخصاً يقول "لا"

مشروعك التجريبي للذكاء الاصطناعي "نجح" — ولهذا لم يخرج منه شيء