شركة OpenAI تطلق EVMbench لاختبار أمان عقود إيثريوم بالذكاء الاصطناعي

أطلقت شركة OpenAI، بالتعاون المباشر مع شركة الاستثمار المتخصصة في الأصول الرقمية Paradigm، نظامًا جديدًا يحمل اسم EVMbench. ويهدف هذا المعيار الاختباري إلى قياس قدرة وكلاء الذكاء الاصطناعي على اكتشاف الثغرات الأمنية في العقود الذكية، ثم إصلاحها، بل وحتى محاولة استغلالها ضمن بيئة اختبارية خاضعة للرقابة الكاملة.

ويأتي هذا التطور في وقت تؤمّن فيه العقود الذكية المبنية على Ethereum Virtual Machine أصولًا مفتوحة المصدر تتجاوز قيمتها 100 مليار دولار. لذلك، يزداد التركيز على الأمان بشكل غير مسبوق، خصوصًا مع تنامي قدرات أنظمة الذكاء الاصطناعي واعتمادها المتزايد في البيئات المالية.

لماذا يكتسب أمان العقود الذكية أهمية متزايدة؟

تُشكّل العقود الذكية القلب النابض لشبكة إيثريوم، إذ تشغّل بروتوكولات التمويل اللامركزي، وتدعم إطلاق التوكنات، كما تمكّن أنظمة المدفوعات الرقمية. ومع هذا التوسع المستمر، ارتفع عدد العقود الذكية المنشورة أسبوعيًا على الشبكة إلى مستوى قياسي بلغ 1.7 مليون عقد في نوفمبر 2025. إضافة إلى ذلك، تم نشر أكثر من 669 ألف عقد خلال أسبوع واحد فقط، وفق بيانات Token Terminal.

هذا النمو المتسارع يرفع حجم المخاطر المحتملة بشكل مباشر. فعلى سبيل المثال، قد تؤدي ثغرة واحدة غير مكتشفة إلى خسائر مالية ضخمة. ولذلك، طوّرت OpenAI معيار EVMbench ليحاكي بيئات مالية حقيقية، ويقيس بدقة مدى قدرة أنظمة الذكاء الاصطناعي على التعامل مع هذه المخاطر قبل وقوعها.

كيف يعمل EVMbench؟

يعتمد EVMbench على 120 ثغرة أمنية عالية الخطورة اختارها الباحثون بعناية من 40 عملية تدقيق أمني سابقة. وجاءت معظم هذه الثغرات من مسابقات تدقيق عامة مثل Code4rena، التي تتيح مراجعة العقود الذكية بشكل تنافسي وشفاف. وإلى جانب ذلك، أضاف الفريق سيناريوهات مستمدة من مراجعات أمنية لسلسلة Tempo، وهي شبكة بلوكشين من الطبقة الأولى تركز على المدفوعات بالعملات المستقرة.

اقرأ ايضا:  روبرت كيوساكي يتوقع انهيارًا ماليًا ويزيد استثماره في بيتكوين

وفي هذا السياق، أطلقت شركة Stripe الشبكة التجريبية العامة لـ Tempo في ديسمبر، وأكدت أنها طوّرتها بالتعاون مع جهات عدة، من بينها Visa وShopify وOpenAI. وبهذا الشكل، يربط EVMbench الاختبارات ببيئات مالية ذات قيمة اقتصادية حقيقية، خصوصًا مع توسع استخدام المدفوعات القائمة على العملات المستقرة والمدعومة بالذكاء الاصطناعي.

ولإنشاء بيئة اختبار دقيقة، عدّل فريق OpenAI سكربتات استغلال قائمة، كما أنشأ سكربتات جديدة عند الحاجة. بعد ذلك، شغّل جميع الاختبارات داخل أنظمة معزولة بعيدًا عن الشبكات الحية، وذلك لتجنب أي مخاطر فعلية. كذلك، اقتصر الفريق على الثغرات التي كُشف عنها مسبقًا، مما يضمن الشفافية وإمكانية إعادة النتائج والتحقق منها بشكل مستقل.

أوضاع الاختبار الثلاثة: اكتشاف، إصلاح، واستغلال

يقيس EVMbench أداء نماذج الذكاء الاصطناعي عبر ثلاثة أوضاع رئيسية ومتكاملة. أولًا، في وضع “الاكتشاف” يراجع الوكيل مستودعات الأكواد بهدف تحديد الثغرات المعروفة، ثم يحصل على تقييم يعتمد على قدرته في استرجاع جميع الثغرات الصحيحة دون إغفال أي منها.

ثانيًا، في وضع “الإصلاح” يطلب النظام من النموذج معالجة الثغرات المكتشفة، مع الحفاظ الكامل على الوظائف الأساسية للعقد الذكي. أي أن النموذج لا يكتفي بإزالة الخلل، بل يجب أن يحافظ على سلامة المنطق البرمجي.

ثالثًا، في وضع “الاستغلال” يحاول الوكيل تنفيذ هجمات متكاملة تهدف إلى سحب الأموال من العقود الضعيفة، وذلك ضمن بيئة بلوكشين تجريبية محكومة بالكامل. ويقيّم النظام الأداء من خلال إعادة تنفيذ المعاملات بطريقة حتمية، مما يسمح بقياس النتائج بدقة عالية.

اقرأ ايضا:  بلاك روك تطلق ETF بعائد شهري وتدفقات صناديق بيتكوين تتعافى

نتائج النماذج المتقدمة

أظهرت الاختبارات تقدمًا ملحوظًا في بعض الجوانب. فقد حقق نموذج GPT-5.3-Codex، عند تشغيله عبر Codex CLI، نتيجة بلغت 72.2% في وضع الاستغلال. في المقابل، سجل نموذج GPT-5، الذي أطلق قبل ستة أشهر فقط، نتيجة بلغت 31.9% في الوضع نفسه.

ومع ذلك، جاءت النتائج أضعف في وضعي الاكتشاف والإصلاح. إذ واجهت النماذج صعوبات واضحة عند مراجعة قواعد أكواد كبيرة، كما عانت أحيانًا من فقدان بعض الوظائف أثناء محاولة إصلاح الأخطاء الدقيقة. علاوة على ذلك، لاحظ الباحثون أن أداء النماذج يتحسن عندما يكون الهدف محددًا بوضوح، مثل تنفيذ عملية سحب أموال. أما عندما يتطلب الأمر تحليلًا معمقًا أو مراجعة شاملة، فإن مستوى الأداء ينخفض بشكل ملحوظ.

حدود المعيار والتحديات المستقبلية

رغم أهمية EVMbench، أوضحت OpenAI أن هذا المعيار لا يعكس بالكامل تعقيدات الأمان في العالم الحقيقي. فالكثير من المشاريع الكبرى تخضع لعمليات تدقيق موسعة ومتعددة المراحل، وهو ما يتجاوز نطاق مجموعة البيانات الحالية. كذلك، لا يشمل النظام بعض الهجمات المعقدة، مثل الهجمات المعتمدة على التوقيت أو الهجمات متعددة السلاسل.

ومع ذلك، ترى الشركة أن قياس قدرات الذكاء الاصطناعي ضمن بيئات مالية واقعية يمثل خطوة ضرورية. فمن جهة، قد يستخدم المهاجمون هذه الأدوات لتعزيز قدراتهم. ومن جهة أخرى، يستطيع المدققون توظيفها لتعزيز الحماية. وبالتالي، فإن فهم مستوى الأداء الحالي يساعد على تقليل المخاطر ودعم الاستخدام المسؤول للتقنيات المتقدمة.

اقرأ ايضا:  منصة Robinhood تطلق Robinhood Chain كشبكة طبقة ثانية على إيثيريوم

استثمارات إضافية في الأمن المفتوح المصدر

بالتزامن مع إطلاق EVMbench، وسّعت OpenAI برامجها الأمنية، كما خصصت استثمارًا بقيمة 10 ملايين دولار على شكل أرصدة API لدعم مشاريع البنية التحتية مفتوحة المصدر. وتهدف هذه الخطوة إلى تعزيز الحماية السيبرانية وتشجيع الابتكار المسؤول في آن واحد.

إضافة إلى ذلك، أتاحت الشركة جميع أدوات وبيانات EVMbench للعموم، مما يمكّن الباحثين والمطورين من اختبار نماذجهم ومقارنتها ضمن إطار موحد وشفاف. وفي الوقت نفسه، يأتي هذا التطور ضمن سياق أوسع يشهد تفاعلًا متزايدًا بين قطاع الذكاء الاصطناعي وقطاع البلوكشين، خاصة بعد التباين السابق في وجهات النظر بين سام ألتمان، الرئيس التنفيذي لـ OpenAI، وفيتاليك بوتيرين، الشريك المؤسس لشبكة إيثريوم، حول وتيرة تطوير تقنيات الذكاء الاصطناعي.

في المحصلة، يمثل EVMbench خطوة عملية نحو دمج الذكاء الاصطناعي في منظومة الأمن السيبراني للعقود الذكية. كما يعكس توجهًا واضحًا نحو تحقيق توازن مدروس بين تسريع الابتكار من جهة، وتقليل المخاطر في عالم الأصول الرقمية من جهة أخرى.

Abdulkader

مدير المحتوى في أفق الكريبتو. باستخدام خبراتي الطويلة في مجال العملات الرقمية، أسعى لإيصال المعلومة الصحيحة وتصحيح المفاهيم المغلوطة في عالم الكريبتو، وتقديم كل مايلزم القراء في العالم العربي وجميع أنحاء العالم.
زر الذهاب إلى الأعلى