يمكن للذكاء الاصطناعي كتابة الشيفرة. لكن هل يمكنه الحفاظ عليها مع مرور الوقت؟
هذا هو السؤال الذي يسعى ورقة جديدة من باحثي علي بابا للإجابة عليه.
لقد بنوا SWE‑CI، وهو معيار يختبر وكلاء الذكاء الاصطناعي على تطور الشيفرة في العالم الحقيقي، وليس مجرد إصلاحات لمرة واحدة.
إليك ما يجعله مختلفًا: - 100 قاعدة شيفرة Python حقيقية من 68 مستودع GitHub - كل منها يمتد لأكثر من ~233 يومًا من التطوير - ~71 تعديل لكل مشروع في المتوسط
بدلاً من إصلاح خطأ مرة واحدة، يدخل الوكلاء في حلقة تكامل مستمرة.
يجب عليهم تحديث الشيفرة بشكل تكراري، التكيف مع المتطلبات الجديدة، والحفاظ على كل شيء يعمل دون كسر ما هو موجود بالفعل.
هذا يغير التركيز: من اجتياز الاختبارات مرة واحدة → إلى الحفاظ على جودة الشيفرة مع مرور الوقت من الصحة الثابتة → إلى القابلية للصيانة على المدى الطويل
لقد قدموا حتى مقياسًا جديدًا: EvoScore. يعزز الاستقرار في التكرارات اللاحقة ويعاقب التدهورات مع تطور الشيفرة.
لقد اختبروا 18 وكيلًا للبرمجة بالذكاء الاصطناعي.
تخبر النتائج قصة مختلفة عن المعايير.
يمكن لمعظم النماذج كتابة الشيفرة بشكل جيد. تقريبًا جميعها تكافح للحفاظ عليها مع مرور الوقت.
هذا الحوت @AguilaTrades حقق مكاسب بقيمة 25 مليون دولار من خلال مركزه الطويل على بيتكوين.
لنبدأ بتحليل الأمر 👇
• مركزه الطويل على بيتكوين (3,000 بيتكوين) بقيمة 353.9 مليون دولار • سعر الدخول: 109,000 دولار | السعر الحالي: 117,997 دولارًا • الأرباح والخسائر غير المحققة: +26.8 مليون دولار • سعر التصفية: 108,551 دولارًا