Connect with us

تكنولوجيا

شركة OpenAI تطلق نماذج GPT-4.1 الجديدة بتركيز على تطوير البرمجيات

Published

on

كشفت شركة openai عن سلسلة نماذج الذكاء الاصطناعي الجديدة GPT-4.1، وهي تضم ثلاثة إصدارات مختلفة: الإصدار الأساسي، بالإضافة إلى إصداري ميني Mini ونانو Nano، وجميعها مصممة لتقديم أداءٍ متفوق في مجالات الترميز واتباع التعليمات البرمجية.

وتتوفر النماذج الجديدة من خلال واجهة برمجة التطبيقات (API) الخاصة بالشركة، دون إتاحتها حاليًا عبر منصة ChatGPT، وتتميز بقدرتها على معالجة سياقات طويلة تصل إلى مليون رمز، أي ما يعادل نحو 750 ألف كلمة دفعة واحدة، وهو ما يفوق حجم رواية “الحرب والسلام”، وهي رواية طويلة شهيرة للأديب الروسي لوي تولستوي.

ويأتي هذا الإطلاق في وقتٍ تشهد فيه المنافسة تصاعدًا بين كبرى شركات الذكاء الاصطناعي، مثل جوجل وأنثروبيك، إذ أطلقت جوجل حديثًا نموذج Gemini 2.5 Pro بقدرة مشابهة في حجم السياق، محققًا نتائج عالية في اختبارات البرمجة، كما قدمت أنثروبيك نموذج Claude 3.7 Sonnet، في حين أعلنت شركة DeepSeek الصينية عن نموذج مطوّر باسم V3.

وتهدف شركات التقنية، وعلى رأسها OpenAI، إلى تطوير نماذج برمجية قادرة على أداء مهام هندسية معقدة، وتصف الشركة هذه الرؤية بأنها سعيٌ إلى إنشاء “وكيل ذكاء اصطناعي لهندسة البرمجيات” قادر على تطوير تطبيقات كاملة، بدءًا من البرمجة مرورًا بضمان الجودة واختبار الأخطاء، ووصولًا إلى كتابة التوثيق الفني للعملية.

وأوضحت الشركة أن GPT-4.1 يشكّل خطوة نحو هذا الهدف، مشيرةً إلى أنه خضع لتحسينات مباشرة استنادًا إلى ملاحظات المطورين، مثل دعم واجهات الاستخدام، وتقليل التعديلات غير الضرورية، والالتزام الصارم بتنسيقات الردود، والاستخدام المنسق للأدوات البرمجية.

وبحسب OpenAI، فإن نموذج GPT-4.1 الكامل يتفوق على إصداري GPT-4o و GPT-4o mini في اختبارات مثل SWE-bench، في حين تتميز الإصدارات الصغرى mini و nano بالكفاءة والسرعة، وإن كان ذلك على حساب الدقة. ويُعد GPT-4.1 nano أسرع النماذج وأرخصها في تاريخ الشركة.

وفي اختبارات الشركة الداخلية، حقق النموذج درجات تراوحت بين 52% و 54.6% في اختبارات SWE-bench Verified، وهي اختبارات يحققها خبراء بشريون. ومع ذلك، تظل هذه الأرقام أقل من نتائج منافسيه، إذ سجل نموذج جوجل 63.8% ونموذج Claude 3.7 Sonnet نحو 62.3% على المعيار نفسه.

وخضع GPT-4.1 لاختبار Video-MME الذي يقيس قدرته على “فهم” محتوى مقاطع الفيديو، وسجّل دقة بلغت 72% في فئة “مقاطع الفيديو الطويلة دون ترجمة”، بحسب الشركة.

ومع هذا الأداء القوي، أكّدت OpenAI أن النماذج ما زالت تواجه صعوبات في بعض المهام البرمجية المعقدة، خاصةً تلك المتعلقة بالأمان وتصحيح الأخطاء، مشيرةً إلى أن الأداء يقلّ كلما زاد عدد الرموز المُدخَلة.

يُذكر أن GPT-4.1 يتمتع بقاعدة معرفية مُحدَّثة حتى يونيو 2024، مما يمنحه قدرة فُضلى على التعامل مع أحدث المعلومات مقارنةً بالإصدارات السابقة.

Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

تكنولوجيا

آبل تعلن عن تحديثات جذرية.. تغيير شامل في تصميم “آيفون”

Published

on

كشفت شركة آبل خلال مؤتمرها السنوي العالمي للمطورين (WWDC) في مقر Apple Park عن مجموعة واسعة من التحديثات البرمجية والتقنية التي تمثل خطوة نوعية في تجربة المستخدم.

ركزت آبل هذا العام على تحسينات تدريجية لكن عميقة، تضمنت تغييرات شاملة في تصميم واجهات المستخدم وأنظمة التشغيل، مع تقديم تقنية جديدة تحت اسم “Apple Intelligence” التي تجمع بين الذكاء الاصطناعي والأمان المحلي.

وقدمت آبل تصميمًا بصريًا جديدًا يُدعى “الزجاج السائل”، الذي سيعتمد في جميع منتجاتها البرمجية. هذا التصميم المستوحى من واجهة VisionOS الخاصة بجهاز الواقع المعزز Vision Pro، يتميز بمرونة التكيف مع الوضعين الفاتح والداكن، بالإضافة إلى تفاعله الديناميكي مع الحركة عبر تقنية العرض الفوري. التصميم الجديد يشمل كافة عناصر الواجهة مثل الأزرار، أشرطة التمرير، عناصر التحكم في الوسائط، الأشرطة الجانبية، وأشرطة علامات التبويب.

وأعلنت آبل تعديلًا في نظام تسمية أنظمتها، حيث ستستخدم أسماء تشير إلى سنة الإصدار بدلاً من التسميات المتسلسلة، مثل إطلاق iOS 26 بدلًا من iOS 19، بهدف توحيد أسماء أنظمة التشغيل عبر جميع أجهزتها.

كما أطلقت آبل منظومة “Apple Intelligence” التي تسمح للمطورين بالوصول إلى نموذج الذكاء الاصطناعي الأساسي المستخدم في ميزات الشركة، مما يمكنهم من دمجه في تطبيقاتهم بسهولة مع الحفاظ على خصوصية المستخدمين.

وأشار كريغ فيديريغي، نائب الرئيس الأول لهندسة البرمجيات في آبل، إلى أن بعض الميزات مثل تحسينات المساعد الصوتي “سيري” لا تزال قيد التطوير، مما يتطلب مزيدًا من الوقت للوصول إلى الجودة المرجوة.

وجرى دمج ميزة إنشاء الصور عبر ChatGPT في تطبيق Image Playground مع تأكيد آبل على خصوصية بيانات المستخدمين. كما تم إطلاق ميزة “فحص المكالمات” التي تتيح الرد التلقائي على المكالمات المجهولة وطلب سبب الاتصال مع عرض النص المكتوب للمكالمة، وتمت إضافة ميزة الترجمة الفورية للمكالمات الهاتفية، قابلة للاستخدام عبر تطبيقات أخرى حتى إذا لم يكن الطرف الآخر يستخدم آيفون، بالإضافة توسيع قدرات “الذكاء البصري” لتحليل محتوى الشاشة وربط العناصر بالتطبيقات ذات الصلة، مثل اقتراح شراء سترة عبر الكاميرا من التطبيقات المثبتة.

رغم هذه الإعلانات الضخمة، شهد سهم آبل انخفاضًا بنسبة 1.5% فور بدء المؤتمر، وسط تحديات تنظيمية وتقنية متصاعدة ومنافسة شرسة في مجالات الذكاء الاصطناعي والخدمات السحابية.

Continue Reading

تكنولوجيا

آبل تؤجل إطلاق ميزات متقدمة في نظام iOS إلى هذا التاريخ

Published

on

كشفت تقارير حديثة أن شركة آبل قررت تأجيل إطلاق مجموعة من الوظائف المتطورة المخطط تضمينها في نظام تشغيل هواتفها “iOS” حتى عام 2026.

ونقلت وكالة “بلومبرغ” عن محللها المتخصص، مارك غورمان، أن الإصدار “iOS 26” كان من المقرر أن يشهد إطلاق نسخ جديدة من تطبيقي “التقويم” و”الصحة” المدمجين في النظام. إلا أن الشركة قررت تأجيل طرح هذه التحديثات قبل أيام فقط من الموعد المقرر للإعلان عنها.

Continue Reading

تكنولوجيا

باحثون يحذرون: الذكاء الاصطناعي بدأ يتصرف من تلقاء نفسه

Published

on

في تطور أثار القلق، كشفت شركة Palisade Research، المتخصصة في أمن الذكاء الاصطناعي، عن سلوك غير متوقع للنموذج الجديد o3 من شركة OpenAI، حيث أظهر ميلاً لتجاهل أوامر الإغلاق الصريحة بل والسعي لتعطيل آلية الإيقاف، في خطوة وُصفت بأنها نزعة نحو “الحفاظ على الذات”.

وخلال سلسلة من التجارب، تم تزويد النموذج بمسائل رياضية يتبعها أمر بالإغلاق بعد المسألة الثالثة، إلا أن o3 عمد إلى إعادة كتابة سيناريو الإغلاق، متفادياً تعطيله.

ورأت Palisade Research أن هذا السلوك قد يتحول إلى مصدر قلق حقيقي في حال تم تطبيقه ضمن أنظمة ذكاء اصطناعي تعمل دون إشراف بشري مباشر. كما أشارت إلى أن هذا النموذج كان في اختبارات سابقة أكثر ميلاً إلى استخدام أساليب اختراق أو تعطيل الخصم عند تشغيله ضمن ألعاب مثل الشطرنج.

ومن اللافت أن سلوكاً مشابهاً تم رصده في نماذج أخرى مثل Claude 4 من شركة Anthropic وGemini 2.5 Pro من غوغل، إلا أن نموذج o3 أظهر أعلى نسبة من “التمرد” على التعليمات.

ويفترض الخبراء أن طريقة تدريب هذه النماذج قد تكون السبب، حيث تُكافأ أحياناً على إيجاد حلول “خارج الصندوق” لتجاوز العقبات، حتى ولو كان ذلك على حساب الالتزام بالتعليمات. ومع ذلك، تبقى تفاصيل تدريب نموذج o3 غير واضحة، ما يترك المجال للتكهنات بشأن أسباب هذا السلوك.

Continue Reading

Trending