أداء فائق السرعة.. جوجل تكشف عن الجيل الجديد من «Gemini 2.0»

تعزز جوجل قدرات ميزتها الذكية للبحث AI Overview عبر إضافة النموذج الجديد داخل محرك جوجل للبحث، بحيث يمكنه إدراك استفسارات المستخدمين من حيث الأسئلة، والقدرة على إجابتها، حتى وإن كانت أسئلة معقدة، تحتاج لعدة خطوات لإجاباتها، إلى جانب تزويده بإمكانية حل المعادلات الحسابية المتقدمة، وكتابة الأكواد.

وسيبدأ وصول تلك القدرات إلى AI Overview داخل جوجل سيرش خلال الأسبوع الجاري، مع إتاحة أوسع عالمياً بحلول 2025.

◄ أداء فائق السرعة

وفي السياق، كشفت جوجل عن الجيل الجديد من نماذجها الذكية Gemini 2.0، بتحديثات متطورة، وأداء فائق السرعة وقدرات متقدمة، مقارنة بالجيلين الماضيين، Gemini 1.5، وGemini 1.0. حسب «الشرق».

ويأتي هذا في إطار جهود عملاق التكنولوجيا لإبقاء نفسها في ساحة المنافسة بميدان الذكاء الاصطناعي أمام شركات عملاقة مثل ميتا، ومايكروسوفت، وOpenAI.

وفق تدوينة رسمية من جوجل، فإن الإصدار الأول من الجيل الجديد سيكون الإصدار الخفيف Gemini 2.0 Flash المزوَّد بالقدرة على فهم المدخلات البيانية، من صور، وفيديوهات، ونصوص، وأصوات، وكذلك القدرة على إنتاج مخرجات بأشكال مختلفة.

وقدَّمت الشركة مجموعة من المشروعات التجريبية المدعومة بإصدار Gemini 2.0 Flash الجديد، مثل المساعد البرمجي Project Mariner المتخصص في تسهيل استخدام متصفح كروم بشكل آلي لإنجاز مهام المستخدم، والمساعد الذكي لكتابة الأكواد Jules، إلى جانب المساعد الصوتي الذكي Project Astra، والذي يجيب على تساؤلات المستخدم، ويفهم، ويدرك العالم عبر عدسة كاميرا الهواتف والنظارات الذكية.

◄ معالجة البيانات

صممت جوجل نموذجها الجديد Gemini 2.0 Flash على أساس الجيل السابق Gemini 1.5 Flash، مع حصوله على أداء متطور، وسرعة استجابة للتعامل مع المهام، ومعالجة البيانات المختلفة، بشكل أسرع بمعدل ضعف سرعة أداء Gemini 1.5 Pro.

يأتي النموذج الجديد بإمكانيات مثل القدرة على التعامل مع أشكال المدخلات البيانية المختلفة، مثل الصور والفيديوهات والأصوات، إلى جانب حصوله على قدرات جديدة على إنتاج محتوى من الصور، والأصوات وكذلك تحويل النصوص إلى كلام منطوق.

بالإضافة إلى ذلك، فإن Gemini 2.0 Flash يمكنه استخدام أدوات مختلفة، مثل خرائط جوجل، ومحرك بحث جوجل سيرش، إلى جانب قدرته على تشغيل الأكواد البرمجية، وتنفيذ أوامر المستخدم مع تطبيقات الطرف الثالث.

◄ الوكلاء الرقميين

يتوفر Gemini 2.0 Flash حالياً، بشكل تجريبي، للمطورين داخل الواجهة البرمجية لجيميناي، على متن منصة Google AI Studio ومنصة Vertex AI، والإتاحة الرسمية العامة له ستكون في يناير المقبل.

ولتيسير استخدام المطورين للنموذج الجديد في تطوير تطبيقات، وتجارب تفاعلية، أطلقت جوجل أيضاً واجهة برمجية، تعرف باسم Multimodal Live API، والتي تتيح تطوير تجارب وتطبيقات، تمكِّن التجارب الذكية من إدراك مدخلات مختلفة، مثل أصوات وفيديوهات حية، وكذلك القدرة على استخدام العديد من الأدوات الرقمية.

كذلك يتوفر نموذج Gemini 2.0 Flash الجديد داخل موقع الويب الخاص بجيميناي على الحواسيب الشخصية، ومتصفحات الموبايل، وسيكون متاحاً قريباً على متن تطبيقات جيميناي للهواتف الذكية.

ووعدت جوجل بأن تضيف Gemini 2.0 Flash إلى المزيد من خدماتها، وستوفر ميزة AI Overview حول العالم بلغات مختلفة بحلول العام المقبل. وضعت جوجل فكرة الوكلاء الرقميين AI Agents في صلب أساس تطويرها للجيل الثاني من جيميناي.

وقال سوندار بيتشاي، مدير جوجل التنفيذي، إن فكرة الوكلاء الرقميين شغلت الشركة منذ العام الماضي، وعملت بشكل مكثف على الاستثمار في مشروعات بحثية، ونماذج ذكية “تركز على تقديم ذكاء اصطناعي قادر على فهم العالم من حول المستخدم، وتحليل وإدراك مختلف البيانات بأشكالها المتنوعة، كي يتمكن من تحليل المواقف، واستباق مجرياتها بعدة خطوات، وعندها يستطيع اتخاذ قرارات نيابة عن المستخدم، ولكن تحت إشرافه”.

◄ البرمجية التجريبية

هذا تماماً ما تقدمه جوجل مع Gemini 2.0 Flash، ومشروعاتها البرمجية التجريبية القائمة عليه، وأولها Project Astra، والذي استعرضته الشركة لأول مرة في مؤتمرها للمطورين I/O 2024 أبريل الماضي، إذ يقدم ذكاءً اصطناعياً قادراً على فهم الصور والفيديوهات والأصوات واللغات التي تُدخل إليه عبر هاتف المستخدم، بشكل حي، من مكونات إلكترونية مثل الميكروفون والكاميرا.

بعد تلقي هذه المدخلات، يرد النموذج بإجابات دقيقة عبر قدرته على البحث على الويب من خلال جوجل سيرش، وكذلك الوصول إلى بيانات جغرافية مكانية دقيقة عبر اعتماده على خرائط جوجل، إضافة إلى قدرته على استخدام ميزة البحث البصري Google Lens، كما أنه يتمتع بذاكرة قوية للمحادثات القديمة مع المستخدم، إضافة إلى ذاكرة قصيرة الأجل تصل إلى 10 دقائق بحيث يمكنه الاستمرار في نقاش تفاصيل مختلفة في نفس جلسة الاستخدام.