الرئيسية / اخر الاخبار / تعرف كيف تقوم شركة جوجل بتشغيل الذكاء الاصطناعي في العالم

تعرف كيف تقوم شركة جوجل بتشغيل الذكاء الاصطناعي في العالم

 

جوجل تتجه في طليعة الموجة المقبلة في الحوسبة للبحث والتطوير في الذكاء الاصطناعي وأجهزة الكمبيوتر للشبكة العصبية

هي الخطوة التالية في الحوسبة، وتمكين حالات استخدام جديدة وحساب أسرع لحل المشاكل التي لا يمكن حلها حاليا. إن

عملاق البحث الذي يطلق عليه الآن اسم “الذكاء الاصطناعي الأول” (Ai First)

تعتمد هذه التكنولوجيات الجديدة في عدد من الطرق.

 

خوارزميات الشبكات العصبية والتعلم الآلي هي بالفعل في صميم العديد من خدمات جوجل. حيث يقومون بتصفية الرسائل غير

المرغوب فيها في Gmail، وتحسين الإعلانات المستهدفة

وتحليل صوتك عند التحدث إلى مساعد جوجل أو مكبر الصوت المنزلي.

 

وفي داخل الهواتف الذكية، والأفكار مثل عدسة جوجل وبيكسبي سامسونج تظهر قوة “الذكاء الاصطناعي” في معالجة الرؤية.

حتى شركات مثل سبوتيفي و نيتفليكس تستخدم خوادم جوجل السحابية لتخصيص المحتوى لمستخدميها.

 

تعد منصة السحاب من جوجل في مركز جهودها (وتلك التي تقدمها الجهات الخارجية) للاستفادة من هذه المنطقة التي تزداد

شعبية في مجال الحوسبة. ومع ذلك، يتطلب هذا الحقل الجديد أنواعا جديدة من الأجهزة لتشغيلها بكفاءة، وقد استثمرت جوجل

بكثافة في أجهزة المعالجة الخاصة بها والتي تسميها وحدة معالجة الموتر السحابية (كلاود TPU). هذه الأجهزة المخصصة معبأة

في خوادم جوجل، وتقوم بالفعل بتشغيل النظام الحالي لمنظمة العفو الدولية. ولكن كيف يعمل؟

 

كشفت شركة جوجل النقاب عن الجيل الثاني من TPU في جوجل I / O في وقت سابق من هذا العام، حيث قدمت أداء متزايداً

وتحسنا أفضل للمجموعات الأكبر حجما. و TPU هو تطبيق الدوائر المتكاملة. بدلا من وحدة المعالجة العامة مثل وحدة المعالجة

المركزية. تم تصميم وحدة للتعامل مع التعلم آلة مشتركة وحسابات الشبكات العصبية للتدريب والاستدلال. على وجه التحديد

مصفوفة مضاعفة، المنتج نقطة، والتحويلات والتي هي عادة 8 بت فقط في الدقة.

 

في حين أن هذه الأنواع من الحسابات يمكن القيام به على وحدة المعالجة المركزية وأحيانا أكثر كفاءة على وحدة معالجة الرسوم، هذه البنى محدودة من حيث الأداء وكفاءة الطاقة عند التوسع عبر أنواع العمليات. على سبيل المثال، IEEE 754 8-bit  عدد صحيح التصحيح الأمثل التصاميم يمكن أن تصل إلى 5.5X المزيد من الطاقة و 6 X أكثر كفاءة المنطقة من 16 بت تصاميم العائمة نقطة الأمثل. هي أيضا 18.5X أكثر كفاءة من حيث الطاقة و 27 X أصغر من حيث المساحة من 32 بت FP  مضاعفة IEEE 754 كونه المعيار التقني لحسابات العائمة المستخدمة في جميع وحدات المعالجة المركزية الحديثة.

 

واثبات اكثر على ذلك تتطلب العديد من الحالات استخدام الشبكات العصبية تتطلب وقت قليل لأستجابة المعالجة الفورية تقريبا

من وجهة نظر المستخدم. هذا يفضل الأجهزة المخصصة لبعض المهام، بدلا من محاولة لتناسب وقت الإستجابة لأعادة أبنية

الرسومات في أعلى حالات الاستخدام الجديدة. وقت استجابة ذاكرة الوصول إلى ذاكرة الوصول العشوائي الخارجية يمكن أن تكون مكلفة للغاية.

 

 

في مراكز البيانات الكبير ان عدم الكفاءة في الطاقة والكفاءة في المنطقة عند أداء وظائف الشبكات العصبية على وحدة المعالجة

المركزية أو وحدة معالجة الرسومات يمكن أن يؤدي إلى تكاليف ضخمة. ليس فقط من حيث السيليكون والمعدات، ولكن أيضا

فاتورة الطاقة على مدى فترات طويلة من الزمن. عرفت جوجل أنه التعلم الآلي فإنه يحتاج الأجهزة التي يمكن أن تقدم ليس فقط

الأداء العالي، ولكن أيضا إلى حد كبير أفضل كفاءة الطاقة من وحدات المعالجة المركزية الرائدة ووحدات معالجة الرسومات.

 

لحل هذه المشكلة، حددت جوجل تصميم وحدة TPU لتقديم تحسين أداء التكلفة بمقدار عشرة أمثال على وحدة معالجة

الرسومات (GPU) الجاهزة. وكان التصميم النهائي معالج مزدوج يمكن أن يستخدم على common PCIe bus مما يسمح لها

بالعمل جنبا إلى جنب مع وحدة المعالجة المركزية العادية، والتي من شأنها أن تمر تعليمات ومعالجة حركة المرور من بين أمور

أخرى، فضلا عن المساعدة في تسريع نشر مرات من خلال جعل تصميم إضافة ونتيجة لذلك،

كان تصميم وتشغيلها في مراكز البيانات بعد 15 شهرا فقط من الحمل.

 

في وقت سابق من هذا العام، أصدرت جوجل مقارنة شاملة لأداء TPU والكفاءة مقارنة مع وحدات المعالجة المركزية Haswell و نفيديا وحدات معالجة الرسومات Tesla K80 ، مما يتيح لنا نظرة فاحصة على تصميم المعالج.

 

في قلب جوجل TPU هو وحدة المصفوفة المضاعفة. وتحتوي الوحدة على 65،538 مولدات المضاعف من 8 بتات (MACs) – وحدات

الأجهزة المصممة خصيصا لحساب ناتج رقمين وإضافة ذلك إلى مركب. عند القيام به مع أرقام نقطة العائمة، وهذا ما يسمى

(fused multiply-add (FMA. قد تتذكر أن هذا هو التعليمات التي بذلت ARM جهودا

لتحسين مع أحدث  Cortex-A75 و A55 وحدات المعالجة المركزية، فضلا عن معالج الرسومات Mali-G72.

 

 

على عكس وحدة المعالجة المركزية أو وحدة معالجة الرسومات، التي تصل إلى سجلات متعددة لكل عملية عند إرسال البيانات

من وإلى وحدات منطقية حسابية (ALUs)، الماك ينفذ تصميم الانقباضي الذي يقرأ سجل مرة واحدة وإعادة استخدام هذه القيمة

طوال الفترة . وهذا ممكن في TPU بسبب تصميمه المبسط الذي يرى ALUs تنفيذ الضرب وإضافة في أنماط ثابتة عبر ALUs

المجاورة، دون الحاجة إلى الوصول إلى الذاكرة. وهذا يحد من التصميم من حيث الوظائف الممكنة

ولكن يزيد كثيرا من أدائها وكفاءة الطاقة في مضاعفة المهام.

من حيث الأرقام، يمكن جوجل TPU معالجة 65،536 مضاعفة ويضاف للأعداد الصحيحة 8 بت كل دورة. وبالنظر إلى أن TPU يعمل

في 700MHZ، فإنه يمكن حساب 65،536 × 700،000،000 = 46 × 1012 مضاعفة والإضافة عمليات أو 92 TeraOps (تريليونات

العمليات) في الثانية في وحدة المصفوفة. وتقول جوجل أن الجيل الثاني من TPU يمكن أن توفر ما يصل إلى 180 TeraOps من

أداء ألنقطة العائمة. هذا هو أكثر من ذلك بكثير الإنتاجية الموازية من المعالج RISC القياسية العددية، والتي عادة ما يمر فقط

عملية واحدة مع كل تعليمات على مدار الساعة أو أكثر.

 

يتم جمع المنتجات 16 بت من وحدة ضرب المصفوفة في 4MiB من 32 بت تراكم تحت وحدة المصفوفة. هناك أيضا عازلة موحدة

من 24MB من SRAM، والتي تعمل كسجلات. يتم إرسال تعليمات للسيطرة على المعالج من وحدة المعالجة المركزية إلى TPU

عبر PCIe bus. هذه هي تعليمات نوع complex CISC من أجل تشغيل المهام المعقدة،

مثل العديد من الحسابات المضاعفة إضافة. يتم تمرير هذه التعليمات أسفل خط أنابيب في 4 مراحل. هناك فقط اثني عشر تعليمات ل TPU في المجموع، خمسة أهمها هي ببساطة لقراءة وكتابة النتائج والأوزان في الذاكرة، وبدء مصفوفة مضاعفة / التفاف البيانات والأوزان.

 

وعموما جوجل TPU يشبه إلى حد كبير من الفكرة القديمة floating-point معالج من وحدة معالج الرسومات. انها قطعة مبسطة

بشكل مدهش من الأجهزة، وتتألف من عنصر معالجة رئيسي واحد فقط ونظام مراقبة مبسطة صغيرة. لا يوجد مخابئ، مثل فرع

المتنبئات، او وصلات متعددة المعالجة، أو غيرها من الميزات المعمارية الدقيقة (microarchitectural) التي سوف تجد في وحدة

المعالجة المركزية المشتركة. هذا يساعد مرة أخرى لإنقاذ بشكل كبير على منطقة السيليكون واستهلاك الطاقة.

 

من حيث الأداء، تقول جوجل أن تصميم TPU لها يسلم عادة 83x أفضل أداء للواط نسبة مقارنة مع وحدة المعالجة المركزية، و 29

مرة أفضل من عند تشغيل على وحدة معالجة الرسومات. ليس فقط هو تصميم رقاقة أكثر كفاءة في استخدام الطاقة، ولكنه

يسلم أداء أفضل بكثير. عبر ستة أحمال عمل الشبكات العصبية المرجعية المشتركة،

 

و TPU يقدم فوائد أداء كبيرة ولكن واحد من الاختبارات، في كثير من الأحيان من قبل حجم 20X أو أسرع مقارنة مع معالجة

الرسومات وتصل إلى 71x أسرع من وحدة المعالجة المركزية. وبطبيعة الحال، فإن هذه النتائج تختلف اعتمادا على نوع وحدة

المعالجة المركزية وجرافيك اختبارها، ولكن أجرت جوجل الاختبارات الخاصة بها ضد high-end Intel Haswell E5-2699 v3

ونفيديا K80 لنظرتها المتعمقة في الأجهزة.

وقد أعطت جهود الأجهزة جوجل دورا رئيسيا في السحابة، ولكن ليس كل تطبيقات الذكاء الاصطناعي هي مناسبة تماما لنقل

البيانات مثل مسافات كبيرة. بعض التطبيقات، مثل سيارات القيادة الذاتية، تتطلب حساب فوري تقريبا، وهكذا لا يمكن الاعتماد

على وقت الإستجابة في نقل البيانات العالي عبر الإنترنت، حتى لو كانت قوة حساب في السحابة سريع جدا. بدلا من ذلك،

يجب أن يتم هذا النوع من التطبيقات على الجهاز، وينطبق الشيء نفسه على عدد من تطبيقات الهواتف الذكية،

مثل معالجة الصور على بيانات كاميرا RAW للصورة.

 

مع هاتف بكسل 2 أطلقت جوجل أول محاولة لها في جلب قدرات الشبكات العصبية إلى الأجهزة المخصصة مناسبة ل انخفاض

قوة شكل عامل المحمول في Pixel Visual Core. ومن المثير للاهتمام، تعاونت جوجل مع إنتل في صنع الرقاقة، مما يشير إلى

أنها لم تكن تصميما داخليا. ونحن لا نعرف بالضبط ما تنطوي عليه الشراكة؛

فإنه يمكن أن يكون مجرد المعمارية أو أكثر للقيام اتصالات التصنيع.

 

شركة إنتل قامت بشراء شركات الأجهزة للذكاء الاصطناعي، شركة nabbing Nervana Systems في عام 2016،و شركة موفيديوس (التي قامت بصناعة رقائق لطائرات بدون طيار DJI) في سبتمبر الماضي، وموبلي في مارس 2017. ونحن نعلم أيضا أن إنتل لديها معالج الشبكات العصبية الخاصة بها في الأعمال،

هذا المنتج نتيجة لشراء إنتل للشركة التي تحمل نفس الاسم. نحن لا نعرف الكثير عن المعالج، لكنه مصمم للخوادم، ويستخدم تنسيق عدد قليل الدقة يسمى فلكسبوينت، ويفتخر بسرعة الوصول السريع ذاكرة الوصول السريع من 8 تيرابت في الثانية الواحدة. سوف تتنافس مع جوجل TPU، بدلا من انها المنتجات النقالة.

ومع ذلك، يبدو أن هناك بعض أوجه التشابه التصميم بين إنتل وجوجل الأجهزة على أساس الصور العائمة حول الانترنت. على وجه التحديد، وتكوين متعدد النواة، واستخدام PCIe وحدة تحكم المرافق،و وحدة المعالجة المركزية الإدارة، والتكامل الوثيق إلى الذاكرة السريعة.

في لمحة أجهزة بكسل تبدو مختلفة تماما لتصميم جوجل سحابة، وهو أمر ليس من المستغرب نظرا لمختلف ميزانيات السلطة. على الرغم من أننا لا نعرف الكثير عن بنية Visual Core كما نفعل في جوجل Cloud TPUs، يمكننا أن نبحث عن بعض القدرات المشابهة. كل وحدة من وحدات معالجة الصور (IPUs) داخل التصميم توفر 512 وحدة منطقية حسابية، أي ما يعادل مجموعة 4،096 وحدة.

مرة أخرى هذا يعني تصميم موازية للغاية قادرة على تحطيم الكثير من الأرقام في آن واحد، وحتى هذا التصميم قلصت يمكن أن تؤدي 3 تريليون عملية في الثانية الواحدة. ومن الواضح أن الرقاقة تتميز بعدد أصغر بكثير من وحدات الرياضيات من TPU من جوجل ولا توجد أي شك في الاختلافات الأخرى حيث أن هذا التصميم مصمم أساسا لتحسينات التصوير، بدلا من مجموعة متنوعة من الشبكات العصبية التي تعمل جوجل في السحابة. ومع ذلك، انها مماثلة، تصميم مواز للغاية مع مجموعة محددة من العمليات في الاعتبار.

وما إذا كانت جوجل سوف تبقي هذا التصميم وتستمر في العمل مع إنتل لإمكانات حساب الحوسبة المستقبلية، أو تعود إلى الاعتماد على الأجهزة التي وضعتها شركات أخرى، فلا يزال يتعين رؤيتها. ومع ذلك، سوف يفاجأ إذا كنا لا نرى تجربة جوجل في أجهزة الشبكات العصبية تواصل تطوير منتجات السيليكون سواء في الخادم ومساحات عامل بشكل صغير.

قد تكون جوجل معروفة بشكل أفضل ببرامجها، ولكن عندما يتعلق الأمر بتشغيل هذا الجيل الجديد من الحوسبة للذكاء الاصطناعي فإن جوجل مدمجة بشكل متساو في تطوير الأجهزة ونشرها.

 

توفر الشركة TPU السيليكون المتطلبات اللازمة لكفاءة الطاقة في استخدام الطاقة اللازمة لنشر التعلم الآلي على نطاق سحابة كبير. كما أنها توفر أداء أعلى بشكل ملحوظ لهذه المهام المحددة من المعالج المركزي و معالج الرسومات. نحن نشهد اتجاهاً مماثلا في الفضاء المحمول، مع تصنيع  SoC تتحول على نحو متزايد إلى أجهزة DSP مخصصة لتشغيل هذه الخوارزميات المكثفة حسابيا بكفاءة. يمكن أن تصبح جوجل مشغل أجهزة كبير في هذا السوق أيضا.

 

ما زلنا ننتظر لنرى ما لديه جوجل في متجر لأجهزة الجيل الأول من الذكاء الاصطناعى في Pixel Visual Core. سيتم قريبا تشغيل رقاقة لمعالجة أسرع HDR ، وسوف تلعب بلا شك دورا في بعض المنتجات التي تقوم الشركة بتوزيعها على هاتف بيكسيل 2. في الوقت الحالي، جوجل تقود الطريق إلى الأمام مع الأجهزة سحابة TPU للذكاء الاصطناعي ودعم البرمجيات مع TensorFlow. ومن الجدير بالذكر أن إنتل، ومايكروسوفت، و فيسبوك، والأمازون، وغيرها كلها تتنافس في السوق الناشئة بسرعة أيضا.

مع التعلم الآلي والشبكات العصبية التي تعمل على زيادة عدد التطبيقات في كل من السحابة وعلى حافة الأجهزة مثل الهواتف الذكية، جهود الأجهزة في وقت مبكر جوجل وضعت الشركة لتكون رائدة في هذا المجال الجيل القادم من الحوسبة.

 

المصدر flipboard

 

شاهد أيضاً

أعلنت شركة Epic Games ان لعبة Fortnite قادمة يوم الاثنين على الهواتف والأجهزة اللوحية

لعبة Fortnite Battle Royale قادمة إلى الأجهزة المحمولة! على الهواتف والأجهزة اللوحية لعبة Fortnite هي …