راجا کودوری (Raja Koduri)، معمار ارشد اینتل و رئیس واحد تجاری کارت گرافیک مجزا در این شرکت که سال ۲۰۱۷ از AMD جدا شد، در مراسمهایی که در چند ماه اخیر در آنها حضور داشته جزئیات جدیدی در ارتباط با معماری جدید پردازنده گرافیکی Xe HP و محصولاتی که بر اساس این پردازندهها ساخته میشوند با رسانهها در میان گذاشته است.
تنوع پردازندههای خانوادۀ Xe اینتل
پردازنده گرافیکی Xe HP از تنوع بالایی برخوردار است و محصولات متنوع زیادی را شامل میشوند، نظیر پردازندههای کم مصرف مجتمع و پایینرده تحت نام Xe LP Graphics و پردازندههای گرافیکی مخصوص دیتاسنترها که معمولاً از چندین تراشه تشکیل میشوند.
راجا کودوری چه اطلاعات جدید را منتشر کرده است؟
کودوری به تازگی جزئیاتی جدید دربارۀ پردازندههای گرافیکی سری دوم در دسترس رسانهها قرار داده است. طبق اخباری که در هفتۀ گذشته اعلام شد، پردازنده گرافیکی Xe HP اینتل قرار است در سه نوع مختلف روانۀ بازار شود. یک مدل پایه که تاکنون چندین بار در خبرهای رسمی ظاهر شده و یک کاشی بهره میبرد که شامل 512 واحد اجرائی (EU) و به احتمال قوی همراه با دو بستۀ HMB2e خواهد بود. هنوز مشخصات فنی این پردازنده توسط اینتل تأیید نشده، اما اخیراً اینتل نحوۀ عملکرد پردازندههای گرافیکی خانوادۀ Xe که شامل یک، دو و یا چهار کاشی هستند را با جزئیات کامل به نمایش گذاشته است که در ادامه میتوانید آنها را مشاهده کنید:
در نگاه اول متوجه قدرت پردازشی بیشتری که به لطف حضور کاشیهای بیشتر در این نوع از پردازندههای گرافیکی فراهم شدهاند، میشوید. اما با این حال نباید از این نکته غافل شد که نتایج حاضر در تصویر بالا مربوط به انجام وظایف گرافیکی آنی (Real Time Tasks) نیستند. تقسیم کار بین پردازندههای گرافیکی برای دستیابی به تکنولوژیهایی نظیر SLI و CrossFire کار بسیار دشوارتری است و استفاده از پردازندۀ گرافیکی اضافی در بهترین حالت ممکن، بین 50 تا 80 درصد عملکرد اجراء بازیهای ویدیویی را بهبود میدهد. اما برای انجام کارهای غیر گرافیکی که بیشتر روی توان پردازشی تمرکز دارند، کار معمولاً بهصورت مجزا انجام میشود.
فناوری چهار کاشی، واقعی یا ترفند تبلیغاتی؟
قبل از این همه بر این باور بودند که پردازندۀ گرافیکی متشکل از چهار کاشی وجود خارجی ندارد و بیشتر بازی تبلیغاتی اینتل است؛ اما در جریان برگزاری رویداد Hot Chips اینتل، راجا کودوری، پردازندۀ مورد بحث را که ابعاد بسیار بزرگی هم داشت به سمت دوربین گرفت و نشان داد تا به همگان ثابت کند که اینتل واقعا در حال ساخت چنین پردازندۀ گرافیکی ردهبالا و قدرتمندی است.
این پردازنده واقعا ابعاد بزرگی دارد، حتی بزرگتر از تمام تراشههایی که تاکنون دیدهایم.
آیا اصلاً این پردازنده به تولید انبوه خواهد رسید؟
اینکه پردازندۀ گرافیکی مورد بحث سری Xe HP وارد مرحلهی تولید نهایی میشود یا خیر، سؤالی است که فعلاً پاسخی با اطمینانی نمیتوان به آن داد. فراموش نکنید اینتل پردازندۀ گرافیکی Xe HPC ملقب به پونته وکیو (Ponte Vecchio) را هم در برنامه خود دارد و طی چند وقت اخیر به شکل ویژهای روی آن مانور داده است. پردازندۀ گرافیکی Xe HP برای تبدیل شدن به پردازندهای با چند کاشی (Tile) از فناوری EMIB استفاده میکند. بر اساس اطلاعیۀ رسمی اینتل، پردازندۀ گرافیکی Xe HPC قرار است شامل یک کاشی تحت عنوان رمبوکش (Rambo Cache) باشد و از فناوریهای دیگر نظیر پکیجینگ Fovores با بهرهگیری از Co-EMIB بهبودهای بیشتری در زمینۀ پردازشی ارائه دهد.
پونته وکیو (Ponte Vecchio) لیتوگرافی 10 نانومتری دارد
اینتل میگوید کاشی پایۀ پردازندۀ پونته وکیو با استفاده از لیتوگرافی جدید ۱۰ نانومتری سوپرفین (SuperFin) ساخته میشود که نسخۀ بهبود یافتۀ فینفت (FinFET) به حساب میآید. کاشی رمبوکش از لیتوگرافی «بهبود یافتۀ» سوپرفین که جزئيات کاملاش را دردسترس نداریم استفاده میکند. هنوز لیتوگرافی کاشی Xe Link I/O مشخص نشده، اما اینتل گفته که این کاشی توسط شرکتی خارجی تولید میشود. درنهایت برای تولید کاشی اصلی یعنی کاشی پردازشی، از دو نوع لیتوگرافی بهره گرفته خواهد شد که در نوع خود اتفاق عجیبی است.
طبق اطلاعاتی که اخیراً اینتل منتشر کرده این موضوع بطور رسمی تأیید شد که اینتل در حال کار بر روی پردازندههایی از خانوادۀ Xe HP با یک، دو و یا چهار کاشی است. استفاده از فناوری EMIB بدین معنی است که دو پردازندۀ گرافیکی آخر به ترتیب دو و چهار برابر پردازندۀ پایه ابعاد خواهند داشت، بنابراین لازم که از سه سوکت مجزا برای آنها استفاده شود.
اما قدرت این پردازندۀ گرافیکی چقدر است؟
پردازندۀ گرافیکی چهار کاشی Xe HP که در دستان راجا کودوری در جلوی دوربین به نماش گذاشته شد ظاهراً میتواند به قدرتی معادل 42 ترافلاپس دست پیدا کند، البته این عدد حداکثر توان این پردازندۀ گرافیکی اینتل نیست. کودوری در بخشی از صحبتهای خود ادعا میکند که این پردازندۀ گرافیکی میتواند به قدرت پردازشی در مقیاس پتافلاپس نیز دسترسی پیدا کند. رسیدن به چنین عددی با لطف حضور هستههای تنسور (Tensor) ممکن میشود. البته هنوز اطلاعی از پیکربندی دقیق هستهها در پردازندۀ گرافیکی جدید اینتل نداریم.
پردازندۀ گرافیکی اینتل Xe HP مثل پردازندههای انویدیا سری A100 و معماری TPUv4 گوگل، از هستههای تنسور پشتیبانی میکند. هنوز اطلاعات دقیقی اعلام نشده اما میتوان حدس زد که این هستهها میتوانند به ازای هر سیکل، 128 عملیات را انجام دهند؛ به عبارتی، پردازندۀ گرافیکی اینتل به ازای هر واحد اجرائی شامل یک هستۀ تنسور خواهد بود. این بدین معنی است که اگر 2048 واحد اجرائی داشته باشیم، با حل کردن یک معادلۀ ساده یعنی «2×128×2048» به عدد «524،288» میرسیم. البته در اینجا سرعت کلاک را لحاظ نکردهایم. چیزی که انتظار میرود این است که برای دستیابی به یک پتافلاپس قدرت شاهد دستیبای به سرعت دو گیگاهرتز باشیم. اما شاید اینتل از نوع دیگری از هستههای تنسور استفاده کند که بتوانند به ازای هر سیکل، بیش از 128 عملیات را انجام دهند. رسیدن ابررایانهها به قدرت پردازشی بسیار بالاتر به لطف وجود چنین پردازندهای، بسیار سادهتر خواهد شد.