پیشنهاد سردبیرسخت افزار

کدام یک سریع‌تر است؟ بررسی میزان تأخیر حافظه گرافیکی Ampere و RDNA 2

در این بخش میزان تأخیر حافظه گرافیکی این دو تراشه را مورد بررسی قرار داده‌ایم

به تازگی وب سایت Chips and Cheese عملکرد میزان تأخیر حافظه دو معماری RDNA 2 و Ampere کارت گرافیک‌های Nvidia و AMD را مورد بررسی قرار داده است. به همین منظور، آن‌ها تصمیم گرفتند عملکرد تأخیر حافظه مبتنی بر جدیدترین معماری تیم قرمز و سبز را آزمایش کنند که در نهایت به نتایج جالبی دست پیدا کردند. در ادامه همراه لیون تک باشید.

در بخش پردازنده، با افزایش روز افزون استفاده از معماری با چند چیپلت و استفاده از چند چیپ IO روی یک بستر و یا حتی در در بستر جدا، مانند معماری Zen شرکت AMD، اندازه گیری حافظه کش و میزان تأخیر به عنوان یکی از مهمترین فاکتورها برای بررسی پردازنده‌ها تبدیل شده است. در همین حال، پردازنده‌های گرافیکی نیز از چندین حافظه کش تشکیل شده‌اند که فاصله بین محاسبه و عملکرد حافظه را پر می‌کنند. Chips and Cheese از بنچمارک Pointer Chasing مبتنی بر OpenCL برای اندازه گیری حافظه کش و میزان تأخیر حافظه در گرافیک‌های فعلی مبتنی بر معماری Ampere و RDNA 2 استفاده کرده است.

عملکرد سریع‌تر تیم قرمز

کارت گرافیک‌های مدرن به مانند پردازنده‌ها از سیستم حافظه کش چند سطحی استفاده می‌کنند. معماری Ampere همچنان به همان ترکیب قدیمی حافظه کش L1+L2 اکتفا کرده، ولی RDNA 2 از چهار سطح حافظه کش شامل L0، L1، L2 و Infinity Cache (که اساساً به عنوان حافظه کش L3 عمل می‌کند) استفاده می‌کند. به طور کلی، RDNA 2 در هر سطح از نسبت تأخیر کم‌تری در مقایسه با Ampere برخوردار است. Chip and Cheese تأیید کرد Infinity Cache تنها 20 نانوثانیه به زمان تأخیر اضافه می‌کند.

برای انجام این مقایسه، دو کارت گرافیک Radeon RX 6800 XT (مبتنی بر معماری RDNA 2) و RTX 3090 (مبتنی بر معماری Ampere) در برابر یکدیگر قرار گرفتند. بنجمارک بدست آمده از حافظه کش و حافظه گرافیکی نشان می‌دهد که معماری RDNA 2 به مراتب بهتر از Ampere عمل می‌کند و با وجود برخورداری از 2 سطح حافظه کش بیشتر، تأخیر کم‌تری را ارائه می‌دهد.

(برای مشاهده تصاویر با اندازه اصلی، کافی است روی آن‌ها کلیک کنید.)

یکی از دلایل چنین چیزی به اندازه بزرگ‌تر تراشه GA102 مبتنی بر معماری Ampere و استفاده از 2 سطح حافظه کش ارتباط دارد که در نهایت منجر به میزان تأخیر بیشتر تا 100 نانوثانیه (از L1 تا L2) می‌شود. از طرف دیگر، RDNA 2 تنها 66 نانوثانیه تأخیر دارد، توجه داشته باشید که اندازه تراشه Navi 21 کوچک‌تر بوده و از حافظه نهان 4 مگابایتی L2 برخوردار است در حالی که تراشه GA102 دارای 6 مگابایت حافظه کش L2 (برای کل تراشه) است. همچنین، بد نیست بدانید که تراشه A100 از حافظه کش حجیم 40 مگابایتی L2 بهره می‌برد.

در ادامه Chips and Cheese راجع به عملکرد این تراشه‌ها توضیحاتی ارائه کرد:

حافظه کش RDNA 2 به مراتب سریع‌تر بوده و میزان تأخیر آن در همه سطوح کم‌تر از Ampere است. حافظه Infinity Cache تنها 20 نانوثانیه به زمان تأخیر L2 اضافه می‌کند و در نهایت شاهد میزان تأخیر کم‌تری نسبت به حافظه کش L2 در Ampere هستیم. همچنین، بر اساس آزمایش‌ها متوجه شدیم میزان تأخیر VRAM  در معماری RDNA 2 و Ampere به طرز شگفت انگیزی یکسان است.

در مقابل، انویدیا با استفاده از یک زیر سیستم حافظه گرافیکی معمولی‌تر، تنها دو سطح حافظه کش (L1 + L2) را ارائه می‌دهد. میزان تأخیر بین حافظه کش L1 تا L2 بیش از 100 نانوثانیه طول می‌کشد که این مقدار برای RDNA از L2 به L0 فقط 66 نانوثانیه است، تازه این مورد را هم در نظر بگیرید که در این میان حافظه کش L1 نیز وجود دارد. به نظر می‌رسد علت اصلی بالا رفتن میزان تأخیر حافظه کش به دلیل ابعاد بزرگ‌تر Die تراشه GA102 باشد. این مورد می‌تواند عملکرد عالی کارت گرافیک AMD را در رزولوشن‌های پایین‌تر توضیح دهد. برخورداری از حافظه کش L2 و L3 ممکن است این مزیت را به RDNA 2 بدهد تا در حجم کاری کم میزان تأخیر کم‌تری را ارائه کند.

در مقایسه با تراشه‌های قدیمی پاسکال و ماکسول، معماری Ampere توانست میزان تأخیر حافظه گرافیکی را با وجود ابعاد بزرگ‌تر به شکل قابل توجهی بهبود ببخشد. در سوی دیگر، میزان تأخیر حافظه در RDNA 2 در مقایسه با معماری تراشه GCN و VLIW دستاوردهای چشمگیری را با خود به همراه داشته است. مطمئناً مقایسه این نمودارها با عرضه پردازنده‌های گرافیکی Chiplet در سال آینده جالب خواهد بود.

منبع
WccftechTom's Hardware
نمایش بیشتر

سهیل حسینی

گیمر، علاقه مند به تکنولوژی و بازی های ویدئویی
0 0 رای
امتیاز این مطلب
اطلاع رسانی در مورد
guest
0 کامنت
کامنت داخل متن
دیدن تمام کامنت‌‌ها

نوشته های مشابه

دکمه بازگشت به بالا