08.08.2022

Пропускная способность любой ценой: изучаем DDR5

Процессоры Intel 12-й серии поддерживают сразу два типа памяти: современный DDR5 и ставший классикой DDR4. Потерял ли актуальность старый стандарт и надо ли бежать за новинкой? Выясняем на практике.

Что нового и зачем это нужно?

Если в общих словах, то пропускная способность DDR5 выросла ценой увеличения задержек при обращении к памяти. А более тонкий техпроцесс немного снизил рабочее напряжение, то есть уменьшилось тепловыделение и увеличился разгонный потенциал. Похожая история была в своё время и с DDR4, и с DDR3. Но в случае с «пятёркой» есть пара важных нюансов, о которых надо упомянуть. А перед этим — вспомнить, как вообще хранятся данные в оперативной памяти.

Пропускная способность любой ценой: изучаем DDR5

Ради компромисса между скоростью доступа и объёмом хранимой информации оперативная памяти разбита на отдельные страницы (строки) и столбцы. Для чтения или записи каждой конкретной ячейки контроллер активирует на микросхеме сперва нужную строку, затем — столбец, а напоследок производит операции. Одновременно может быть активна только одна пара контактов, и если чип уже занят какой-то операцией, другую выполнить он не может.

Как вы понимаете, скорости работы такие ограничения не добавляют, поэтому память внутри одной плашки оперативки разделена на так называемые ранки, а те — на отдельные банки. Контроллер может по очереди обращаться к каждому из банков внутри одного ранка, а ещё поочерёдно к разным ранкам, чтобы не ждать завершения операций. Сперва массово раздаются указания, затем производится считывание или запись данных, которые дальше передаются по 64-битной шине в процессор. И так — несколько миллиардов раз в секунду.

Пора перейти к новшествам. Первое ключевое изменение — каждый ранк (а их теперь минимум 2) виден процессору отдельно. Получается, что вместо одного 64-битного канала на модуль памяти получается два виртуальных 32-битных. Благодаря внутренним оптимизациям DDR5 и улучшениям в контроллерах на одинаковой с DDR4 частоте это даёт прирост пропускной способности порядка 35%.

А если добавить увеличение тактовых частот (DDR4 3200 МГц vs DDR5 4800 МГц), то общая производительность памяти вырастет суммарно на 90%.

Второе изменение — синхронизация размеров пакетов данных и кэша процессора. Это упрощает работу контроллера памяти (часть ненужных операций попросту выбросили) и высвобождает ресурсы на другие задачи. В частности, была увеличена очередь команд с 8 до 16 — так контроллер лучше планирует работу с банками памяти и меньше ожидает инструкции от процессора.

Пропускная способность любой ценой: изучаем DDR5

Третья особенность — в регенерации ячеек памяти. Поскольку DRAM энергозависима и хранит данные при активном потреблении электричества, заряд ячеек со временем «утекает». Чтобы информация в оперативке не повреждалась, контроллер регулярно берёт тайм-аут и перезаряжает все банки памяти так, чтобы уровень сигнала позволял чётко различить нули и единицы. Разумеется, в этот момент операций чтения и записи не происходит. У DDR4 за раз обновлялся весь ранк памяти, а новая DDR5 регенерирует каждый банк по отдельности — это уменьшает шансы возникновения задержки при чтении или записи информации.

Последнее изменение касается области памяти в контроллере, отвечающей за SPD — профили таймингов и частот, на которых может работать модуль. Раньше этот чип хранил стандартный набор профилей JEDEC и пару «разгонных» XMP, прошитых производителем. Теперь нестандартных профилей может быть до 5 штук: 3 от производителя и 2 перезаписываемых пользовательских. Так что разгон оперативной памяти не будет привязан к UEFI материнской платы, а удачно подобранные параметры не потеряются при апгрейде.

Проверяем изменения на практике

Для изучения возможностей новой памяти сегодня подходят только процессоры Intel Alder Lake 12-й серии и материнские платы с чипсетом Z690. Такие системы поддерживают оба стандарта памяти. Но у нас есть доступ только к материнке с поддержкой DDR5, так что мы проведём замеры с новой памятью, а данные об относительной производительности почерпнём из сети.

Пропускная способность любой ценой: изучаем DDR5

Демостенд собран на базе Gigabyte Z690 Aorus Pro и процессора Intel Core i7-12700K. Это 12-ядерный CPU с 8 производительными ядрами, обладающими гиперпоточностью, и 4 энергоэффективными. Всего он может исполнять до 20 потоков одновременно. Вычислительные задачи изначально попадают на ядра с максимальной производительностью, но после оценки их сложности могут быть перемещены на экономичные. Остужается всё это кулером Deepcool AK620 — одной из немногих доступных для LGA-1700 систем охлаждения на момент тестирования. Питание поставляет 750-ваттник Gigabyte, графика — RTX 3080 Ti.

Честь DDR5 отстаивает комплект из двух плашек Kingston FURY Beast по 16 ГБ каждая.

Рабочая частота — 5200 МГц @ CL40, штатное напряжение — 1,1 вольта. Модули идут в классических чёрных радиаторах, не сильно изменяющих общие габариты памяти — такие поместятся под любую супербашню и не будут мешать установке вентиляторов на неё.

Пропускная способность любой ценой: изучаем DDR5

Ключ на новой оперативке стоит практически по центру. Если обзаведётесь DDR5, смотрите внимательнее, какой стороной суёте модуль в слот. У достаточно сильных пользователей вполне получится воткнуть оперативку задом наперёд. Само собой, это не гарантийный случай, и если повезёт, всё закончится ремонтом материнской платы, но может и короткое замыкание случиться — железу тогда конец. Надеемся, ко времени появления DDR6 до JEDEC дойдут современные тренды и оперативка будет втыкаться так же, как и USB Type-C — любой стороной.

Чистая синтетика

Память сразу завелась с XMP-профилем на 5200 МГц. Производитель чипов — Micron, модуль практически не приемлет разгон, а максимальная рабочая частота 5400 МГц достигается повышением напряжения, и даже в таких условиях система работает нестабильно. Впрочем, это нормально: первые образцы DDR4 тоже неохотно поддавались разгону. Правда, при этом они ещё и уступали лучшим варианта DDR3 в производительности. Для тестов мы использовали встроенный бенчмарк AIDA64 Extreme.

Пропускная способность Kingston FURY Beast DDR5 @ 5200 МГц

Чтение
71 340 МБ/с
Запись
70 261 МБ/с
Копирование
68 841 МБ/с
Задержки
76,8 нс

В абсолютных значениях такие результаты уже превосходят популярные нынче модули DDR4 3600 МГц — пропускная способность выросла, как и задержки. Если мы обратимся к интернету и десяткам бенчмарков, которые успели появиться в сети, то выстраивается следующая картина.

При прочих равных Intel Core 12-й серии работает с DDR4 хуже предшественника: память не так хорошо разгоняется, задержки чуть выше, но это вполне закономерный результат. Во-первых, процессор поддерживает сразу два стандарта памяти, во-вторых, прошивки материнских плат не так отполированы, как у прошлого поколения. С будущими апдейтами разница может сойти на нет.

Пропускная способность любой ценой: изучаем DDR5

Есть взять пару одинаковых материнских плат на базе Z690, отличающихся только памятью, и произвести замеры на одних и тех же частотах, то пропускная способность DDR5 только в силу архитектуры будет выше на 30-40% — в зависимости от таймингов и режимов работы контроллера.

Реальные задачи

Теперь вопрос: где применима такая пропускная способность? На ум первым делом приходят игры и приложения для работы с графикой или видео. Игровые бенчмарки показывают, что одинаковые сборки, отличающиеся лишь памятью, выдают стабильные 2,5% разницы (пропускная способность же выше на 40%) — fps растёт, но не так значительно, как чистая производительность подсистемы. Можно подумать, что ограничивает процессор или графическая подсистема, но нет — везде настройки выбраны таким образом, чтобы нагрузка именно на оперативную память была максимальной. Аналогичный прирост, от 2 до 5%, показывает и рабочий софт, который эмулируют рендер-бенчмарки.

Пропускная способность любой ценой: изучаем DDR5

Почему так происходит? Играм важна не только космическая пропускная способность, но и скорость доступа к информации — те самые задержки, которые увеличились с усложнением внутренней структуры DDR5. Поэтому главной характеристикой разгона в грядущем поколении памяти будет не увеличение частоты, а погоня за лучшими таймингами.

Вторая причина — отсутствие оптимизации.

Да, старый софт использует весь доступный ресурс, но когда создавались игровые движки и алгоритмы сжатия того же 7-zip? Вероятно, через полгода-год подтянутся рабочие программы, ведь их научат адаптироваться к новым характеристикам памяти. Через пару лет улучшения дотянутся и до ААА-игр, но тут следует понимать, что без массового распространения нового стандарта прикладывать большие усилия к оптимизации разработчики вряд ли будут — вспомните, как долго игроделы ориентировались на консольные HDD и устаревшие графические библиотеки?

Пропускная способность любой ценой: изучаем DDR5

И здесь кроется ещё одна неприятность: грядущие системы AMD не будут поддерживать DDR5. Ryzen 6000 (и их мобильные версии) будут работать с классической DDR4, и лишь следующие процессоры с архитектурой Zen 4 переедут на новый стандарт памяти. Причина — высокая стоимость изменений и небольшие объёмы производства DDR5.

Выводы

Сейчас DDR5 — очень дорогое удовольствие. Модули с частотой 5200 МГц почти вдвое дороже DDR4 на 3600 МГц, при этом разницы в производительности почти нет. К тому же на рынке есть только одна платформа, которая поддерживает новый тип памяти. С i9 12-й серии дело ясное: при таких бюджетах всё возможно. Но с i5 и тем более i3 нет смысла переплачивать за новый стандарт памяти. К моменту, когда DDR5 будет давать реальное преимущество, Intel наверняка сменит процессорный разъём и сделает всё железо несовместимым.

Для i7 ситуация спорная — вряд ли он потеряет актуальность за пару лет, а стоит ли переплачивать за перспективную память сегодня, зависит от ваших приоритетов. На наш взгляд, при прочих равных излишки бюджета стоит вложить в хороший PCI-E 4.0 SSD на пару терабайт, например, тот же FURY Renegade из игровой линейки.

Узнать больше о Kingston FURY Beast DDR5

Узнать больше о PCI-E 4.0 накопителях Kingston

Поделиться ссылкой: