Есть ли технический предел производительности видеокарт?



Есть ли технический предел производительности видеокарт?

Есть ли технический предел производительности видеокарт? Проблема, которую мы имеем сейчас на верхних границах, заключается в огромном количестве транзисторов. Новый RTX Titan и 2080 Ti каждый имеют 18,6 миллиардов транзисторов, а у Tesla V100 — 21,1 миллиарда.

Неисправности видеокарты – признаки, которые легко обнаружить

Проблема не в огромном количестве транзисторов, а в размере кристалла. Каждый чип, который был изготовлен намного больше нормы, был очень горячим. Перемещение больших объемов данных в GPU / CPU вызывает большое нагревание, так как picoWatts расходуется каждым отдельным потоком, перетасовывающим информацию с места на место.

GPU, несмотря на их революционную концепцию, виновны в «перетасовке» огромного количества данных с места на место. Таким образом, самая сильная сторона графического процессора — его простота и масштабируемость.

В конечном счете, это становится основным ограничением, когда ядра ​​исчисляетюя тысячами. Во время сложных 4K-визуализаций экрана огромному графическому процессору, подобному RTX Titan, может потребоваться отправлять миллиард кусочков данных на ядра графического процессора и обратно за одно обновление экрана.

Есть ли технический предел производительности видеокарт?

4к GTA V

Ядра CUDA или шейдерные ядра являются основой вычислений на GPU. К сожалению, эти ядра, стремясь быть максимально эффективными, должны быть очень маленькими. И распределенными по кристаллу графического процессора.

Это требует непостижимого количества данных, передаваемых в процессе рендеринга. Ловушка 22 здесь заключается в том, что чрезвычайно эффективные ядра шейдеров могут использовать только 5% от общей потребляемой мощности графического процессора для выполнения реальных вычислений!

 Остальные 95% энергии расходуются на отправку данных туда и обратно в VRAM.

Идеальным решением было бы сделать больше вычислений за цикл выборки данных. Но это часто невозможно, поскольку новые данные, отправляемые в шейдеры, часто зависят от самых свежих данных, поступающих от шейдеров.

Уменьшение нанопроцесса

Частичное решение проблемы с электропитанием называется уменьшением нанопроцесса. Это перемещение всех компонентов на матрице ближе друг к другу, чтобы снизить энергопотребление.

Тьюринг (12 нм) был меньше по сравнению с Паскалем (16 нм), что должно повысить эффективность на 25%. И соответственно, снизить требования к охлаждению.

Для сравнения мы увидим, насколько хорошо этот принцип действует. Особенно когда в этом месяце будет выпущен 1280-ядерный GTX 1660. При той же тактовой частоте 1660 должен использовать на 25% меньше энергии, чем 1280-ядерный GTX 1060.

Что касается прогресса, то недавно выпущенный RTX 2060 среднего диапазона уже просто уничтожает флагманский GTX 780 Ti 2013 года.

Производство 10 нм не за горами — Samsung занимается этим уже более двух лет. AMD начала и закончила производство 7-нанометровых чипсетов для начальных чипов Zen 2 и Vega 7.

Инновации в кремнии и закон Мура далеко не мертвы. Но одну вещь, которую мы не можем обойти с помощью современной технологии, является размер атомов. Атомы кремния имеют диаметр 0,2 нм. Поэтому в масштабе 3 нм электронный компонент будет иметь ширину всего около 15 атомов кремния.

Даже сокращение матрицы V100 с ее 5100 ядрами CUDA и 21 миллиардом транзисторов до 7 нм было бы чудом. Чудом инженерного искусства эпических масштабов.

При таком размере он потреблял бы около 160 Вт, как нынешний RTX 2060. С 32 ГБ HBM2 он был бы ориентирован на будущее довольно долгое время. Даже без существенных изменений в его текущей архитектуре. Но это похоже на предел…

Рубрика: Видеокарты

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *