PS5 Pro

Una de las particularidades que tuvo la octava generación de consolas de videojuegos fue la aparición de versiones mejoradas de las consolas base en forma de PS4 Pro y Xbox One, las cuales podían ejecutar los juegos en mejores condiciones visuales y de tasa de fotogramas. Con el reciente lanzamiento de PS5 y Xbox Series X nos preguntamos si también pueden tener versiones mejoradas.

Durante la anterior generación de consolas vimos la aparición de la PS4 Pro y la Xbox One X. Ambas consolas se pensaron para poder utilizar los televisores 4K, pero sin la necesidad de desarrollar una nueva generación de consolas. Dichas iteraciones tenían un SoC totalmente nuevo, con mejores especificaciones pero totalmente compatible con las versiones estándar de PS4 y Xbox One. ¿Podemos esperar lo mismo de PS5 y de Xbox Series X?

¿Versiones mejoradas de PS5 y Xbox Series X?

PS5 Xbox

En primer lugar hemos de tener en cuenta que todo producto ha de tener una motivación para existir, dicho de otra manera, tiene que existir un motivo de compra a partir del cual se pueda construir el marketing del mismo. Lo primero que nos puede venir a la mente es la existencia de los televisores 8K, pero la potencia necesaria para mover los gráficos a esas resoluciones requeriría chips muy grandes, si se ampliará la GPU con más núcleos completos.

Lo que tiene más sentido es la mejora en la parte relacionada con la IA, es decir: el Deep Learning y el Machine Learning. Las cuales están empezando a tener una gran importancia gracias a NVIDIA, pero para lo que AMD lleva un atraso considerable, hasta el punto en que aún no han implementado unidades del tipo Tensor en sus GPU gaming.

En el caso de Microsoft tenemos las librerías DirectML, las cuales son utilizadas para algoritmos de superresolución al estilo del DLSS de NVIDIA y de cara al Denoising que se da en el Ray Tracing. En especial los algoritmos de superresolución como el DLSS por su forma de funcionar, que permiten conseguir tasas de fotogramas mayores, lo cual ayudará al rendimiento de los juegos con Ray Tracing.

Los chips son cada vez más caros de fabricar

Coste Diseño Chips

El coste de desarrollo y despliegue de los nuevos nodos de fabricación es cada vez más caro. Dichos costes se terminan cargando en el coste de las obleas que luego se utilizan para fabricar los chips. ¿Las consecuencias? Pese a que caben más transistores por mm2 el coste por área de los chips ha ido aumentando. Esto lo hemos podido ver en los SoC de las consolas de SONY, donde el de PS4 medía 348 mm2, el de PS4 Pro 324 mm2 y el de PS5 se encuentra cercano a los 290 mm2.

Todo esto se traduce que el hecho de ir añadiendo Compute Units en la GPU sea cada vez más difícil. Por suerte, el añadido de unidades para realizar el cálculo para la IA tiene un coste mucho menor que añadir más núcleos de la GPU. Gracias a ellas podemos aplicar algoritmos de Super resolución añadiendo menos del 5% de los transistores en un SoC.

TSMC 6 nm

Tanto SONY como Microsoft utilizan el nodo de 7 nm de TSMC, una iteración mejorada debería aprovechar un nodo más avanzado pero tiene el problema del sobrecoste del traslado. Las reglas de diseño de los 5 nm de TSMC no son las mismas que las de los 7 nm. Aunque es pronto para afirmar nada, el nodo perfecto tanto para SONY como para Microsoft es el de 16 nm, este les otorga el suficiente espacio para las unidades tensor al tener una densidad del 18% superior, además que permite utilizar de buena parte del diseño de los SoC de PS5 y Xbox Series X sin tener que adaptarlo a un nuevo nodo.

Zen 3+ como CPU

amd roadmap zen 3

Una ventaja que tiene la arquitectura Zen 3 es que es compatible con el controlador de memoria integrado, Scalable Data Fabric en la jerga de AMD, diseñado para Zen 2, por lo que a AMD no le costaría nada cambiar los núcleos Zen 2 del tipo Ryzen 4000 por Zen 3 de los Ryzen 5000U y Ryzen 5000H, ya que podrían hacerlo sin necesidad de cambiar el resto del hardware y sin perder compatibilidad con los juegos.

El mayor IPC de Zen 3, ayudaría a la tasa de fotogramas de los juegos o a darle más tiempo a la GPU para mejorar los gráficos. También sería clave para conseguir milisegundos extras de cara a efectos de postprocesado.

Super resolución y visión por computador

AMD Fidekity FX SuperResolution

La visión por computador necesita unidades Tensor para funcionar lo más rápido posible. La idea no es otra que enseñarle al sistema a tener ojos y a observar para sacar conclusiones sencillas. Primero debe aprender a ver formas básicas y más tarde a partir de esas formas identificar objetos, gracias a ello una IA puede hacer lo siguiente:

  • Identificar objetos.
  • Identificar tipos de letra.
  • Observar y hacer de pintor.

Los algoritmos de Super resolución como el DLSS de NVIDIA se basan en que la unidad de proceso sea capaz de ver y hacer una representación lo más aproximada posible a otra resolución. Para ello hace falta entrenar a la IA para que el sistema pueda ver. Dichos algoritmos hacen uso de la multiplicación de matrices, las cuales ven su rendimiento acelerado cuando se utilizan unidades del tipo tensor. Aunque su aplicación es posible en hardware de diferente tipo, la visión por computador para realizar efectos como el DLSS de NVIDIA o el FidelityFX Super-Resolution se ve altamente acelerada por dicho tipo de unidades.

Tensor Cores las versiones mejoradas de PS5 y Xbox SX

CDNA Compute Unit

AMD ha implementado los Tensor Cores en su arquitectura CDNA, la cual no es una GPU gaming y está dirigida al mercado de la computación de alto rendimiento y la IA. Se trata de una evolución de la arquitectura GCN en la que AMD le ha otorgado la capacidad de ejecutar instrucciones del tipo tensor. Si hacemos una observación a la arquitectura, veremos como no hay un tensor core o una NPU. ¿Cómo lo ha hecho AMD? Pues bien, la forma en la que lo ha hecho puede servir para versiones mejoradas de PS5 y Xbox Series X.

Lo primero que tenemos que entender es que las unidades Tensor en realidad son evoluciones de lo que es un array sistólico. Donde en este tipo de cadenas cada ALU tiene como dato de entrada el que ha calculado el anterior. El array sistólico se mueve en una dirección, la matriz sistólica en dos dimensiones y la unidad Tensor en tres dimensiones, pensad en cada dimensión como la dirección de las flechas en este diagrama que representa un Tensor de 4 x 4:

Tensor 4x4

Por lo que la intercomunicación entre las diferentes ALUs de la unidad tensor la podemos ordenar de la siguiente manera:

Nº de ALU 1ª Dimension 2ª Dimension 3ª Dimension
1 2 5 6
2 3 6 7
3 4 7 8
4 Salida 8 Salida
5 6 9 10
6 7 10 11
7 8 11 12
8 Salida 12 Salida
9 10 13 14
10 11 14 15
12 13 15 16
12 Salida 16 Salida
13 14 Salida Salida
14 15 Salida Salida
15 16 Salida Salida
16 Salida Salida Salida

SIMD como Tensor

¿Qué ha hecho AMD en CDNA? Pues muy sencillo, han decidido convertir las unidades SIMD también en unidades Tensor. ¿Cómo? Pues añadiendo una serie de canales de comunicación entre las 16 ALUs que forman la unidad SIMD, de tal manera que puedan actuar como una unidad Tensor sin tener que implementar una aparte en cada Compute Unit. Lo cual es ideal para la implementación de una unidad Tensor en una consola donde habrá poco espacio en el chip.

The post PS5 y Xbox Series X, ¿cómo deberían ser sus versiones mejoradas? appeared first on HardZone.