Características de la modernización nacional o aquello en lo que no vale la pena ahorrar. Guía del comprador de tarjetas gráficas para juegos La cantidad de procesadores universales afecta lo

Componentes básicos de la tarjeta de video:

  • salidas;
  • interfaces;
  • sistema de refrigeración;
  • procesador de gráficos;
  • memoria de video.

Tecnologías gráficas:

  • diccionario;
  • Arquitectura de GPU: funciones
    unidades de vértice / píxel, sombreadores, tasa de relleno, unidades de textura / ráster, tuberías;
  • Arquitectura de GPU: tecnología
    proceso técnico, frecuencia GPU, memoria de video local (tamaño, bus, tipo, frecuencia), soluciones con varias tarjetas de video;
  • funciones visuales
    DirectX, alto rango dinámico (HDR), suavizado de pantalla completa, filtrado de texturas, texturas de alta definición.

Glosario de términos gráficos básicos

Frecuencia de actualización

Al igual que en un cine o un televisor, su computadora simula el movimiento en un monitor mostrando una secuencia de fotogramas. La frecuencia de actualización del monitor indica cuántas veces por segundo se actualizará la imagen en la pantalla. Por ejemplo, 75 Hz corresponde a 75 actualizaciones por segundo.

Si la computadora procesa fotogramas más rápido de lo que puede mostrar el monitor, es posible que aparezcan problemas en los juegos. Por ejemplo, si la computadora procesa 100 cuadros por segundo y la frecuencia de actualización del monitor es de 75 Hz, debido a las superposiciones, el monitor puede mostrar solo una parte de la imagen durante su período de actualización. Como resultado, aparecen artefactos visuales.

Como solución, puede habilitar V-Sync (sincronización vertical). Limita el número de fotogramas emitidos por la computadora a la frecuencia de actualización del monitor, evitando que se produzcan artefactos. Si habilita V-Sync, la cantidad de fotogramas renderizados en el juego nunca excederá la frecuencia de actualización. Es decir, a 75 Hz, la computadora no emitirá más de 75 cuadros por segundo.

Pixel

La palabra "Pixel" significa " Foto ture el ement ”es un elemento de imagen. Es un pequeño punto en la pantalla que puede brillar en un color específico (en la mayoría de los casos, un tono se deriva de una combinación de tres colores básicos: rojo, verde y azul). Si la resolución de la pantalla es 1024 × 768, entonces puede ver una matriz de 1024 píxeles de ancho y 768 píxeles de alto. Juntos, los píxeles forman la imagen. La imagen en la pantalla se actualiza de 60 a 120 veces por segundo, dependiendo del tipo de visualización y los datos producidos por la salida de la tarjeta de video. Los monitores CRT actualizan la pantalla línea por línea, mientras que los monitores LCD de pantalla plana pueden actualizar cada píxel individualmente.

Vértice

Todos los objetos de la escena 3D están compuestos por vértices. Un vértice es un punto en un espacio tridimensional con coordenadas X, Y y Z. Se pueden agrupar varios vértices en un polígono: la mayoría de las veces es un triángulo, pero también son posibles formas más complejas. Luego se aplica una textura al polígono, lo que hace que el objeto parezca realista. El cubo 3D que se muestra en la ilustración de arriba tiene ocho vértices. Los objetos más complejos tienen superficies curvas, que en realidad consisten en una gran cantidad de vértices.

Textura

Una textura es simplemente una imagen 2D de cualquier tamaño que se superpone a un objeto 3D para simular su superficie. Por ejemplo, nuestro cubo 3D tiene ocho vértices. Antes del mapeo de texturas, parece una caja simple. Pero cuando aplicamos la textura, la caja se vuelve coloreada.

Shader

Los programas de sombreado de píxeles permiten que la tarjeta gráfica produzca efectos impresionantes, como el agua en Elder Scrolls: Oblivion.

Hoy en día existen dos tipos de sombreadores: vértice y píxel. Los sombreadores de vértices pueden modificar o transformar objetos 3D. Los sombreadores de píxeles le permiten cambiar los colores de los píxeles en función de los datos. Imagine una fuente de luz en una escena 3D que hace que los objetos iluminados brillen más mientras proyecta sombras sobre otros objetos al mismo tiempo. Todo esto se realiza cambiando la información de color de los píxeles.

Los sombreadores de píxeles se utilizan para crear efectos complejos en tus juegos favoritos. Por ejemplo, el código de sombreado puede hacer que los píxeles que rodean la espada 3D brillen más. Otro sombreador puede procesar todos los vértices de un objeto 3D complejo y simular una explosión. Los desarrolladores de juegos recurren cada vez más a sombreadores sofisticados para crear gráficos realistas. Casi todos los juegos modernos con gráficos ricos usan sombreadores.

Con el lanzamiento de la próxima interfaz de programación de aplicaciones (API) de Microsoft DirectX 10, habrá un tercer tipo de sombreador llamado sombreadores de geometría. Con su ayuda, será posible romper objetos, modificarlos e incluso destruirlos, según el resultado deseado. El tercer tipo de sombreador se puede programar de la misma forma que los dos primeros, pero su función será diferente.

Tasa de relleno

Muy a menudo, en la caja con una tarjeta de video, puede encontrar el valor de la tasa de relleno. Básicamente, la tasa de relleno indica qué tan rápido la GPU puede entregar píxeles. En las tarjetas de video más antiguas, puede encontrar la tasa de relleno del triángulo. Pero hoy en día existen dos tipos de velocidad de relleno: velocidad de relleno de píxeles y velocidad de relleno de textura. Como se mencionó, la tasa de relleno de píxeles corresponde a la tasa de salida de píxeles. Se calcula como el número de operaciones ráster (ROP) multiplicado por la frecuencia del reloj.

ATi y nVidia calculan las tasas de relleno de textura de manera diferente. nVidia cree que la velocidad se obtiene multiplicando el número de canalizaciones de píxeles por la velocidad del reloj. ATi multiplica el número de unidades de textura por la velocidad del reloj. En principio, ambos métodos son correctos, ya que nVidia usa una unidad de textura por unidad de sombreado de píxeles (es decir, una por canalización de píxeles).

Con estas definiciones en mente, permítanme continuar y discutir las funciones más importantes de una GPU, qué hacen y por qué son tan importantes.

Arquitectura de GPU: características

El realismo de los gráficos 3D depende en gran medida del rendimiento de la tarjeta de video. Cuantos más bloques de sombreadores de píxeles contenga el procesador y mayor sea la frecuencia, más efectos se pueden aplicar a una escena 3D para mejorar su percepción visual.

La GPU contiene muchos bloques funcionales diferentes. Por la cantidad de algunos componentes, puede estimar qué tan poderosa es la GPU. Antes de continuar, déjame ver los bloques funcionales más importantes.

Procesadores de vértices (unidades de sombreado de vértices)

Al igual que las unidades de sombreado de píxeles, los procesadores de vértices ejecutan código de sombreado que toca los vértices. Dado que un mayor presupuesto de vértices le permite crear objetos 3D más complejos, el rendimiento de los procesadores de vértices es muy importante en escenas 3D con objetos complejos o una gran cantidad de ellos. Sin embargo, las unidades de sombreado de vértices todavía no afectan el rendimiento de manera tan obvia como los procesadores de píxeles.

Procesadores de píxeles (unidades de sombreado de píxeles)

Un procesador de píxeles es un componente del chip gráfico dedicado al procesamiento de programas de sombreado de píxeles. Estos procesadores realizan cálculos de solo píxeles. Debido a que los píxeles contienen información de color, los sombreadores de píxeles pueden lograr efectos gráficos impresionantes. Por ejemplo, la mayoría de los efectos de agua que ha visto en los juegos se crean utilizando sombreadores de píxeles. Normalmente, el número de procesadores de píxeles se utiliza para comparar el rendimiento de píxeles de las tarjetas de video. Si una tarjeta está equipada con ocho unidades de sombreado de píxeles y la otra con 16 unidades, entonces es bastante lógico suponer que una tarjeta de video con 16 unidades procesará programas de píxeles complejos más rápido. También debe considerar la velocidad del reloj, pero hoy en día duplicar el número de procesadores de píxeles es más eficiente energéticamente que duplicar la frecuencia del chip gráfico.

Sombreadores unificados

Los sombreadores unificados aún no han llegado al mundo de las PC, pero el próximo estándar DirectX 10 se basa en una arquitectura similar. Es decir, la estructura del código de los programas de vértices, geométricos y píxeles será la misma, aunque los sombreadores realizarán trabajos diferentes. La nueva especificación se puede ver en la Xbox 360, donde la GPU fue diseñada especialmente por ATi para Microsoft. Será bastante interesante ver qué potencial tiene el nuevo DirectX 10.

Unidades de mapeo de texturas (TMU)

Las texturas deben seleccionarse y filtrarse. Este trabajo se realiza mediante unidades de mapeo de texturas, que funcionan en conjunto con unidades de sombreado de vértices y píxeles. El trabajo de TMU es aplicar operaciones de textura a los píxeles. La cantidad de unidades de textura en una GPU se usa a menudo para comparar el rendimiento de textura de las tarjetas de video. Es bastante razonable suponer que una tarjeta de video con un mayor número de TMU proporcionará un mayor rendimiento de textura.

Unidades de operador ráster (ROP)

Los RIP son responsables de escribir datos de píxeles en la memoria. La tasa a la que se realiza esta operación es la tasa de llenado. En los primeros días de los aceleradores 3D, los ROP y las tasas de relleno eran características muy importantes de las tarjetas gráficas. Hoy en día, el rendimiento de ROP sigue siendo importante, pero el rendimiento de una tarjeta de video ya no está limitado por estos bloques, como solía estarlo. Por lo tanto, el rendimiento (y el número) de ROP ya se usa raramente para estimar la velocidad de una tarjeta de video.

Transportadores

Las canalizaciones se utilizan para describir la arquitectura de las tarjetas de video y proporcionan una representación muy visual del rendimiento de la GPU.

Transportador no es un término técnico estricto. La GPU utiliza diferentes canalizaciones que realizan diferentes funciones. Históricamente, una tubería se entendía como un procesador de píxeles que estaba conectado a su propia unidad de mapeo de texturas (TMU). Por ejemplo, la tarjeta de video Radeon 9700 usa ocho procesadores de píxeles, cada uno de los cuales está conectado a su propia TMU, por lo que se considera que la tarjeta tiene ocho tuberías.

Pero es muy difícil describir los procesadores modernos por la cantidad de tuberías. En comparación con los diseños anteriores, los nuevos procesadores utilizan una estructura modular fragmentada. ATi puede considerarse un innovador en esta área, que, con la línea de tarjetas de video X1000, cambió a una estructura modular, lo que hizo posible lograr ganancias de rendimiento a través de la optimización interna. Algunos bloques de CPU se utilizan más que otros, y para mejorar el rendimiento de la GPU, ATi trató de encontrar un compromiso entre el número de bloques necesarios y el área de la matriz (no se puede aumentar demasiado). En esta arquitectura, el término "canalización de píxeles" ha perdido su significado, ya que los procesadores de píxeles ya no están conectados a sus propias TMU. Por ejemplo, la GPU ATi Radeon X1600 tiene 12 Pixel Shaders y solo cuatro TMU. Por tanto, no se puede decir que la arquitectura de este procesador tenga pipelines de 12 píxeles, al igual que decir que solo hay cuatro de ellos. Sin embargo, por tradición, todavía se mencionan las canalizaciones de píxeles.

Teniendo en cuenta estas suposiciones, la cantidad de canalizaciones de píxeles en una GPU se usa a menudo para comparar tarjetas de video (con la excepción de la línea ATi X1x00). Por ejemplo, si tomamos tarjetas de video con 24 y 16 canalizaciones, entonces es bastante razonable suponer que una tarjeta con 24 canalizaciones será más rápida.

Arquitectura de GPU: tecnología

Proceso técnico

Este término se refiere al tamaño de un elemento (transistor) del chip y la precisión del proceso de fabricación. Mejorar los procesos técnicos le permite obtener elementos más pequeños. Por ejemplo, el proceso de 0,18 micrones produce elementos más grandes que el proceso de 0,13 micrones, por lo que no es tan eficiente. Los transistores más pequeños funcionan con voltajes más bajos. A su vez, una disminución de voltaje conduce a una disminución de la resistencia térmica, lo que da lugar a una disminución de la cantidad de calor generado. La mejora de la tecnología de proceso permite reducir la distancia entre los bloques funcionales del chip y la transferencia de datos lleva menos tiempo. Las distancias más cortas, los voltajes más bajos y otras mejoras permiten alcanzar velocidades de reloj más altas.

La comprensión es algo complicada por el hecho de que hoy en día se utilizan tanto micrómetros (μm) como nanómetros (nm) para denotar el proceso técnico. De hecho, todo es muy simple: 1 nanómetro es igual a 0,001 micrómetros, por lo que los procesos técnicos de 0,09 micrones y 90 nm son lo mismo. Como se señaló anteriormente, una tecnología de proceso más pequeña le permite obtener velocidades de reloj más altas. Por ejemplo, si comparamos tarjetas de video con chips de 0.18 micrones y 0.09 micrones (90 nm), entonces es bastante razonable esperar una frecuencia más alta de una tarjeta de 90 nm.

Velocidad de reloj de la GPU

Las velocidades de reloj de la GPU se miden en megahercios (MHz), que son millones de ciclos de reloj por segundo.

La velocidad del reloj afecta directamente el rendimiento de la GPU. Cuanto más alto sea, más trabajo se puede hacer en un segundo. Para el primer ejemplo, tomemos las tarjetas gráficas nVidia GeForce 6600 y 6600 GT: la GPU 6600 GT funciona a 500 MHz, mientras que la tarjeta 6600 normal funciona a 400 MHz. Dado que los procesadores son técnicamente idénticos, un aumento del 20% en la velocidad de reloj del 6600 GT se traduce en un mejor rendimiento.

Pero la velocidad del reloj no lo es todo. Debe tenerse en cuenta que la arquitectura afecta en gran medida el rendimiento. Para el segundo ejemplo, tomemos las tarjetas de video GeForce 6600 GT y GeForce 6800 GT. El 6600 GT tiene una frecuencia de GPU de 500 MHz, pero el 6800 GT solo funciona a 350 MHz. Ahora tengamos en cuenta que el 6800 GT usa tuberías de 16 píxeles, mientras que el 6600 GT usa solo ocho. Por lo tanto, un 6800 GT con 16 canales a 350 MHz dará aproximadamente el mismo rendimiento que un procesador con ocho canales y el doble de velocidad de reloj (700 MHz). Dicho esto, la velocidad del reloj se puede utilizar para comparar el rendimiento.

Memoria de video local

La memoria de la tarjeta de video tiene un gran impacto en el rendimiento. Pero los diferentes parámetros de la memoria afectan de diferentes maneras.

Tamaño de la memoria de video

La cantidad de memoria de video probablemente se puede llamar el parámetro más sobrevalorado de una tarjeta de video. Los consumidores sin experiencia a menudo usan la cantidad de memoria de video para comparar diferentes tarjetas entre sí, pero en realidad, la cantidad tiene poco efecto en el rendimiento en comparación con parámetros como la frecuencia y la interfaz del bus de memoria (ancho del bus).

En la mayoría de los casos, una tarjeta con 128 MB de memoria de video funcionará casi igual que una tarjeta con 256 MB. Por supuesto, hay situaciones en las que más memoria conduce a un mayor rendimiento, pero recuerde que más memoria no conducirá automáticamente a un aumento de la velocidad en los juegos.

Donde el volumen es útil es en los juegos con texturas de alta resolución. Los desarrolladores de juegos proporcionan varios conjuntos de texturas para el juego. Y cuanta más memoria haya en la tarjeta de video, mayor resolución pueden tener las texturas cargadas. Las texturas de alta resolución brindan una mayor definición y detalle en el juego. Por lo tanto, es bastante razonable tomar una tarjeta con una gran cantidad de memoria si todos los demás criterios son los mismos. Permítanos recordarle una vez más que el ancho del bus de memoria y su frecuencia tienen un efecto mucho más fuerte en el rendimiento que la cantidad de memoria física en la tarjeta.

Ancho del bus de memoria

El ancho del bus de memoria es uno de los aspectos más importantes del rendimiento de la memoria. Los buses modernos tienen un ancho de 64 a 256 bits y, en algunos casos, incluso 512 bits. Cuanto más ancho sea el bus de memoria, más información puede transmitir por ciclo de reloj. Y esto afecta directamente al rendimiento. Por ejemplo, si tomamos dos buses con frecuencias iguales, entonces, teóricamente, un bus de 128 bits transferirá el doble de datos por reloj que uno de 64 bits. Y el bus de 256 bits es dos veces más grande.

Un mayor ancho de banda de bus (expresado en bits o bytes por segundo, 1 byte = 8 bits) da como resultado un mayor rendimiento de la memoria. Por eso el bus de memoria es mucho más importante que su tamaño. ¡A iguales frecuencias, el bus de memoria de 64 bits opera a una velocidad de solo el 25% del de 256 bits!

Tomemos el siguiente ejemplo. Una tarjeta de video con 128 MB de memoria de video, pero con un bus de 256 bits, ofrece un rendimiento de memoria mucho mayor que un modelo de 512 MB con un bus de 64 bits. Es importante señalar que para algunas tarjetas ATi X1x00 los fabricantes indican las especificaciones del bus de memoria interna, pero nos interesan los parámetros del bus externo. Por ejemplo, el bus de anillo interno del X1600 tiene 256 bits de ancho, pero el externo solo tiene 128 bits de ancho. Y, en realidad, el bus de memoria funciona con un rendimiento de 128 bits.

Tipos de memoria

La memoria se puede dividir en dos categorías principales: SDR (transferencia de datos única) y DDR (transferencia de datos doble), en la que los datos se transfieren dos veces más rápido por reloj. Hoy en día, la tecnología de transmisión única SDR está obsoleta. Dado que la memoria DDR transfiere datos dos veces más rápido que la memoria SDR, es importante recordar que las tarjetas de video con memoria DDR generalmente se indican al doble de frecuencia, y no al físico. Por ejemplo, si la memoria DDR aparece como 1000 MHz, esta es la frecuencia efectiva a la que debe operar la memoria SDR normal para proporcionar el mismo ancho de banda. De hecho, la frecuencia física es de 500 MHz.

Por ello, muchos se sorprenden cuando se indica la frecuencia de 1200 MHz DDR para la memoria de su tarjeta de video, y las utilidades reportan 600 MHz. Entonces tienes que acostumbrarte. La memoria DDR2 y GDDR3 / GDDR4 funciona de la misma manera, es decir, con el doble de transferencia de datos. La diferencia entre DDR, DDR2, GDDR3 y GDDR4 radica en la tecnología de fabricación y algunos detalles. DDR2 puede funcionar a frecuencias más altas que la memoria DDR, y DDR3 puede funcionar incluso más alto que DDR2.

Frecuencia del bus de memoria

Como un procesador, la memoria (o más precisamente, un bus de memoria) opera a velocidades de reloj específicas, medidas en megahercios. Aquí, el aumento de la velocidad del reloj afecta directamente al rendimiento de la memoria. Y la frecuencia del bus de memoria es uno de los parámetros que se utilizan para comparar el rendimiento de las tarjetas de video. Por ejemplo, si todas las demás características (ancho del bus de memoria, etc.) son las mismas, entonces es bastante lógico decir que una tarjeta de video con memoria de 700 MHz es más rápida que una de 500 MHz.

Una vez más, la velocidad del reloj no lo es todo. Una memoria de 700 MHz con un bus de 64 bits será más lenta que una memoria de 400 MHz con un bus de 128 bits. El rendimiento de la memoria de 400 MHz en un bus de 128 bits es aproximadamente equivalente a la memoria de 800 MHz en un bus de 64 bits. También debe recordarse que las frecuencias de la GPU y la memoria son parámetros completamente diferentes y, por lo general, difieren.

Interfaz de tarjeta gráfica

Todos los datos transferidos entre la tarjeta de video y el procesador pasan por la interfaz de la tarjeta de video. Hoy en día, se utilizan tres tipos de interfaces para tarjetas de video: PCI, AGP y PCI Express. Se diferencian en el ancho de banda y otras características. Está claro que cuanto mayor sea el ancho de banda, mayor será el tipo de cambio. Sin embargo, solo las tarjetas más modernas pueden usar un gran ancho de banda, e incluso así solo parcialmente. En algún momento, la velocidad de la interfaz ha dejado de ser un "cuello de botella", hoy es simplemente suficiente.

El bus más lento para el que se produjeron las tarjetas de video es PCI (Peripheral Components Interconnect). Si no te adentras en la historia, claro. PCI realmente dañó el rendimiento de las tarjetas de video, por lo que cambiaron a la interfaz AGP (Puerto de gráficos acelerado). Pero incluso las especificaciones AGP 1.0 y 2x limitaron el rendimiento. Cuando el estándar aumentó la velocidad a AGP 4x, comenzamos a acercarnos al límite práctico del ancho de banda que pueden usar las tarjetas de video. La especificación AGP 8x duplicó el ancho de banda una vez más en comparación con AGP 4x (2,16 GB / s), pero no obtuvimos un aumento tangible en el rendimiento gráfico.

El bus más nuevo y más rápido es PCI Express. Las tarjetas gráficas más nuevas suelen utilizar la interfaz PCI Express x16, que combina 16 carriles PCI Express para un ancho de banda total de 4 GB / s (una dirección). Esto es el doble del ancho de banda de AGP 8x. El bus PCI Express proporciona el ancho de banda mencionado para ambas direcciones (transferencia de datos hacia y desde la tarjeta de video). Pero la velocidad del estándar AGP 8x ya era suficiente, por lo que aún no hemos encontrado una situación en la que la transición a PCI Express haya dado un aumento de rendimiento en comparación con AGP 8x (si otros parámetros de hardware son los mismos). Por ejemplo, la versión AGP de GeForce 6800 Ultra funcionará de manera idéntica a la 6800 Ultra para PCI Express.

Hoy en día es mejor comprar una tarjeta con interfaz PCI Express, se mantendrá en el mercado durante varios años más. Las tarjetas más productivas ya no están disponibles con la interfaz AGP 8x, y las soluciones PCI Express, por regla general, son más fáciles de encontrar que las análogas AGP y cuestan menos.

Soluciones multi-GPU

El uso de varias tarjetas gráficas para aumentar el rendimiento de los gráficos no es una idea nueva. En los primeros días de los gráficos 3D, 3dfx ingresó al mercado con dos tarjetas gráficas funcionando en paralelo. Pero con la desaparición de 3dfx, la tecnología de colaboración de varias tarjetas de video de consumo quedó relegada al olvido, aunque ATi ha estado lanzando sistemas similares para simuladores profesionales desde el lanzamiento de la Radeon 9700. Hace un par de años, la tecnología volvió a la mercado: con la llegada de las soluciones nVidia SLI y, un poco más tarde, ATi Crossfire.

Compartir varias tarjetas gráficas proporciona un rendimiento suficiente para ejecutar el juego en configuraciones de alta calidad en alta definición. Pero elegir una solución u otra no es tan fácil.

Para empezar, las soluciones basadas en múltiples tarjetas de video requieren mucha energía, por lo que la fuente de alimentación debe ser lo suficientemente potente. Todo este calor deberá eliminarse de la tarjeta de video, por lo que debe prestar atención a la carcasa de la PC y al enfriamiento para que el sistema no se sobrecaliente.

Además, recuerde que SLI / CrossFire requiere una placa base adecuada (ya sea para una tecnología u otra), que generalmente cuesta más que los modelos estándar. La configuración de nVidia SLI solo funcionará en ciertas placas nForce4, y las tarjetas ATi CrossFire solo funcionarán en placas base con el chipset CrossFire o en ciertos modelos Intel. Para complicar las cosas, algunas configuraciones de CrossFire requieren que una de las tarjetas sea especial: la Edición CrossFire. Tras el lanzamiento de CrossFire para algunos modelos de tarjetas de video, ATi permitió la inclusión de la tecnología de colaboración a través del bus PCI Express, y con el lanzamiento de nuevas versiones de controladores, aumenta el número de combinaciones posibles. Pero aún así, el hardware CrossFire con la correspondiente tarjeta CrossFire Edition ofrece un mejor rendimiento. Pero las tarjetas CrossFire Edition también son más caras que los modelos normales. Por ahora, puede habilitar el modo de software CrossFire (sin tarjeta CrossFire Edition) en tarjetas gráficas Radeon X1300, X1600 y X1800 GTO.

Hay otros factores a considerar. Si bien dos tarjetas gráficas que trabajan juntas aumentan el rendimiento, está lejos de duplicarse. Pero darás el doble de dinero. Muy a menudo, la ganancia de productividad es del 20 al 60%. Y en algunos casos, debido a los costos computacionales adicionales para la conciliación, no hay ganancia en absoluto. Por esta razón, es poco probable que las configuraciones de múltiples tarjetas se justifiquen con modelos más baratos, ya que una tarjeta de video más cara siempre superará a un par de tarjetas más baratas. En general, no tiene sentido adoptar una solución SLI / CrossFire para la mayoría de los consumidores. Pero si desea activar todas las opciones de mejora de la calidad o jugar a resoluciones extremas, por ejemplo, 2560 × 1600, cuando necesita renderizar más de 4 millones de píxeles por cuadro, entonces no puede prescindir de dos o cuatro tarjetas de video emparejadas.

Funciones visuales

Además de las especificaciones puramente de hardware, las diferentes generaciones y modelos de GPU pueden diferir en el conjunto de funciones. Por ejemplo, a menudo se dice que las tarjetas de la generación ATi Radeon X800 XT son compatibles con Shader Model 2.0b (SM), mientras que la nVidia GeForce 6800 Ultra es compatible con SM 3.0, aunque sus especificaciones de hardware son cercanas entre sí (16 oleoductos). Por tanto, muchos consumidores optan por una solución u otra, sin siquiera saber qué significa esta diferencia.

Versiones de Microsoft DirectX y Shader Model

Estos nombres se utilizan con mayor frecuencia en controversias, pero pocas personas saben lo que realmente significan. Para comprenderlo, comencemos con un historial de las API de gráficos. DirectX y OpenGL son API gráficas o interfaces de programación de aplicaciones, estándares de código abierto disponibles para todos.

Antes de la llegada de las API de gráficos, cada fabricante de GPU usaba su propio mecanismo para comunicarse con los juegos. Los desarrolladores tenían que escribir un código separado para cada GPU que querían admitir. Un enfoque muy caro e ineficaz. Para resolver este problema, se desarrollaron API para gráficos 3D para que los desarrolladores pudieran escribir código para una API específica y no para una tarjeta de video en particular. Después de eso, los problemas de compatibilidad recayeron sobre los hombros de los fabricantes de tarjetas de video, quienes tuvieron que asegurarse de que los controladores fueran compatibles con la API.

La única complicación es que hoy en día existen dos API diferentes, a saber, Microsoft DirectX y OpenGL, donde GL significa Biblioteca de gráficos. Dado que la API de DirectX es más popular en los juegos de hoy, nos centraremos en ella. Y este estándar influyó más fuertemente en el desarrollo de juegos.

DirectX es una creación de Microsoft. De hecho, DirectX incluye varias API, de las cuales solo una se utiliza para gráficos 3D. DirectX incluye API para sonido, música, dispositivos de entrada y más. La API de Direct3D es responsable de los gráficos 3D en DirectX. Cuando hablan de tarjetas de video, lo dicen en serio, por lo tanto, en este sentido, los conceptos de DirectX y Direct3D son intercambiables.

DirectX se actualiza periódicamente a medida que avanza la tecnología de gráficos y los desarrolladores de juegos introducen nuevas formas de programar juegos. A medida que la popularidad de DirectX se disparó, los fabricantes de GPU comenzaron a ajustar nuevos lanzamientos de productos para que coincidieran con las capacidades de DirectX. Por esta razón, las tarjetas de video a menudo están vinculadas al soporte de hardware para una u otra generación de DirectX (DirectX 8, 9.0 o 9.0c).

Para complicar las cosas, partes de la API de Direct3D pueden cambiar con el tiempo, sin cambiar las generaciones de DirectX. Por ejemplo, la especificación DirectX 9.0 especifica la compatibilidad con Pixel Shader 2.0. Pero la actualización de DirectX 9.0c incluye Pixel Shader 3.0. Por lo tanto, aunque las tarjetas están clasificadas como DirectX 9, pueden admitir diferentes conjuntos de funciones. Por ejemplo, la Radeon 9700 es compatible con Shader Model 2.0 y la Radeon X1800 es compatible con Shader Model 3.0, aunque ambas tarjetas pueden atribuirse a la generación DirectX 9.

Recuerde que al crear nuevos juegos, los desarrolladores tienen en cuenta a los propietarios de máquinas antiguas y tarjetas de video, porque si ignora este segmento de usuarios, el nivel de ventas será menor. Por esta razón, en los juegos se integran múltiples rutas de código. Un juego de clase DirectX 9 probablemente tenga una ruta DirectX 8 para compatibilidad e incluso una ruta DirectX 7. Por lo general, si elige la ruta anterior, algunos efectos virtuales que están en las nuevas tarjetas de video desaparecen en el juego. Pero al menos puedes jugar incluso con el hardware antiguo.

Muchos juegos nuevos requieren la instalación de la última versión de DirectX, incluso si la tarjeta gráfica es de la generación anterior. Es decir, un nuevo juego que usará la ruta de DirectX 8 aún requiere la instalación de la última versión de DirectX 9 para una tarjeta de video de clase DirectX 8.

¿Cuáles son las diferencias entre las diferentes versiones de la API de Direct3D en DirectX? Las primeras versiones de DirectX (3, 5, 6 y 7) eran relativamente simples en términos de las API de Direct3D. Los desarrolladores pueden seleccionar efectos visuales de una lista y luego probar su rendimiento en el juego. El siguiente paso importante en la programación de gráficos fue DirectX 8. Introdujo la capacidad de programar una tarjeta de video usando sombreadores, por lo que los desarrolladores tuvieron por primera vez la libertad de programar efectos de la manera que quisieran. Pixel Shader 1.0 a 1.3 y Vertex Shader 1.0 compatible con DirectX 8. DirectX 8.1, una versión actualizada de DirectX 8, recibió Pixel Shader 1.4 y Vertex Shader 1.1.

En DirectX 9, puede crear programas de sombreado aún más complejos. DirectX 9 es compatible con Pixel Shader 2.0 y Vertex Shader 2.0. DirectX 9c, una versión actualizada de DirectX 9, incluye la especificación Pixel Shader 3.0.

DirectX 10, la próxima versión de la API, acompañará a la nueva versión de Windows Vista. No podrá instalar DirectX 10 en Windows XP.

Iluminación HDR y OpenEXR HDR

HDR son las siglas de High Dynamic Range, alto rango dinámico. Jugar con iluminación HDR puede producir una imagen mucho más realista que jugar sin ella, y no todas las tarjetas gráficas admiten iluminación HDR.

Antes de la llegada de las tarjetas gráficas DirectX 9, las GPU estaban seriamente limitadas por la precisión de los cálculos de iluminación. Hasta ahora, la iluminación solo se podía calcular con niveles internos de 256 (8 bits).

Cuando se introdujeron las tarjetas gráficas DirectX 9, pudieron producir iluminación de alta fidelidad: 24 bits completos o 16,7 millones de niveles.

Con 16,7 millones de niveles y el siguiente paso en el rendimiento de gráficos de DirectX 9 / Shader Model 2.0, la iluminación HDR ahora es posible en las computadoras. Esta es una tecnología bastante compleja y debe observarla en dinámica. En términos simples, la iluminación HDR aumenta el contraste (los tonos oscuros aparecen más oscuros, los tonos claros más brillantes), mientras que al mismo tiempo aumenta la cantidad de detalles de iluminación en áreas oscuras y claras. Jugar con iluminación HDR se siente más vivo y realista que sin ella.

Las GPU que cumplen con la última especificación Pixel Shader 3.0 permiten una iluminación de mayor precisión de 32 bits y una combinación de punto flotante. Por lo tanto, las tarjetas de video de la clase SM 3.0 pueden admitir el método de iluminación especial OpenEXR HDR, especialmente diseñado para la industria cinematográfica.

Algunos juegos que solo admiten iluminación HDR mediante OpenEXR no funcionarán con iluminación HDR en tarjetas gráficas Shader Model 2.0. Sin embargo, los juegos que no se basan en el método OpenEXR funcionarán en cualquier tarjeta gráfica DirectX 9. Por ejemplo, Oblivion usa el método OpenEXR HDR y solo permite la iluminación HDR en las últimas tarjetas gráficas que admiten la especificación Shader Model 3.0. Por ejemplo, nVidia GeForce 6800 o ATi Radeon X1800. Los juegos que usan el motor Half-Life 2 3D, el mismo Counter-Strike: Source y el próximo Half-Life 2: Aftermath, te permiten habilitar el renderizado HDR en tarjetas de video DirectX 9 más antiguas que solo son compatibles con Pixel Shader 2.0. Los ejemplos incluyen la línea GeForce 5 o la ATi Radeon 9500.

Finalmente, tenga en cuenta que todas las formas de renderizado HDR requieren una gran potencia de procesamiento y pueden poner de rodillas incluso a las GPU más potentes. Si quieres jugar a los juegos más recientes con iluminación HDR, los gráficos de alto rendimiento son esenciales.

Anti-aliasing de pantalla completa

El suavizado de pantalla completa (AA abreviado) le permite eliminar las características "escaleras" en los límites de los polígonos. Sin embargo, debe tenerse en cuenta que el suavizado de pantalla completa consume una gran cantidad de recursos informáticos, lo que conduce a una caída en la velocidad de fotogramas.

El suavizado depende en gran medida del rendimiento de la memoria de video, por lo que una tarjeta de video de alta velocidad con memoria rápida podrá renderizar el suavizado de pantalla completa con menos daño al rendimiento que una tarjeta de video económica. El suavizado se puede habilitar en varios modos. Por ejemplo, el anti-aliasing 4x dará una mejor calidad de imagen que el anti-aliasing 2x, pero esto será un gran éxito en el rendimiento. Si el suavizado 2x duplica la resolución horizontal y vertical, el modo 4x la cuadriplica.

Filtrado de texturas

Las texturas se aplican a todos los objetos 3D del juego, y cuanto mayor sea el ángulo de la superficie mostrada, más distorsionada se verá la textura. Para eliminar este efecto, las GPU utilizan el filtrado de texturas.

El primer método de filtración se denominó bilineal y produjo rayas características que no eran muy agradables a la vista. La situación ha mejorado con la introducción del filtrado trilineal. Ambas opciones funcionan en tarjetas gráficas modernas con poca o ninguna pérdida de rendimiento.

La mejor forma de filtrar texturas hoy en día es el filtrado anisotrópico (AF). Al igual que el suavizado de pantalla completa, el filtrado anisotrópico se puede habilitar en diferentes niveles. Por ejemplo, 8x AF proporciona un filtrado de mayor calidad que 4x AF. Al igual que el suavizado de pantalla completa, el filtrado anisotrópico requiere una cierta cantidad de potencia de procesamiento, que aumenta a medida que aumenta el nivel de AF.

Texturas de alta resolución

Todos los juegos 3D se crean con especificaciones específicas en mente, y uno de esos requisitos determina la memoria de textura que necesitará un juego. Todas las texturas necesarias deben caber en la memoria de la tarjeta de video durante el juego, de lo contrario el rendimiento caerá drásticamente, ya que acceder a la textura en la RAM da un retraso considerable, sin mencionar el archivo de paginación en el disco duro. Por lo tanto, si un desarrollador de juegos cuenta con 128 MB de memoria de video como requisito mínimo, entonces el conjunto de texturas activas no debe exceder los 128 MB en ningún momento.

Los juegos modernos tienen varios conjuntos de texturas, por lo que el juego se ejecutará sin problemas en tarjetas de video más antiguas con menos memoria de video, así como en tarjetas más nuevas con más memoria de video. Por ejemplo, un juego puede contener tres conjuntos de texturas: 128 MB, 256 MB y 512 MB. Hay muy pocos juegos que admitan 512 MB de memoria de video en la actualidad, pero siguen siendo la razón más objetiva para comprar una tarjeta de video con esta cantidad de memoria. Aunque el aumento de memoria tiene poco o ningún efecto sobre el rendimiento, obtendrás una mejor calidad visual si el juego admite el conjunto de texturas adecuado.

¿Qué necesitas saber sobre las tarjetas gráficas?

En contacto con

En nuestro foro, decenas de personas cada día piden consejos sobre la modernización de los suyos, en los que les ayudamos de buen grado. Todos los días, "evaluando el ensamblaje" y comprobando la compatibilidad de los componentes seleccionados por nuestros clientes, comenzamos a notar que los usuarios están prestando atención principalmente a otros componentes, sin duda, importantes. Y rara vez alguien recuerda que al actualizar una computadora, es imperativo actualizar un detalle igualmente importante:. Y hoy te contamos y mostramos por qué no debes olvidarlo.

“… Quiero actualizar mi computadora, todo estaba volando, compré un porcentaje de i7-3970X y una madre ASRock X79 Extreme6, además de un vidyahu RADEON HD 7990 de 6GB. ¿Qué más nan ???? 777 "
- así es como comienzan aproximadamente la mitad de todos los mensajes relacionados con la actualización de una computadora estacionaria. Según su presupuesto o el de su familia, los usuarios intentan elegir los módulos de memoria más ágiles y atractivos. Al mismo tiempo, creyendo ingenuamente que su antiguo 450W se las arreglará con una tarjeta de video glotona y un procesador "caliente" durante el overclocking al mismo tiempo.

Por nuestra parte, ya hemos escrito sobre la importancia de la fuente de alimentación más de una vez, pero, lo confesamos, probablemente no fue lo suficientemente claro. Por lo tanto, hoy nos hemos corregido y hemos preparado para usted una nota sobre lo que sucederá si se olvida de actualizar su PC, con imágenes y descripciones detalladas.

Entonces, decidimos actualizar la configuración ...


Para nuestro experimento, decidimos tomar una computadora promedio completamente nueva y actualizarla al nivel de una "máquina de juego". No tendrás que cambiar mucho la configuración, bastará con cambiar la memoria y la tarjeta de video para que tengamos la oportunidad de jugar juegos más o menos modernos con ajustes de detalle decentes. La configuración inicial de nuestro equipo es la siguiente:

Fuente de alimentación: ATX 12V 400W

Está claro que esta configuración es bastante débil para los juegos, por decirlo suavemente. ¡Es hora de cambiar algo! Comenzaremos con lo mismo con lo que la mayoría de las personas ansiosas por una "actualización" comienzan: p. No cambiaremos la placa base, siempre que nos convenga.

Como decidimos no tocar la placa base, seleccionaremos un zócalo compatible con FM2 (afortunadamente, para esto hay un botón especial en el sitio web de NIKS en la página de descripción de la placa base). No seamos codiciosos, tomemos un procesador asequible pero rápido y potente con una frecuencia de 4,1 GHz (hasta 4,4 GHz en modo Turbo CORE) y un multiplicador desbloqueado; también nos encanta el "overclock", nada humano es ajeno a nosotros. Aquí están las especificaciones para nuestro procesador elegido:

Caracteristicas
Frecuencia del bus de la CPU 5000 MHz Disipación de potencia 100 vatios Frecuencia del procesador 4,1 GHz o hasta 4,4 GHz en modo Turbo CORE Centro Richland Caché L1 96 KB x2 Caché L2 2048 KB x2, sincronizados a la frecuencia del procesador Soporte de 64 bits Numero de nucleos 4 Multiplicación 41, multiplicador desbloqueado Núcleo de video del procesador AMD Radeon HD 8670D a 844 MHz; Compatibilidad con Shader Model 5 RAM máxima 64 GB Max. número de monitores conectados 3 monitores conectados directamente o hasta 4 monitores mediante divisores DisplayPort

Una barra de 4GB no es nuestra elección. En primer lugar, queremos 16GB, y en segundo lugar, necesitamos usar un modo de operación de dos canales, para lo cual instalaremos dos módulos de memoria con una capacidad de 8GB cada uno en nuestro equipo. El alto rendimiento, la falta de radiadores y un precio decente los convierten en la opción más "sabrosa" para nosotros. Además, desde el sitio web de AMD, puede descargar el programa Radeon RAMDisk, que nos permitirá crear una unidad virtual súper rápida de hasta 6GB gratis absolutamente gratis, y a todos les encantan las cosas útiles y gratuitas.


Caracteristicas
Memoria 8 GB
Numero de modulos 2
Estándar de memoria PC3-10600 (DDR3 1333 MHz)
Frecuencia de funcionamiento hasta 1333 MHz
Tiempos 9-9-9-24
Tensión de alimentación 1,5 V
Banda ancha 10667 Mbps

Puede reproducir cómodamente el video incrustado solo como un "zapador". Por lo tanto, para actualizar la computadora a un nivel de juego, elegimos una moderna y poderosa, pero no la más cara.


Se convirtió con 2GB de memoria de video, soporte para DirectX 11 y OpenGL 4.x. y el excelente sistema de refrigeración Twin Frozr IV. Su rendimiento debería ser más que suficiente para que podamos disfrutar de las últimas partes de las franquicias de juegos más populares como Tomb Raider, Crysis, Hitman y Far Cry. Las características del elegido son las siguientes:


Caracteristicas
GPU GeForce GTX 770
Frecuencia de la GPU 1098 MHz o hasta 1150 MHz en modo GPU Boost
Número de procesadores de sombreado 1536
Memoria de video 2 GB
Tipo de memoria de video GDDR5
Ancho del bus de memoria de video 256 bits
Frecuencia de memoria de video 1753 MHz (7.010 GHz QDR)
Número de canalizaciones de píxeles 128, 32 unidades de muestreo de textura
Interfaz PCI Express 3.0 16x (compatible con PCI Express 2.x / 1.x) con interconexión de tarjeta SLI.
Puertos Adaptador DisplayPort, DVI-D, DVI-I, HDMI, D-Sub incluido
Enfriamiento de la tarjeta gráfica Activo (radiador + 2 ventiladores Twin Frozr IV en la parte frontal del tablero)
Conector de alimentación 8 pines + 8 pines
Soporte API DirectX 11 y OpenGL 4.x
Longitud de la tarjeta gráfica (medida en NIKS) 263 milímetros
Soporta computación GPU de propósito general DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C ++, OpenCL 1.0
Consumo máximo de energía FurMark + WinRar 255 vatios
Clasificación de Rendimiento 61.5

Dificultades inesperadas

Ahora tenemos todo lo que necesitamos para actualizar nuestra computadora. Instalaremos nuevos componentes en nuestro caso existente.


Lo lanzamos y no funciona. ¿Y por qué? Pero debido a que las fuentes de alimentación económicas no son físicamente capaces de iniciar una computadora con el más mínimo grado. El hecho es que en nuestro caso se requieren dos conectores de 8 pines para la fuente de alimentación, y la unidad de fuente de alimentación tiene solo un conector de alimentación de tarjeta de video de 6 pines en la base. Teniendo en cuenta que muchos más necesitan incluso más conectores que en nuestro caso, queda claro que es necesario cambiar la fuente de alimentación.

Pero esto no es tan malo. ¡Piense, no hay conector de alimentación! En nuestro laboratorio de pruebas, encontramos adaptadores bastante raros de 6 pines a 8 pines y de molex a 6 pines. Como estos:


Vale la pena señalar que incluso con las fuentes de alimentación modernas y económicas, los conectores Molex son cada vez más pequeños con cada nueva versión, por lo que podemos decir que tuvimos suerte.

A primera vista, todo está bien y, con algunos ajustes, pudimos actualizar la unidad del sistema a una configuración de "juegos". Ahora simulemos la carga ejecutando Furmark y 7Zip en Xtreme Burning en nuestra nueva máquina de juego al mismo tiempo. Podríamos encender la computadora, eso es bueno. El sistema también sobrevivió al lanzamiento de Furmark. Iniciamos el archivador, ¡¿y qué es ?! La computadora se apagó, habiéndonos deleitado con el rugido del ventilador al máximo. El "modesto" estándar de 400W falló, sin importar cuánto lo intentó, para alimentar la tarjeta de video y el potente procesador. Y debido al mediocre sistema de enfriamiento, el nuestro se calentó mucho, e incluso la velocidad máxima del ventilador no le permitió entregar al menos los 400W declarados.

¡Hay una salida!

Navegaron. Compramos componentes costosos para ensamblar una computadora de juegos, pero resulta que es imposible jugar en ella. Es una pena. La conclusión es clara para todos: el anterior no es adecuado para nuestra computadora de juegos y debe ser reemplazado con urgencia por uno nuevo. ¿Pero cual?

Para nuestra computadora actualizada, elegimos de acuerdo con cuatro criterios principales:

El primero es, por supuesto, el poder. Preferimos elegir con un margen; también nos gustaría overclockear el procesador y ganar puntos en las pruebas sintéticas. Teniendo en cuenta todo lo que pudiéramos necesitar en el futuro, decidimos elegir una potencia de al menos 800W.

El segundo criterio es la confiabilidad... Realmente queremos que el que se tome "con un margen" sobreviva a la próxima generación de tarjetas de video y procesadores, no se queme y al mismo tiempo no queme componentes costosos (junto con el sitio de prueba). Por lo tanto, nuestra elección son solo condensadores japoneses, solo protección contra cortocircuitos y protección confiable contra sobrecargas para cualquiera de las salidas.

El tercer punto de nuestros requisitos es la conveniencia y la funcionalidad.... Para empezar, necesitamos: la computadora funcionará con frecuencia, y las fuentes de alimentación especialmente ruidosas, junto con una tarjeta de video y un enfriador de procesador, volverán loco a cualquier usuario. Además, la sensación de belleza no es ajena a nosotros, por lo que una nueva fuente de alimentación para nuestra computadora para juegos debe ser modular y tener cables y conectores desmontables. Para que no haya nada superfluo.

Y por último, pero no menos importante, el criterio es eficiencia energética... Sí, nos preocupamos por el medio ambiente y nuestras facturas de luz. Por lo tanto, la fuente de alimentación que elijamos debe cumplir al menos el estándar de eficiencia energética 80+ Bronze.

Después de comparar y analizar todos los requisitos, elegimos entre los pocos solicitantes que cumplían plenamente con todos nuestros requisitos. Se convirtió en una potencia de 850W. Tenga en cuenta que en varios parámetros incluso superó nuestros requisitos. Veamos su especificación:

Especificaciones de la fuente de alimentación
Tipo de equipamiento Fuente de alimentación con módulo PFC (Power Factor Correction) activo.
Propiedades Trenzado de bucle, condensadores japoneses, protección contra cortocircuitos (SCP), protección contra sobretensiones (OVP), protección contra sobrecargas de cualquiera de las salidas de la unidad por separado (OCP)
+ 3,3 V - 24 A, + 5 V - 24 A, + 12 V - 70 A, + 5VSB - 3,0 A, -12 V - 0,5 A
Cables de alimentación desmontables
Eficiencia 90%, certificado 80 PLUS Gold
Poder de la fuente de alimentación 850 Peso
Conector de alimentación de la placa base 24 + 8 + 8 pines, 24 + 8 + 4 pines, 24 + 8 pines, 24 + 4 pines, 20 + 4 pines (conector plegable de 24 pines. 4 pines se pueden desconectar si es necesario, conector plegable de 8 pines)
Conector de alimentación de la tarjeta de video 6 conectores de 6/8 pines (conector plegable de 8 pines - 2 pines desmontables)
MTBF 100 mil horas
Enfriamiento de la fuente de alimentación 1 ventilador: 140 x 140 mm (en la pared inferior). Sistema de refrigeración pasivo hasta un 50% de carga.
Control de velocidad del ventilador De un sensor térmico. Cambio de la velocidad del ventilador en función de la temperatura dentro de la fuente de alimentación. Selección manual del modo de funcionamiento del ventilador. En el modo Normal, el ventilador gira continuamente y en el modo Silencioso, se detiene por completo cuando la carga es baja.


, uno de los mejores por el dinero. Instalemoslo en nuestro corpus:


Entonces sucedió algo que nos confundió un poco. Parecería que todo se ensambló correctamente, todo estaba conectado, todo funcionó, ¡pero la fuente de alimentación está en silencio! Es decir, en general: el ventilador todavía está parado y el sistema se ha iniciado y funciona correctamente. El hecho es que con una carga de hasta el 50%, la fuente de alimentación funciona en el llamado modo silencioso, sin hacer girar el ventilador de refrigeración. El ventilador zumbará solo bajo una carga pesada: el lanzamiento simultáneo de archivadores y Furmark hizo que el enfriamiento girara.


La fuente de alimentación tiene hasta seis conectores de alimentación de tarjeta de video de 8 pines y 6 pines, cada uno de los cuales es un conector plegable de 8 pines, del cual, si es necesario, puede desabrochar 2 contactos. Por lo tanto, es capaz de alimentar cualquier tarjeta de video sin molestias y dificultades innecesarias. Y ni siquiera uno.


El sistema de fuente de alimentación modular le permite desconectar cables de alimentación innecesarios e innecesarios, lo que mejora el flujo de aire de la carcasa, la estabilidad del sistema y, por supuesto, mejora estéticamente la apariencia del espacio interno, lo que nos permite recomendar de forma segura a los modders. y ventiladores de estuches con ventanas.
compre una fuente de alimentación confiable y potente. En nuestra revisión, se convirtió en. - y como puede ver, no es casualidad. Al comprar uno de NICS, puede estar seguro de que todos los componentes de su sistema de alto rendimiento contarán con la potencia suficiente e ininterrumpida, incluso con overclocking extremo.


Además, la fuente de alimentación durará varios años por adelantado; es mejor con un margen, en caso de que vaya a actualizar el sistema con componentes de alto nivel en el futuro.

Arquitectura de GPU: características

El realismo de los gráficos 3D depende en gran medida del rendimiento de la tarjeta de video. Cuantos más bloques de sombreadores de píxeles contenga el procesador y mayor sea la frecuencia, más efectos se pueden aplicar a una escena 3D para mejorar su percepción visual.

La GPU contiene muchos bloques funcionales diferentes. Por la cantidad de algunos componentes, puede estimar qué tan poderosa es la GPU. Antes de continuar, déjame ver los bloques funcionales más importantes.

Procesadores de vértices (unidades de sombreado de vértices)

Al igual que las unidades de sombreado de píxeles, los procesadores de vértices ejecutan código de sombreado que toca los vértices. Dado que un mayor presupuesto de vértices le permite crear objetos 3D más complejos, el rendimiento de los procesadores de vértices es muy importante en escenas 3D con objetos complejos o una gran cantidad de ellos. Sin embargo, las unidades de sombreado de vértices todavía no afectan el rendimiento de manera tan obvia como los procesadores de píxeles.

Procesadores de píxeles (unidades de sombreado de píxeles)

Un procesador de píxeles es un componente del chip gráfico dedicado al procesamiento de programas de sombreado de píxeles. Estos procesadores realizan cálculos de solo píxeles. Debido a que los píxeles contienen información de color, los sombreadores de píxeles pueden lograr efectos gráficos impresionantes. Por ejemplo, la mayoría de los efectos de agua que ha visto en los juegos se crean utilizando sombreadores de píxeles. Normalmente, el número de procesadores de píxeles se utiliza para comparar el rendimiento de píxeles de las tarjetas de video. Si una tarjeta está equipada con ocho unidades de sombreado de píxeles y la otra con 16 unidades, entonces es bastante lógico suponer que una tarjeta de video con 16 unidades procesará programas de píxeles complejos más rápido. También debe considerar la velocidad del reloj, pero hoy en día duplicar el número de procesadores de píxeles es más eficiente energéticamente que duplicar la frecuencia del chip gráfico.

Sombreadores unificados

Los sombreadores unificados aún no han llegado al mundo de las PC, pero el próximo estándar DirectX 10 se basa en una arquitectura similar. Es decir, la estructura del código de los programas de vértices, geométricos y píxeles será la misma, aunque los sombreadores realizarán trabajos diferentes. La nueva especificación se puede ver en la Xbox 360, donde la GPU fue diseñada especialmente por ATi para Microsoft. Será bastante interesante ver qué potencial tiene el nuevo DirectX 10.

Unidades de mapeo de texturas (TMU)

Las texturas deben seleccionarse y filtrarse. Este trabajo se realiza mediante unidades de mapeo de texturas, que funcionan en conjunto con unidades de sombreado de vértices y píxeles. El trabajo de TMU es aplicar operaciones de textura a los píxeles. La cantidad de unidades de textura en una GPU se usa a menudo para comparar el rendimiento de textura de las tarjetas de video. Es bastante razonable suponer que una tarjeta de video con un mayor número de TMU proporcionará un mayor rendimiento de textura.

Unidades de operador ráster (ROP)

Los RIP son responsables de escribir datos de píxeles en la memoria. La tasa a la que se realiza esta operación es la tasa de llenado. En los primeros días de los aceleradores 3D, los ROP y las tasas de relleno eran características muy importantes de las tarjetas gráficas. Hoy en día, el rendimiento de ROP sigue siendo importante, pero el rendimiento de una tarjeta de video ya no está limitado por estos bloques, como solía estarlo. Por lo tanto, el rendimiento (y el número) de ROP ya se usa raramente para estimar la velocidad de una tarjeta de video.

Transportadores

Las canalizaciones se utilizan para describir la arquitectura de las tarjetas de video y proporcionan una representación muy visual del rendimiento de la GPU.

Transportador no es un término técnico estricto. La GPU utiliza diferentes canalizaciones que realizan diferentes funciones. Históricamente, una tubería se entendía como un procesador de píxeles que estaba conectado a su propia unidad de mapeo de texturas (TMU). Por ejemplo, la tarjeta de video Radeon 9700 usa ocho procesadores de píxeles, cada uno de los cuales está conectado a su propia TMU, por lo que se considera que la tarjeta tiene ocho tuberías.

Pero es muy difícil describir los procesadores modernos por la cantidad de tuberías. En comparación con los diseños anteriores, los nuevos procesadores utilizan una estructura modular fragmentada. ATi puede considerarse un innovador en esta área, que, con la línea de tarjetas de video X1000, cambió a una estructura modular, lo que hizo posible lograr ganancias de rendimiento a través de la optimización interna. Algunos bloques de CPU se utilizan más que otros, y para mejorar el rendimiento de la GPU, ATi trató de encontrar un compromiso entre el número de bloques necesarios y el área de la matriz (no se puede aumentar demasiado). En esta arquitectura, el término "canalización de píxeles" ha perdido su significado, ya que los procesadores de píxeles ya no están conectados a sus propias TMU. Por ejemplo, la GPU ATi Radeon X1600 tiene 12 Pixel Shaders y solo cuatro TMU. Por tanto, no se puede decir que la arquitectura de este procesador tenga pipelines de 12 píxeles, al igual que decir que solo hay cuatro de ellos. Sin embargo, por tradición, todavía se mencionan las canalizaciones de píxeles.

Teniendo en cuenta estas suposiciones, la cantidad de canalizaciones de píxeles en una GPU se usa a menudo para comparar tarjetas de video (con la excepción de la línea ATi X1x00). Por ejemplo, si tomamos tarjetas de video con 24 y 16 canalizaciones, entonces es bastante razonable suponer que una tarjeta con 24 canalizaciones será más rápida.


CONTENIDO

Quizás, ahora estos bloques son las partes principales del chip de video. Ejecutan programas especiales conocidos como sombreadores. Además, si los sombreadores de píxeles anteriores ejecutaban bloques de sombreadores de píxeles y vértices, bloques de vértices, durante algún tiempo se unificaron las arquitecturas gráficas y estas unidades de computación universales comenzaron a lidiar con varios cálculos: vértices, píxeles, geométricos e incluso cálculos universales.

La arquitectura unificada se usó por primera vez en el chip de video de la consola de juegos Microsoft Xbox 360, esta GPU fue desarrollada por ATI (luego comprada por AMD). Y en los chips de video para computadoras personales, aparecieron unidades de sombreado unificadas en la placa NVIDIA GeForce 8800. Y desde entonces, todos los nuevos chips de video se basan en una arquitectura unificada, que tiene un código universal para diferentes programas de sombreado (vértice, píxel, geométrico, etc.), y los procesadores unificados correspondientes pueden ejecutar cualquier programa.

Por el número de unidades informáticas y su frecuencia, se puede comparar el rendimiento matemático de diferentes tarjetas de video. La mayoría de los juegos ahora están limitados por el rendimiento de los sombreadores de píxeles, por lo que el número de estas unidades es muy importante. Por ejemplo, si un modelo de tarjeta de video está basado en una GPU con 384 procesadores computacionales en su composición, y otro de la misma línea tiene una GPU con 192 unidades computacionales, entonces con igual frecuencia el segundo procesará cualquier tipo de shader. dos veces más lento, y en general será igual más productivo.

Aunque es imposible sacar conclusiones inequívocas sobre el rendimiento basándose únicamente en el número de unidades informáticas, es imperativo tener en cuenta la frecuencia de reloj y la arquitectura diferente de las unidades de diferentes generaciones y fabricantes de chips. Solo estas cifras pueden usarse para comparar chips solo dentro de la misma línea de un fabricante: AMD o NVIDIA. En otros casos, debe prestar atención a las pruebas de rendimiento en los juegos o aplicaciones de interés.

Unidades de mapeo de texturas (TMU)

Estas unidades de GPU funcionan en conjunto con procesadores computacionales, se utilizan para seleccionar y filtrar la textura y otros datos necesarios para la construcción de escenas y la computación de propósito general. El número de unidades de textura en el chip de video determina el rendimiento de la textura, es decir, la velocidad de obtención de los texels de las texturas.

Aunque recientemente se ha puesto más énfasis en los cálculos matemáticos, y algunas de las texturas están siendo reemplazadas por procedimentales, la carga en las TMU sigue siendo bastante alta, ya que además de las texturas principales, también se deben hacer selecciones a partir de mapas normales y de desplazamiento. , así como búferes de destino de renderizado fuera de la pantalla.

Teniendo en cuenta el énfasis de muchos juegos, incluido el rendimiento de las unidades de texturizado, podemos decir que el número de TMU y el correspondiente rendimiento de alta textura también son uno de los parámetros más importantes para los chips de vídeo. Este parámetro tiene un efecto especial en la velocidad de renderizado de la imagen cuando se usa filtrado anisotrópico, que requiere selecciones de textura adicionales, así como con algoritmos complejos para sombras suaves y algoritmos novedosos como Screen Space Ambient Occlusion.

Bloques de operaciones de rasterización (ROP)

Las unidades de rasterización realizan operaciones de grabación de píxeles calculados por la tarjeta de video en búferes y operaciones de su mezcla (combinación). Como señalamos anteriormente, el rendimiento de las unidades ROP afecta la tasa de llenado y esta es una de las principales características de las tarjetas de video de todos los tiempos. Y aunque recientemente su valor también ha disminuido ligeramente, todavía hay casos en los que el rendimiento de la aplicación depende de la velocidad y el número de ROP. Esto se debe con mayor frecuencia al uso activo de filtros de posprocesamiento y al suavizado habilitado en configuraciones de juego altas.

¿Te gustó el artículo? ¡Compartir con tus amigos!