Cómo medir los TOPS de IA que tiene tu PC y qué significan

Última actualización: enero 14, 2026
Autor: Isaac
  • Los TOPS miden billones de operaciones de IA por segundo, pero dependen de la precisión (FP4, FP8, FP16…) usada para el cálculo.
  • CPU, GPU y NPU pueden aportar TOPS, aunque la NPU es la clave para IA local eficiente en portátiles y Copilot+ PC.
  • Para evaluar tu PC es mejor combinar cifras de TOPS con benchmarks reales de IA, como Opera Developer o Geekbench AI.
  • La elección de hardware IA (de 1–2 a 40+ TOPS) debe basarse en el uso real: desde edge AI sencilla hasta cargas profesionales complejas.

Medir TOPS de IA en el PC

En cuanto empiezas a mirar PC con funciones de inteligencia artificial, te bombardean con un término que hasta hace nada ni aparecía en las fichas técnicas: los TOPS. Si estás pensando en renovar equipo o simplemente quieres saber qué tal preparado está tu ordenador actual para mover IA en local, entender esta métrica es clave para no dejarte llevar solo por el marketing.

Además, cada vez hay más aplicaciones, asistentes y modelos de IA generativa que prometen ayudarte en el trabajo, en clase o incluso editando fotos y vídeos desde casa. El problema es que no todos los equipos están igual de preparados para estas cargas, y muchos fabricantes enseñan números espectaculares de TOPS que, si no sabes interpretarlos, pueden resultar bastante engañosos. Vamos a poner orden en todo esto y a ver también cómo medir de forma práctica los TOPS y el rendimiento real en IA que tiene tu PC.

Qué son exactamente los TOPS en IA

Cuando un fabricante habla de TOPS se refiere a Tera Operations Per Second, es decir, cuántas operaciones por segundo (en billones) es capaz de realizar un chip en tareas de inteligencia artificial. A veces también lo verás como «Trillion Operations Per Second» en inglés, pero el concepto es el mismo: 1 TOP equivale a 1012 operaciones por segundo.

En el contexto de la IA moderna, esos TOPS suelen asociarse principalmente a la NPU (Unidad de Procesamiento Neuronal), el acelerador especializado que encontramos en muchos portátiles actuales y en algunos procesadores de sobremesa. Sin embargo, también se puede expresar la capacidad en TOPS de una GPU o incluso de la propia CPU, porque todas son capaces de ejecutar cargas de trabajo de IA, aunque con distinta eficiencia.

Lo más habitual hoy en día es que, cuando se habla de TOPS para IA de consumo, el foco esté en la NPU integrada en el procesador. Este chip se sitúa junto a la CPU y la GPU y está pensado para descargar de trabajo a ambos cuando ejecutas asistentes de IA, modelos de lenguaje, funciones de cámara con desenfoque o subtítulos en tiempo real, entre muchas otras cosas.

Cuanto más alto es el número de TOPS de una NPU, CPU o GPU, más rápidamente puede procesar redes neuronales y modelos de IA. Ahora bien, este número, por sí solo, tiene truco: no refleja la calidad de las operaciones ni la precisión con la que se están haciendo, ni tampoco cómo se combinan CPU, GPU y NPU en un uso real.

Qué son los TOPS en IA

NPU, CPU y GPU: quién hace qué en la IA del PC

Dentro de un PC moderno conviven tres grandes bloques de cálculo: la CPU, la GPU y la NPU. Cada una tiene su papel, y entenderlo es importante para no mezclar peras con manzanas cuando leas especificaciones de TOPS.

La CPU es el procesador generalista de toda la vida. Se encarga del sistema operativo, las aplicaciones, la lógica de los programas… Puede ejecutar IA, pero no es la forma más eficiente de hacerlo si hablamos de cargas intensivas o sostenidas en el tiempo.

La GPU, por su parte, está diseñada para procesar grandes cantidades de operaciones en paralelo, algo ideal tanto para gráficos como para muchos algoritmos de IA. De hecho, las GPUs dedicadas actuales de NVIDIA, AMD o Intel (consulta las mejores tarjetas gráficas por rendimiento) pueden ofrecer cifras de TOPS para IA descomunales, apoyándose en núcleos específicos (como los Tensor Cores de NVIDIA) pensados justo para estas tareas.

La tercera pata es la NPU (Neural Processing Unit). Es un acelerador especializado en redes neuronales y cargas de IA de baja potencia y larga duración, sobre todo en portátiles. La ventaja principal de la NPU es que permite ejecutar IA local con un consumo muy reducido, lo que se traduce en mayor autonomía de batería y menos calor, algo clave en equipos finos y ligeros (ver cómo cambiar los modos de energía en Windows 11).

En portátiles modernos, la NPU se ha vuelto imprescindible porque permite tener funciones de IA siempre activas (traducción, asistentes, filtros de cámara, mejoras de audio) sin tener que tirar constantemente de la GPU, que consumiría mucha más energía. Por eso empezamos a ver requisitos oficiales como el de 40 TOPS mínimos en la NPU para considerar que un equipo es un Copilot+ PC completo.

  ¿Qué tipo de cable usan los USB?

TOPS, TFLOPS y tipos de precisión: dónde está el truco

Además de TOPS, muchos fabricantes mencionan también TFLOPS (Tera Floating-Point Operations Per Second), que miden operaciones concretamente en coma flotante. A primera vista, TOPS y TFLOPS parecen cifras parecidas, pero en realidad están muy condicionadas por un aspecto crítico: la precisión numérica empleada en los cálculos.

Los modelos de IA se apoyan en números en coma flotante de distinta longitud: FP64, FP32, FP16, FP8 y FP4, entre otros. Cuantos más bits se usan, más precisión tienes en los resultados, pero también más pesada es la operación y menos TOPS obtienes a igualdad de hardware. Por el contrario, con menos bits ganas velocidad y TOPS, pero sacrificas precisión.

Por ejemplo, FP64 utiliza 64 bits (doble precisión) y se reserva para simulaciones científicas o cálculos extremadamente delicados. FP32 es la precisión simple de 32 bits, muy extendida en gráficos y parte del aprendizaje automático. FP16 reduce aún más el tamaño, ofreciendo un equilibrio interesante para muchos modelos de entrenamiento y de inferencia.

En los últimos años han irrumpido formatos como FP8 y FP4, que recortan todavía más la representación numérica para disparar el rendimiento. Con FP4, por ejemplo, el chip usa solo 4 bits, lo que reduce muchísimo la memoria necesaria y dispara los TOPS teóricos, aunque no todas las operaciones ni todos los modelos se pueden ejecutar con tan poca precisión.

Tipos de precisión en IA

Cómo algunos fabricantes inflan los TOPS (y cómo evitar el engaño)

Una vez que sabes que a menor precisión, más TOPS salen en la ficha técnica, entenderás por qué muchos fabricantes presumen de cifras espectaculares sin matizar demasiado. Es relativamente sencillo anunciar que una GPU ofrece más de mil TOPS… si esos TOPS se calculan en FP4, el formato más rápido y menos preciso soportado por el chip.

Pongamos un ejemplo típico: una tarjeta gráfica moderna puede publicitar «1.400 TOPS para IA» sin indicar de forma clara que esa cifra se ha obtenido a precisión FP4. En escenarios reales, buena parte de los modelos va a funcionar en FP8, FP16 o incluso FP32, reduciendo notablemente el número efectivo de TOPS disponibles.

El problema se agrava cuando los fabricantes de equipos montan una CPU con NPU y una GPU potente y sumarizan alegremente todos los TOPS: los de la NPU (quizá medidos en INT8), los de la GPU (en FP4) y hasta algún dato de la CPU. El resultado final es una cifra global llamativa que mezcla precisiones, arquitecturas y tipos de operación diferentes, algo así como sumar melones con sandías.

También se usan estos trucos para comparar generaciones: una nueva GPU puede «doblar» los TOPS de la anterior simplemente porque ahora soporta FP4, mientras que el modelo previo solo llegaba a FP8. Si comparas TOPS FP4 nuevos contra TOPS FP8 antiguos, por supuesto la gráfica más reciente sale disparada en los gráficos… aunque en un uso real con la misma precisión la mejora no sea tan dramática.

Por todo esto, cuando veas cifras de TOPS muy altas, conviene fijarse bien en dos cosas: qué precisión se ha usado (FP4, FP8, FP16, INT8…) y si el valor corresponde a un único componente (NPU, GPU) o a la suma de varios chips con métricas heterogéneas.

Cómo medir los TOPS y el rendimiento de IA real de tu PC

Más allá de lo que diga la caja, lo realmente útil es comprobar cómo rinde tu ordenador en pruebas de IA del mundo real. No vas a poder cambiar los TOPS físicos de tu NPU o GPU, pero sí puedes medir su capacidad y compararla con otros equipos de forma honesta.

Hoy en día tienes a tu disposición varias herramientas pensadas justo para esto. Algunas se centran en el rendimiento de modelos de lenguaje grandes (LLM), otras prueban la NPU, la GPU y la CPU con redes neuronales variadas, y otras mezclan IA con gaming o creación de contenido.

Una alternativa muy directa es usar el navegador Opera en su versión para desarrolladores, que incluye una función para descargar y ejecutar distintos modelos de lenguaje directamente en tu PC. Puedes empezar con un modelo compacto, tipo AI Ready 2B, para no eternizarte con las descargas ni con la prueba.

Estas pruebas suelen medir el rendimiento en tokens por segundo: básicamente, cuánto texto puede generar el modelo por segundo en tu máquina. Como referencia general, se considera que más de 40 tokens por segundo con un modelo de unos 2.000 millones de parámetros (2B) ya indican un rendimiento sólido para uso cotidiano.

Otra herramienta muy interesante es Geekbench AI, la versión centrada en inteligencia artificial del conocido benchmark Geekbench de Primate Labs. Esta aplicación se centra en medir la capacidad de tu equipo para ejecutar diferentes tareas de IA local, tanto en CPU como en GPU o NPU, dependiendo de tu plataforma.

  ¿Cómo abrir un archivo web?

Geekbench AI y otras suites de benchmarks de IA

Geekbench AI se puede descargar gratuitamente y está disponible para distintos sistemas operativos, tanto en PC de sobremesa como en móviles. Una vez instalado, ofrece varios escenarios de prueba basados en IA que ponen a trabajar los distintos aceleradores de tu equipo.

En Windows, por ejemplo, permite escoger entre usar el backend ONNX solo con CPU o apoyarse en OpenVINO para probar CPU y GPU. Tú eliges la ruta en función de qué componente quieras analizar. Después simplemente pulsas en «Run AI Benchmark» y dejas que haga su trabajo.

Al terminar, Geekbench AI abre el navegador predeterminado y te muestra un informe detallado con las puntuaciones. Verás una nota global, basada en un valor de referencia (por ejemplo, un Intel Core i7-10700), y una lista de resultados individuales por tipo de prueba. Cuanto más altas son estas puntuaciones, mejor preparado está tu PC para mover IA local en distintos escenarios.

Si quieres ir un poco más allá, existen otras suites como MLPerf, Procyon AI, 3DMark AI o Cinebench AI, que se usan mucho a nivel profesional para estandarizar comparativas entre equipos. Estas herramientas evalúan cosas como velocidades de inferencia, estabilidad bajo carga, temperaturas y consumo energético.

En cargas de IA en tiempo real, es interesante que tu PC pueda mantener tiempos de inferencia por debajo de los 50 ms para que las respuestas parezcan instantáneas, que la NPU se utilice de forma elevada (alrededor del 80 % en tareas exigentes) y que las temperaturas bajo estrés prolongado no superen niveles peligrosos (normalmente se busca permanecer por debajo de 85 ºC) (lee sobre cámara de vapor vs heatpipes).

Cuántos TOPS necesitas según tu uso (y lo que pide Windows)

La pregunta del millón: ¿cuántos TOPS hacen falta para tener una buena experiencia de IA local? La respuesta depende de lo que quieras hacer, pero ya hay algunas referencias claras marcadas por la industria, empezando por Microsoft.

Para que un portátil o PC se considere un Copilot+ PC completo y pueda ejecutar localmente todas las funciones avanzadas de IA de Windows (como Recall, Cocreator y otras características de IA generativa), Microsoft exige al menos 40 TOPS en la NPU. Este es, ahora mismo, el punto de partida para lo que podríamos llamar un «PC con IA serio» en el ecosistema Windows.

Por debajo de ese umbral, un equipo puede seguir ofreciendo funciones básicas de IA, como subtítulos automáticos, traducción ligera o algunos filtros de cámara, pero no tendrá acceso a todo el arsenal de características pensadas para ejecutarse íntegramente en local con rapidez y bajo consumo.

Como guía práctica, se puede dividir el mercado en tres grandes rangos de rendimiento en IA local:

  • Entre 8 y 15 TOPS: gama de entrada, suficiente para asistentes básicos, edición ligera de fotos y algunas funciones de IA en segundo plano.
  • Entre 15 y 40 TOPS: gama media, ya adecuada para creación de contenido moderada, edición de vídeo con efectos de IA y videollamadas con funciones avanzadas.
  • Más de 40 TOPS: gama alta y profesional, pensada para cargas de trabajo de IA exigentes, modelos locales más grandes y uso intensivo a diario.

En la práctica, muchos chips de hace unos años, tanto de portátiles como de sobremesa, se mueven en la franja de 8 a 15 TOPS, mientras que los procesadores específicos para IA más recientes ya empiezan a superar con holgura los 40 TOPS solo en la NPU, sin contar GPU y CPU.

Ejemplos de procesadores y PC con NPU y TOPS destacados

Dentro del mundo x86, AMD fue la primera en apostar fuerte por integrar NPUs en sus procesadores para portátiles. Las series AMD Ryzen 7040 (familia HS y U) inauguraron esta tendencia, incorporando una NPU dedicada que marcó el pistoletazo de salida a los llamados «AI PC».

Más adelante llegaron los Ryzen Serie 8000, con una NPU de segunda generación, mejorando el rendimiento y la eficiencia para IA local. El salto más sonado, eso sí, ha venido con la familia AMD Ryzen AI Serie 300, basada en arquitectura Zen 5 y XDNA 2, capaz de alcanzar hasta 50 TOPS solo en la NPU, superando así el mínimo de 40 TOPS exigido por Microsoft para los Copilot+ PC con margen.

En el lado de Intel, la NPU se hizo realmente visible con los procesadores Intel Core Ultra de arquitectura Meteor Lake. La primera generación, los Core Ultra Serie 100 (en gamas 5, 7 y 9), ya integra una NPU de tercera generación, pensada justamente para IA de consumo en portátiles.

  ¿Cómo se calcula la diferencia relativa?

La evolución continúa con los Intel Core Ultra Serie 200, basados en arquitecturas Lunar Lake y Arrow Lake, donde la NPU vuelve a mejorar su rendimiento tanto en procesadores móviles como de sobremesa. Estos chips están claramente orientados a competir en el terreno de los AI PC y Copilot+ PC con un número de TOPS cada vez más elevado.

Fuera del x86, también encontramos NPUs potentes en plataformas como Qualcomm Snapdragon X Elite o en procesadores móviles avanzados de distintas marcas, que buscan ofrecer IA local para traducción, fotografía computacional y asistentes integrados en portátiles ultraligeros y tablets.

Mini PC y estaciones de trabajo: desde la entrada hasta la gama profesional

La moda de los mini PC con IA integrada ha llegado para quedarse. Hasta hace poco, estos equipos compactos eran vistos como una opción barata pero limitada frente a un sobremesa completo. Sin embargo, la mejora en procesadores y gráficas integradas hace que hoy puedan rivalizar con torres tradicionales, ocupando mucho menos espacio.

Marcas como GEEKOM, por ejemplo, han empezado a ofrecer gamas diferenciadas según el nivel de TOPS de la NPU. Un modelo de entrada puede montar un Intel Core Ultra 9-185H con unos 11 TOPS, suficiente para uso doméstico con asistentes de IA y edición fotográfica ligera.

En la franja intermedia hay configuraciones con procesadores como el AMD Ryzen 9 8945HS o el R7-8745HS, que rondan los 16 TOPS y ya permiten moverse con fluidez en tareas de productividad avanzada, videollamadas con mejora de imagen y sonido por IA o edición de vídeo moderada.

En la cúspide están los mini PC que integran chips como un Ryzen AI 9 HX 370 alcanzando cerca de 50 TOPS de NPU, capaces de manejar creación de contenido generativo, modelos locales de cierto tamaño y flujos de trabajo de IA más intensivos, todo ello en un chasis compacto.

Si damos el salto a estaciones de trabajo profesionales, el panorama se dispara aún más: equipos con GPUs NVIDIA RTX de gama alta pueden llegar a sumar cientos o miles de TOPS si contamos todos los formatos de precisión, además de NPUs dedicadas de decenas de TOPS y cantidades de RAM y almacenamiento pensadas para cargas empresariales y creativas muy pesadas (puedes aprender a sacar el máximo rendimiento a tu gráfica NVIDIA).

TOPS en IA de borde: de 1-2 TOPS a 32 TOPS y más

En el terreno de la IA de borde (edge AI), como cámaras inteligentes, sensores industriales o dispositivos embebidos, también se habla de TOPS, pero los rangos suelen ser distintos a los de un PC de sobremesa. No es lo mismo un mini PC conectado a la red eléctrica que una cámara remota que funciona 24/7 con un presupuesto energético muy limitado.

Muchos procesadores de IA económicos para dispositivos de borde se mueven en el rango de 1 a 2 TOPS. Esta cifra puede ser más que suficiente para tareas como detección de movimiento, conteo de objetos sencillo o reconocimiento de patrones básicos en vídeo a resolución moderada.

Si hablamos de una cámara de 8 MP que realiza reconocimiento facial y detección de anomalías, el requisito de TOPS dependerá mucho del modelo concreto usado, de la resolución de entrada procesada en tiempo real y de si se realizan varias inferencias simultáneas. Aunque no existe una regla lineal, en muchos casos se pasa de soluciones de 1-2 TOPS a aceleradores de 8, 16 o 32 TOPS para ganar margen en latencia, precisión y complejidad de los modelos.

Es importante entender que no hay una proporción directa de «el doble de TOPS = el doble de rendimiento». La eficiencia de la arquitectura, el tipo de precisión, las optimizaciones de software y la integración con sensores influyen tanto o más que el número bruto de TOPS. Por eso, en IA de borde, se suelen evaluar plataformas completas con benchmarks específicos, más que fijarse solo en el papel.

Para decidir si te vale un chip de 1-2 TOPS o necesitas algo más potente (10, 20, 30 TOPS), conviene estimar el número de inferencias por segundo que requiere tu aplicación, la resolución de los datos de entrada, el tamaño del modelo y el margen que necesitas para futuras mejoras. Sobre esa base, los TOPS sirven como referencia inicial, pero la validación final siempre se hace probando el modelo real en el dispositivo destino.

Entender qué son los TOPS, cómo se miden y qué trampas de precisión se esconden detrás de las cifras comerciales te permite valorar mucho mejor si un PC, un portátil o un dispositivo de borde tiene la potencia de IA adecuada para lo que necesitas y te ayuda a elegir herramientas de medición como Opera Developer, Geekbench AI o suites más avanzadas para comprobarlo en la práctica.

3dmark
Artículo relacionado:
3DMark para medir el rendimiento de la GPU: guía completa y pruebas clave