Zubnet AIAprenderWiki › Cerebras
Empresas

Cerebras

Cerebras Systems, WSE
Una empresa de chips que construye procesadores de IA a escala de oblea — chips del tamaño de toda una oblea de silicio, más de 100 veces más grandes que una GPU estándar. El Cerebras WSE-3 (Wafer Scale Engine) contiene 4 billones de transistores y 900,000 núcleos. Sus sistemas CS-3 están diseñados tanto para entrenamiento como para inferencia, ofreciendo una alternativa a clústers de miles de GPUs individuales.

Por qué importa

Cerebras representa el replanteamiento más radical del hardware de IA. En lugar de conectar miles de chips pequeños con ancho de banda limitado, ponen todo en un chip masivo con enorme ancho de banda de memoria en chip. La ventaja potencial es eliminar el cuello de botella de comunicación que limita el entrenamiento multi-GPU. Si la computación a escala de oblea puede competir con el enorme ecosistema de NVIDIA es la pregunta del billón de dólares.

En profundidad

El WSE-3 tiene 44 GB de SRAM en chip — no HBM o DRAM, sino SRAM directamente en el die de cómputo. Esto proporciona ~21 PB/s de ancho de banda de memoria, órdenes de magnitud más que el ancho de banda HBM de las GPUs. Para operaciones limitadas por el ancho de banda de memoria (como la inferencia de LLMs, que está limitada por la velocidad con que puedes leer los pesos del modelo), esta es una ventaja fundamental. La compensación: 44 GB de memoria en chip no pueden contener los modelos más grandes, requiriendo estrategias de paralelismo de modelos entre múltiples sistemas CS-3.

Velocidad de Inferencia

Cerebras ha demostrado velocidades de inferencia impresionantes — sirviendo Llama-70B a más de 2,000 tokens/segundo, competitivo con o superando la LPU de Groq. El enfoque es diferente (chip a escala de oblea vs. ASICs determinísticos) pero el resultado es similar: hardware diseñado específicamente que supera dramáticamente a las GPUs para la carga de trabajo específica de generación de tokens de LLMs.

Conceptos relacionados

← Todos los términos
← Centros de datos Chatbot →
ESC