Deepseek no dice la verdad sobre los costos y las GPU de las NVIDIA utilizadas

La startup china Deepseek recientemente atrajo la atención de todo el mundo de la tecnología debido al bajo uso de los recursos de cálculo, las leyes de la GPU de NVIDIA, necesarias para su modelo avanzado de inteligencia artificial, llamado R1, considerado competitivo con el O1 de OpenAI. Sin embargo, el clamor puede no estar tan justificado.

Según las afirmaciones de la compañía, Deepseek habría incurrido en costos iguales a solo 6 millones de dólares y usó 2,048 GPU para la capacitación de su modelo. Sin embargo, los analistas de semianálisis revelan que la compañía detrás de Deepseek ha incurrido en costos de hardware mucho más grandes, incluso igual a aproximadamente 1.600 millones de dólarestener una flota de 50,000 GPU de Hopper Nvidia. Si es así, la idea de que Deepseek es realmente una revolución de bajo costo, puede no ser completamente fundada.

El informe indica que Deepseek administra una infraestructura de cálculo muy extensa, basada en aproximadamente 50,000 GPU de tolvade los cuales 10,000 H800 y 10,000 H100, así como más de H20 comprados. Estos recursos se distribuirían en diferentes ubicaciones y se utilizarían para capacitar actividades de IA, investigación y modelado financiero.

Deepseek, pero ¿qué tan seguro es el chino? - Macitynet.it

Por lo tanto, la inversión total en el servidor de la compañía sería de alrededor de 1.600 millones de dólares, mientras que los costos operativos estimados ascenderían a aproximadamente 944 millones de dólares.

Recuerde que Deepseek tiene una sensación en el mundo de la IA incluso cuando tiene presentado Los requisitos de hardware extremadamente contenidos para su modelo de mezcla de expertos (MOE) de Deepseek-V3, significativamente más bajos que los de los modelos estadounidenses.

Deepseek nació de High-Flyer, un fondo de cobertura chino que adoptó el AL en tiempos insospechados e invirtió masivamente en GPU. En 2023, entonces, High-Flyer lanzó Deepsek como una empresa separada dedicada a la inteligencia artificial.

A diferencia de muchos competidores, Deepseek se financia por su cuentaque permite que sea una mayor flexibilidad y rapidez de toma de decisiones. Sin embargo, al contrario de lo que ha sugerido la propia compañía, según la cual sería una pequeña derivación del fondo principal: Deepseek se configura como una compañía que ha visto inversiones por más de 500 millones de dólares, ciertamente no pequeña.

Recuerde que en la creación de Deepseek y sobre el costo real del modelo muchas dudas profundas.