in

Explicador: ¿Qué es Deepseek y por qué está interrumpiendo el sector de IA?

Explicador: ¿Qué es Deepseek y por qué está interrumpiendo el sector de IA?

BEIJING: La startup china Deepseek, el lanzamiento de sus últimos modelos de IA, que dice que están a la par o mejor que los modelos líderes en la industria en los Estados Unidos a una fracción del costo, amenaza con alterar el orden mundial de la tecnología.

La compañía ha atraído la atención en los círculos globales de IA después de escribir en un artículo el mes pasado que la capacitación de Deepseek-V3 requirió menos de $ 6 millones en energía informática de los chips NVIDIA H800.

El asistente de IA de Deepseek, impulsado por Deepseek-V3, ha superado el chatgpt rival para convertirse en la aplicación gratuita mejor calificada disponible en la App Store de Apple en los Estados Unidos.

Esto ha planteado dudas sobre el razonamiento detrás de la decisión de algunas compañías tecnológicas de EE. UU. De prometer miles de millones de dólares en inversión de IA y se han visto afectadas acciones de varios jugadores de Big Tech, incluido NVIDIA.

A continuación se presentan algunos hechos sobre la compañía que sacude el sector de IA en todo el mundo.

¿Por qué Deepseek está causando revuelo?

El lanzamiento de ChatGPT de Openai a fines de 2022 causó una lucha entre las empresas tecnológicas chinas, que se apresuraron a crear sus propios chatbots impulsados ​​por la inteligencia artificial.

Pero después del lanzamiento del primer equivalente chino de ChatGPT, realizado por el gigante del motor de búsqueda Baidu, hubo una gran decepción en China por la brecha en las capacidades de IA entre las empresas estadounidenses y chinas.

La calidad y la eficiencia rentable de los modelos de Deepseek han volteado esta narración sobre su cabeza. Los dos modelos que han sido bañados de elogios por los ejecutivos de Silicon Valley y los ingenieros de la compañía de tecnología estadounidense por igual, Deepseek-V3 y Deepseek-R1, están a la par con los modelos más avanzados de Operai y Meta, dijo la startup china.

También son más baratos de usar. El Deepseek-R1, lanzado la semana pasada, es de 20 a 50 veces más barato de usar que el modelo OpenAI O1, según la tarea, según un puesto en la cuenta oficial de WeChat de Deepseek.

Pero algunos han expresado públicamente el escepticismo sobre la historia de éxito de Deepseek.

El CEO de Scale AI, Alexandr Wang, dijo durante una entrevista con CNBC el jueves, sin proporcionar evidencia, que Deepseek tiene 50,000 chips Nvidia H100, que según él no se revelará porque eso violaría los controles de exportación de Washington que prohiben que los chips de IA avanzados se vendan a vender a Empresas chinas. Deepseek no respondió de inmediato a una solicitud de comentarios sobre la acusación.

Los analistas de Bernstein destacaron el lunes en una nota de investigación que los costos totales de capacitación de Deepseek para su modelo V3 eran desconocidos, pero eran mucho más altos que los $ 5.58 millones que la startup dijo que se usaba para la potencia informática. Los analistas también dijeron que los costos de capacitación del modelo R1 igualmente aclamado no fueron revelados.

¿Quién está detrás de Deepseek?

Deepseek es una startup con sede en Hangzhou cuyo accionista controlador es Liang Wenfeng, cofundador de cuantitativo Fund de cobertura High-Flyer, basado en registros corporativos chinos.

El fondo de Liang anunció en marzo de 2023 en su cuenta oficial de WeChat que estaba «comenzando de nuevo», yendo más allá de comerciar para concentrar recursos en crear un «grupo de investigación nuevo e independiente, para explorar la esencia de AGI (inteligencia general artificial). Deepseek fue creado más tarde ese año.

Los fabricantes de chatgpt OpenAi definen a AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas económicamente valiosas.

No está claro cuánto High-Flyer ha invertido en Deepseek. High-Flyer tiene una oficina ubicada en el mismo edificio que Deepseek, y también posee patentes relacionadas con los grupos de chips utilizados para entrenar modelos de IA, según los registros corporativos chinos.

La unidad de IA de High-Flyer dijo en su cuenta oficial de WeChat en julio de 2022 que posee y opera un grupo de 10,000 chips A100.

¿Cómo ve Beijing Deepseek?

El éxito de Deepseek ya se ha notado en los principales círculos políticos de China. El 20 de enero, el día en que Deepseek-R1 fue liberado al público, el fundador Liang asistió a un simposio de puerta cerrada para empresarios y expertos organizados por el primer ministro chino Li Qiang, según la agencia estatal de noticias Xinhua.

La presencia de Liang en la reunión es potencialmente una señal de que el éxito de Deepseek podría ser importante para el objetivo político de Beijing de superar los controles de exportación de Washington y lograr la autosuficiencia en industrias estratégicas como la IA.

Un simposio similar el año pasado asistió el CEO de Baidu, Robin Li.

Fuente

Written by PyE

La cúpula de hierro y la abolición de la inclusión: el ejército de los Estados Unidos comenzó a cambiar bajo la administración Trump

La cúpula de hierro y la abolición de la inclusión: el ejército de los Estados Unidos comenzó a cambiar bajo la administración Trump

Día del juicio para el Rally AI

Día del juicio para el Rally AI