Las empresas estadounidenses de IA intentan empujar agujeros en elsek disruptivo

Mientras tanto, los desarrolladores de IA de EE. UU. Se apresuran a analizar el modelo V3 de Deepseek. Deepseek en diciembre publicó un trabajo de investigación que acompaña al modelo, la base de su aplicación popular, pero muchas preguntas, como los costos de desarrollo total, no se responden en el documento.

China ahora ha saltado de 18 meses a seis meses detrás de los modelos de IA de última generación desarrollados en los Estados Unidos, dijo una persona. Sin embargo, con la estrategia de liberación gratuita de Deepseek tocando tal emoción, la empresa pronto puede encontrarse sin suficientes fichas para satisfacer la demanda, predijo esta persona.

Los avances de Deepseek no fluyeron únicamente de un presupuesto reducido de US $ 6 millones, una pequeña suma en comparación con los analistas de US $ 250 mil millones estiman que las grandes compañías de nubes de EE. UU. Gastarán este año en la infraestructura de IA. El trabajo de investigación señaló que este costo se refería específicamente al uso de chips en su carrera final de capacitación, no todo el costo de desarrollo.

La carrera de entrenamiento es la punta del iceberg en términos de costo total, dijeron ejecutivos de dos laboratorios Top Reuters. El costo de determinar cómo diseñar esa ejecución de capacitación puede costar magnitudes más dinero, dijeron.

El documento declaró que la ejecución de capacitación para V3 se realizó utilizando 2.048 de los chips H800 de NVIDIA, que fueron diseñados para cumplir con los controles de exportación de EE. UU. Lanzados en 2022, las reglas que los expertos dijeron a Reuters apenas ralentizarían el progreso de la IA de China.

Fuentes de dos laboratorios de IA dijeron que esperaban que las etapas anteriores de desarrollo se hubieran confiado en una cantidad mucho mayor de chips. Una de las personas dijo que tal inversión podría haber costado al norte de US $ 1 mil millones.

Algunos líderes estadounidenses de IA elogiaron la decisión de Deepseek de lanzar sus modelos como código abierto, lo que significa que otras compañías o individuos son libres de usarlos o cambiarlos.

«Deepseek R1 es uno de los avances más sorprendentes e impresionantes que he visto, y como código abierto, un profundo regalo para el mundo», dijo el capitalista de riesgo Marc Andreessen en una publicación sobre X el domingo.

La aclamación obtenida por los modelos de Deepseek subraya la viabilidad de la tecnología de IA de código abierto como una alternativa a la tecnología costosa y estrictamente controlada como el chatgpt de OpenAI, dijeron los observadores de la industria.

Las compañías más valiosas de Wall Street han aumentado en los últimos años por las expectativas de que solo ellos tenían acceso al vasto capital y el poder informático necesarios para desarrollar y escalar la tecnología de IA emergente. Esos supuestos se someterán a un mayor escrutinio esta semana y la siguiente, cuando muchos gigantes tecnológicos estadounidenses informarán ganancias trimestrales.

Fuente

Las empresas estadounidenses de IA intentan empujar agujeros en elsek disruptivo

Written by PyE

Deepseek para compartir algún código de modelo de IA, duplicando el código abierto

La mayoría de los fabricantes estadounidenses pronostican despidos en las operaciones de Vietnam con tarifas de Trump, muestra la encuesta

Las empresas de electrónica de Taiwán planifican más inversiones de Texas, el organismo de la industria dice

El Reino Unido acelera las principales consultas de la industria del acero en respuesta a los aranceles estadounidenses

Comentario: ¿Deepseek está provocando un momento Sputnik para la industria estadounidense de IA?

Bangladesh Central Bank contrata a las empresas de auditoría ‘Cuatro Grandes’ para revisar los bancos que dice que perdió $ 17 mil millones, informa FT

US busca un acuerdo comercial de India sobre comercio electrónico, cultivos y almacenamiento de datos, informa Bloomberg News

China considera eximir algunos bienes de las tarifas de EE. UU.: Fuente

Análisis: Después de años de acuerdos de IA fallidos, Intel planea desafío de cosecha propia a NVIDIA

T-Mobile pierde estimaciones para adiciones de suscriptores inalámbricos; Caída de acciones

Derivados Exchange CME establecido para lanzar Futuros XRP en Crypto Push

Nestlé supera las estimaciones de ventas trimestrales, dice el impacto indirecto de la tarifa ‘no está claro’

Mike Johnson se desmorona cuando el periodista llama a su hipocresía de menor costos

La UE y la OTAN toman un voto de silencio en Groenlandia

El presidente de Toyota propone una posible adquisición de $ 42 mil millones de Toyota Industries, informa Bloomberg

El embajador francés cree que Europa debería participar en el asentamiento en Ucrania

VP boliviano nominado para la posición superior de la ONU

Samsung invertirá $ 117 millones en la instalación del sur de la India, dice el ministro

US busca un acuerdo comercial de India sobre comercio electrónico, cultivos y almacenamiento de datos, informa Bloomberg News

Kenia: Cómo los corredores han rechazado la economía agrícola.