El gigante de comercio electrónico de China, Alibaba, anunció el lanzamiento de su propia plataforma de inteligencia artificial (IA) llamado Qwen Chat, al tiempo que en Estados Unidos surgen cuestionamientos contra DeepSeek y varias firmas confirman nuevas inversiones en este campo.
Alibaba aseguró que su plataforma es un gran modelo de lenguaje (LLM, por sus siglas en inglés) de código abierto entrenada con más de 20 billones de tokens, optimizada con técnicas de Ajuste Fino Supervisado y de Aprendizaje de Refuerzo a Partir de Retroalimentación Humana (RLHF). Tendría otras ventajas.
Su arquitectura es de “mezcla de expertos” (MoE, por sus siglas en inglés), un enfoque de aprendizaje automático basado en redes secundarias para procesar datos y que indica cuáles componentes activar para responder con precisión a una petición compleja.
Alibaba publicó que utilizó varios servicios globales de evaluación de plataformas de IA como LiveCodeBench, LiveBench y Arena-Hard para medir y comparar a Qwen en conocimiento a nivel universitario, capacidades de codificación, respuestas generales y si se aproxima a las preferencias humanas. Según la firma, Qwen obtuvo resultados superiores a DeepSeek, Llama de Meta y Claude de Anthropic.
LEA MÁS: ¿Quién es Liang Wenfeng, el fundador de DeepSeek la plataforma china de IA?
La aplicación de integración (API) para que los desarrolladores produzcan soluciones basadas en Qwen ya está disponible a través de Alibaba Cloud y el público general puede probar sus capacidades de manera gratuita mediante Qwen Chat, un bot parecido a ChatGPT y DeepSeek.
En el lanzamiento de Qwen, reportó Wired, Alibaba no se guardó su propia opinión sobre DeekSeek: “El lanzamiento de DeepSeek V3 ha atraído la atención de toda la comunidad de IA hacia los modelos MoE. Sin embargo, los investigadores y la industria tienen una experiencia limitada para llevar a gran escala este tipo de algoritmos”.
Más dardos contra DeepSeek
A principios de semana DeepSeek sorprendió a la industria con su bot conversacional similar al ChatGPT de OpenAI. El nuevo actor de IA presumió de su avanzado modelo, su bajo costo de desarrollo, las técnicas para optimizar recursos, y la capacidad inusitada para responder a las consultas o para su integración en soluciones informáticas.
El mercado se vio impactado. La app de DeekSeek fue la más descargada en la tienda de aplicaciones de Apple. Recibió elogios de varias figuras de la tecnología del Silicon Valley, incluyendo a Sam Altman, CEO de OpenAI, de inversionista Marc Andreessen (fundador de Netscape en los años 90’s) y de Nvidia. Fue aludida por el presidente Donald Trump.
El impacto fue tal que provocó la caída de los índices tecnológicos y el valor de las acciones de varias firmas tecnológicas. Nvidia perdió cerca de $600.000 millones de capitalización bursátil, en un derrumbe histórico. Luego vino la recuperación y los cuestionamientos a DeepSeek.
David Sacks, el próximo Director del Consejo de Asesores del Presidente en Ciencia y Tecnología, aseguró a la cadena Fox que “existen pruebas contundentes “de que DeepSeek extrajo conocimientos de los modelos de ChatGPT para entrenar su potente algoritmo R1. Sacks estará a cargo de todo lo relacionado a IA y criptomonedas en la administración Trump.
Según Saks, DeepSeek habría infringido los términos de uso de las API de OpenAI mediante la destilación de conocimiento, una técnica que transfiere las habilidades esenciales de un modelo de IA complejo a otro más compacto y eficiente.
OpenAI ofrece diversas soluciones comerciales de destilación a sus clientes, para crear conjuntos de datos de entrenamiento mediante las API de sus algoritmos. Pero, OpenAI prohíbe (en sus políticas de uso) la extracción de datos en forma automática y su uso para desarrollar soluciones que compitan directamente con OpenAI.
“Hay evidencia sustancial de que lo que DeepSeek hizo fue destilar información de los modelos de OpenAI”, afirmó Sacks en Fox News.
De hecho, Microsoft y OpenAI habrían iniciado una investigación sobre lo declarado por Sacks. OpenAI revisa si DeepSeek entrenó a su nuevo chatbot consultando repetidamente sus modelos de IA.
Bloomberg reportó que los investigadores de Microsoft, principal socio accionista de OpenAI y que basa su plataforma Copilot en la tecnología de ChatGPT, sospecha que DeepSeek pudo haber sustraído ilegalmente una cantidad significativa de datos durante el otoño de 2024.
En un comunicado, Microsoft aseguró que “las empresas con sede en la República Popular China intentan constantemente destilar los modelos de las principales firmas de inteligencia artificial de Estados Unidos”.
LEA MÁS: Qué es DeepSeek, la plataforma china de inteligencia artificial que compite con ChatGPT
La firma de Redmond agregó: “Como desarrollador líder en el sector, tomamos medidas para proteger nuestra propiedad intelectual. Consideramos fundamental colaborar estrechamente con el gobierno de Estados Unidos para resguardar mejor nuestros modelos más avanzados ante intentos de apropiación tecnológica por parte de adversarios y competidores”.
Este jueves se reveló, además, que DeepSeek habría dejado dejó expuesta una de sus bases de datos críticas en línea, filtrando más de un millón de registros del sistema, solicitudes de usuarios e incluso tokens de autentificación de la API a cualquiera que accediera a la base de datos. Más de un millón de registros.
Los investigadores de la empresa de seguridad en la nube Wiz, que alertaron sobre el problema, dijeron que —al no estar seguros de cómo revelar sus hallazgos a DeepSeek— enviaron su reporte a todas las direcciones de correo electrónico y perfiles de LinkedIn relacionadas con trabajadores o ejecutivos de la firma china.
Wiz no recibió respuesta de DeepSeek, indicó Wired, pero —a la media hora de su intento de contacto masivo— la base de datos se bloqueó y quedó inaccesible para usuarios no autorizados. No se sabe si algún ciberdelincuente accedió o descargó los datos, pero el lunes pasado la DeepSeek estuvo bajo acedio de los hackers.
“Es un error dramático, porque el nivel de esfuerzo es muy bajo y el nivel de acceso que obtuvimos es muy alto”, afirmó Ami Luttwak, el director de tecnología de Wiz a Wired.
Carrera competitiva
Las dudas, sin embargo, no cuestionan que las empresas chinas están alcanzando a las estadounidenses “muy rápido”.
“No hemos perdido nuestro liderazgo, pero es cierto que DeepSeek ha demostrado nuevas formas de hacer más eficientes los modelos de IA. Creo que nuestras empresas de IA también aprenderán y adoptarán esas técnicas”, sostuvo Sacks, según la agencia AFP.
Las firmas estadounidenses no se dieron por menos. Meta (dueña de Facebook, Threads e Instagram) y Microsoft anunciaron sus planes para impulsar sus plataformas de IA conocidas como Llama y Copilot, respectivamente.
Las inversiones entre $60.000 millones y $80.000 millones cada una se orientan al desarrollo de la infraestructura, básicamente centros de datos, para potenciar la IA, pronosticando “un aumento exponencial” de la demanda de productos con IA, reportó The Wall Street Journal.
Tanto Satya Nadella como Mark Zuckerberg, consejeros delegados de Microsoft y Meta, señalaron en sus llamadas sobre los resultados trimestrales por aparte, que el lanzamiento de nuevas plataformas como DeepSeek muestran la “evolución tecnológica que hará que la IA sea más barata y ampliamente utilizada”. Nadella reconoció que las plataforma china “tiene algunas innovaciones reales”.
Zuckerberg, según el Journal, recalcó “que los ganadores de la carrera armamentista de IA, tanto países como empresas, podrán fijar los términos”.
“Será importante que sea un código ‘americano’”, dijo Zuckerberg