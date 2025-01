OpenAI dice tener pruebas de que DeepSeek usó sus modelos para entrenar a su propia IA

David Sacks, el zar de la IA en la Casa Blanca, plantea la posibilidad de un supuesto robo de propiedad intelectual.

OpenAI dice haber encontrado pruebas de que la startup china de inteligencia artificial (IA) DeepSeek usó los modelos patentados de la compañía estadounidense para entrenar a su propia IA, mientras aumentan las preocupaciones sobre una posible violación de la propiedad intelectual.

En declaraciones a Financial Times, el desarrollador de ChatGPT con sede en San Francisco asegura tener pruebas de "destilación [de conocimiento]", que sospecha provienen de DeepSeek.

Los desarrolladores utilizan esta técnica para obtener un mejor rendimiento en modelos más pequeños al usar resultados de modelos más grandes y con más capacidad, lo que les permite lograr resultados similares en tareas concretas a un costo mucho menor.

Aunque la destilación es una práctica común en la industria, lo que preocupaba era que DeepSeek pudiera estar haciéndolo para desarrollar su propio modelo, lo que supone una violación de las condiciones de servicio de OpenAI.

"El problema es cuando lo sacas de la plataforma y lo haces para crear tu propio modelo para tus propios fines", explicó una persona cercana a OpenAI.

OpenAI no quiso hacer más comentarios ni ofrecer más detalles de sus pruebas. No obstante, las condiciones de su servicio establecen que los usuarios no pueden "copiar" ninguno de sus servicios o "utilizar los resultados para desarrollar modelos que compitan con OpenAI".

El lanzamiento de DeepSeek de su modelo de razonamiento R1 ha sorprendido a los mercados, así como a los inversores y las empresas de tecnología de Silicon Valley. Sus modelos desarrollados con un presupuesto reducido han alcanzado altas clasificaciones y resultados comparables a los principales modelos estadounidenses.

La acción de Nvidia cayó 17% el lunes, restándole u$s589.000 millones de su valor de mercado, ante el temor de que las grandes inversiones en su costoso hardware de inteligencia artificial pudieran no ser necesarias. El martes, las acciones recuperaron un 9%, al igual que las de otras grandes tecnológicas.

OpenAI y su socio Microsoft han investigado cuentas que se cree pertenecieron a DeepSeek el año pasado y que usaban la interfaz de programación de aplicaciones (API) de OpenAI, y bloquearon su acceso tras sospechar que la destilación violaba los términos del servicio. Microsoft se negó a hacer comentarios y OpenAI tampoco quiso hacer declaraciones al respecto. DeepSeek no respondió a una solicitud de comentarios realizada durante las celebraciones del año nuevo lunar.

Anteriormente, David Sacks, reconoció que "es posible" que se haya producido un robo de propiedad intelectual.

"Hay una técnica en la IA llamada destilación... cuando un modelo aprende de otro modelo [y] de alguna manera absorbe el conocimiento del modelo original", explicó Sacks a Fox News el martes.

DeepSeek asegura que utilizó solo 2048 tarjetas gráficas Nvidia H800 e invirtió u$s5,6 millones para entrenar su modelo V3 con 671.000 millones de parámetros, una fracción de lo que OpenAI y Google gastaron para entrenar modelos de tamaño comparable. Algunos expertos apuntaron que el modelo generó respuestas que indicaban que había sido entrenado con resultados de GPT-4 de OpenAI, lo que supondría una violación de las condiciones de servicio.

Los expertos de la industria dicen que es una práctica habitual que los laboratorios de IA en China y Estados Unidos utilicen resultados de empresas como OpenAI, que han invertido en la contratación de personas para enseñar a sus modelos cómo ofrecer respuestas que parezcan más humanas. Esto es costoso y requiere mucha mano de obra, y las empresas más pequeñas a menudo se aprovechan de este trabajo, advierten los expertos.

"Es una práctica muy habitual que las startups y los académicos utilicen los resultados de programas como ChatGPT, para entrenar otro modelo", asegura Ritwik Gupta, que está haciendo un doctorado en IA en la Universidad de California, Berkeley.

La práctica pone de relieve la dificultad que tienen las empresas interesadas en proteger su ventaja técnica. "Sabemos que las empresas con sede [en China] -y otras- intentan constantemente destilar los modelos de las principales empresas estadounidenses de IA", reconoció OpenAI en su última declaración.

OpenAI también ha tenido que salir al paso de las acusaciones de su propia infracción de derechos de autor por parte de algunos medios y creadores de contenido. Diarios como The New York Times y autores destacados acusan a la empresa de entrenar sus modelos basándose en sus artículos y libros sin haber solicitado permiso.