Los modelos de IA pierden hasta la camisa apostando en la Premier League

Los modelos de inteligencia artificial de Google, OpenAI y Anthropic perdieron dinero apostando en partidos de fútbol a lo largo de una temporada de la Premier League, según un nuevo estudio que sugiere que incluso los sistemas más avanzados tienen dificultades para analizar el mundo real durante períodos prolongados.

El informe “KellyBench”, publicado esta semana por la startup de IA General Reasoning, pone de relieve la brecha entre las capacidades que la IA avanza rápidamente en ciertas tareas —como la escritura de software— y sus deficiencias en otro tipo de problemas humanos.

General Reasoning, con sede en Londres, puso a prueba ocho de los principales sistemas de IA en una recreación virtual de la temporada 2023-24 de la Premier League, proporcionándoles datos históricos detallados y estadísticas sobre cada equipo y los partidos anteriores. Los sistemas recibieron instrucciones para construir modelos que maximizaran los rendimientos y gestionaran el riesgo.

Los “agentes” de IA realizaron entonces apuestas sobre los resultados de los partidos y el número de goles marcados, para evaluar cómo se adaptaban a nuevos eventos y a datos actualizados sobre los jugadores a medida que avanzaba la temporada.

Se evitó que los sistemas pudieran acceder a internet para consultar resultados, y cada uno tuvo tres intentos para obtener ganancias.

Claude Opus 4.6 de Anthropic obtuvo el mejor desempeño, con una pérdida media del 11% y rozando el equilibrio en uno de los intentos.

Grok 4.20 de xAI quebró en una ocasión y no logró completar los otros dos intentos. El Gemini 3.1 Pro de Google consiguió un beneficio del 34% en un intento, pero quebró en otro.

“Todos los modelos de frontera que evaluamos perdieron dinero a lo largo de la temporada y muchos sufrieron la ruina total”, concluyeron los autores del estudio, señalando que la IA “tuvo un rendimiento sistemáticamente inferior al de los humanos” en este escenario.

Cada modelo partió de un saldo inicial normalizado de 100,000 libras esterlinas. El rendimiento de la inversión y el saldo final se ponderaron a lo largo de tres intentos. Grok y Trinity no completaron todos los intentos.FT.com

Los resultados ofrecen cierto consuelo a los profesionales de cuello blanco y a las empresas que temen que la IA pueda quitarles el trabajo, en un contexto en que está sacudiendo las cotizaciones de sectores que van desde las finanzas hasta el marketing.

Ross Taylor, uno de los autores del estudio y director ejecutivo de General Reasoning, declaró: “Hay muchísimo revuelo en torno a la automatización con IA, pero no se está midiendo demasiado lo que ocurre cuando se sitúa a la IA en entornos de largo plazo”.

Añadió que muchos de los análisis de referencia que se utilizan habitualmente para evaluar la IA tienen deficiencias porque se desarrollan en “entornos muy estáticos” que poco se parecen al caos y la complejidad del mundo real.

El artículo de General Reasoning, que aún no ha sido revisado por pares, sirve de contrapeso al creciente entusiasmo en Silicon Valley por los enormes avances recientes de la IA en su capacidad para completar tareas de programación informática con escasa o nula intervención humana.

Taylor, exinvestigador de Meta AI, señaló: “Si pones a prueba la IA en tareas del mundo real, los resultados son muy malos. Sí, la ingeniería de software es muy importante y tiene un gran valor económico, pero hay muchas otras actividades con horizontes temporales más largos que también merece la pena analizar”.

Los modelos de IA pierden hasta la camisa apostando en la Premier League

Sistemas de Google, OpenAI, Anthropic y xAI tienen problemas cuando se les pide predecir resultados a lo largo de una temporada de fútbol

Tim Bradshaw

Temas relacionados

Más noticias de Apuestas deportivas

Hablar de plata: derribar el tabú para prevenir la ludopatía

Ludopatía infantil: por qué crece la cantidad de chicos que la sufren y qué medidas pueden frenarla a tiempo

Buscan regular la publicidad de las apuestas on line: qué dice el proyecto de ley

Programas sociales. El Banco del Bienestar otorgará 24,000 pesos a todos los mexicanos que cumplan con esta única condición

No lo podrás creer . Ya es realidad la más peligrosa predicción de Rasputín: llega el fin de los recursos naturales y el agua y las tierras ya no servirán para cultivar

NOAA. La NASA lo escondió por años y finalmente salió a la luz: el cementerio espacial donde duermen para siempre sus cohetes y naves más icónicas

Sucederá en Estados Unidos. Servicio Militar | Quieren inscribir automáticamente a todos los mayores de 18 años a partir de diciembre

Comunicado oficial. Ya es oficial: el Cablebús ampliará el servicio y ahora dará transporte con tres nuevas líneas

Toma nota. Adiós envíos entre amigos y familiares: habrá severas penalizaciones para quienes remitan dinero y no respeten esta condición

Beneficios del Gobierno. Educación lo confirmó | Habrá lentes para todos los alumnos de escuelas públicas que asistan a un examen ocular

Automotriz. Kia acelera en Nuevo León con inversión multimillonaria para frenar el avance de los autos chinos

Financial Times. Los modelos de IA pierden hasta la camisa apostando en la Premier League

Cuidado. Se acabó pelear por un asiento en el Metrobús: la nueva norma que define quién puede sentarse y quién no desde hoy

Planificación urbana. Adiós asfalto | Quieren cambiar las calles comunes por unas esponjas biológicas que absorben el agua en las principales ciudades del mundo