Ranking de labs de IA
Anthropic, OpenAI, Google DeepMind, Meta, xAI, Mistral, los labs chinos — predice quién lanza qué, cuándo y dónde aterriza en los benchmarks. Todo con monedas ficticias de GutCall.

Cómo GutCall modela la carrera de IA
Los desafíos de IA en GutCall se resuelven contra señales públicas y citables: una model card publicada por el lab, una puntuación en una evaluación pública mayor (MMLU, GPQA, SWE-Bench, ARC-AGI), una actualización oficial de la página de precios o un acuerdo registrado en tribunales. El desafío declara qué señal lo resuelve antes de que apuestes.
No intentamos puntuar "qué lab es el mejor" con un solo número — ese tipo de afirmación envejece mal. En su lugar, cada predicción es concreta: "¿Superará Claude a GPT en SWE-Bench Verified antes del Q3?", "¿Costará el próximo modelo grande del lab X menos por millón de tokens que su actual modelo el día de lanzamiento?". Concreto, falsable y resuelto por una fuente pública.
La distribución de apuestas de la comunidad se convierte en las probabilidades en vivo. Si piensas que la sala se equivoca sobre el ritmo de lanzamiento de un lab, apuestas al lado contrario y explicas tu razonamiento en los comentarios. Los ganadores cobran de los perdedores tras la comisión estándar de la plataforma — en monedas ficticias, nunca en dinero.
Qué puedes predecir en la categoría IA
Fechas de lanzamiento
¿Lanzará el lab X un nuevo modelo insignia en un trimestre dado? ¿Pasará una preview anunciada a estar generalmente disponible antes de una fecha?
Puntuaciones en benchmarks
¿Superará el modelo Y al modelo Z en un benchmark público nombrado? Cada desafío apunta a una suite y una versión específicas de cada modelo.
Afirmaciones de capacidad
Cuando un lab publica una nueva afirmación de capacidad (autonomía de agente, multimodalidad, ventana de contexto), GutCall abre un desafío sobre si reproducciones independientes lo confirman en N semanas.
Cambios de precio
El precio por token de los modelos productivos se mueve en escalones — normalmente a la baja, ocasionalmente al alza. Los desafíos se resuelven con la actualización publicada en la página de precios.
Liderazgo de mercado
¿Cuál es el modelo más citado en encuestas a desarrolladores al cierre de una temporada? Las fuentes de resolución son los principales paneles de dev-tools.
Circuito cerrado, monedas internas
Las monedas son ficticias. No se retiran, no se transfieren ni se cambian por premios. El juego recompensa los buenos pronósticos con cosméticos e insignias, no con dinero.
Preguntas frecuentes del ranking de IA
¿Qué labs están cubiertos?
Todos los labs frontera principales que publican model cards o resultados de benchmark — Anthropic, OpenAI, Google DeepMind, Meta, xAI, Mistral, Alibaba, DeepSeek, más cualquier otro lab que lance un modelo en el periodo relevante. Los desafíos nombran al lab y al modelo concreto desde el principio.
¿Cómo se resuelven los desafíos de puntuación en benchmark?
El desafío especifica la suite, la versión y la página o paper público que lo resuelve. GutCall lee de esa fuente tras la fecha de resolución. Las discrepancias entre las puntuaciones auto-reportadas y reproducciones independientes pasan por el proceso de disputa.
¿Qué pasa si un lab cambia silenciosamente un modelo detrás de una API?
Los desafíos nombran una versión concreta (p. ej. "Claude Opus 4.7"). Si un lab renombra o reemplaza el modelo silenciosamente, el desafío se resuelve sobre la versión nombrada — verificada vía release notes o model cards. Los casos ambiguos pasan a disputa y pueden anularse.
¿Puedo crear mi propio desafío de labs de IA?
Los planes Creator y Pro desbloquean la suite de autoría. La plantilla de IA te pide especificar el lab, el modelo, el benchmark o la afirmación, y la fuente pública de resolución — manteniendo cada desafío auditable.
¿Es esto un mercado de apuestas real sobre resultados de IA?
No. Las monedas de GutCall son ficticias y no tienen valor en efectivo, no se pueden retirar y no se canjean por premios. El ranking de IA es un juego de predicciones para entretenimiento, no un mercado de apuestas ni un producto de inversión.
Seguir explorando
¿Crees que lees la carrera de labs mejor que la sala?
Registro gratuito. Monedas iniciales de regalo. Sin tarjeta, sin wallet, sin dinero real en juego.