El 20 de diciembre, el sistema de inteligencia artificial o3 de OpenAI logró un notable avance al obtener una puntuación del 85% en el índice de referencia ARC-AGI, una prueba diseñada para medir la “inteligencia general” de las máquinas. Esta puntuación es significativamente superior a la mejor obtenida previamente por otros sistemas de IA, que alcanzaron solo un 55%, y coloca a o3 al nivel de la puntuación media humana. Además, el sistema destacó en una prueba matemática muy difícil, lo que refuerza la idea de que OpenAI ha dado un paso importante hacia la creación de una inteligencia artificial general (IAG).
La creación de la inteligencia artificial general es uno de los principales objetivos en la investigación de IA. Este avance, logrado por OpenAI, ha generado un gran interés en la comunidad científica y tecnológica, ya que podría marcar un punto de inflexión en el desarrollo de máquinas que piensen y aprendan de manera más similar a los humanos. Aunque persisten dudas, muchos investigadores ahora consideran que la IAG está más cerca de lo que se esperaba.
¿Qué significa que una IA alcance un nivel humano?
Para comprender el impacto de este logro, es necesario entender cómo funciona la prueba ARC-AGI, que mide la capacidad de un sistema de IA para adaptarse a nuevas situaciones con pocos ejemplos. Mientras que modelos como ChatGPT (GPT-4) necesitan millones de ejemplos para aprender patrones, el sistema o3 mostró una capacidad notable para resolver problemas desconocidos a partir de muestras limitadas, lo que se conoce como “capacidad de generalización”. Esta capacidad es vista como un aspecto esencial de la inteligencia.
La prueba ARC-AGI presenta problemas en los que la IA debe identificar un patrón a partir de solo tres ejemplos, similar a las pruebas de coeficiente intelectual que miden la capacidad de generalización. La habilidad para encontrar reglas generales que puedan aplicarse a nuevos ejemplos es clave para avanzar hacia una inteligencia más flexible y adaptable.
Un modelo de IA más adaptable
El éxito de o3 sugiere que este modelo tiene una capacidad de adaptación excepcional. A través de su entrenamiento, OpenAI parece haber optimizado el sistema para que identifique reglas generales de manera más eficiente que otros modelos previos. Aunque los detalles exactos del proceso siguen siendo desconocidos, se especula que o3 busca y elige “cadenas de pensamiento” para resolver tareas, similar a la forma en que otros sistemas, como AlphaGo de Google, resolvían problemas complejos mediante la búsqueda de diferentes secuencias de acciones.
Este enfoque podría haber permitido a o3 generalizar y adaptarse mejor a situaciones desconocidas, lo que lo hace más eficiente que otros modelos de IA que dependen de grandes cantidades de datos para aprender. Sin embargo, los detalles técnicos sobre cómo o3 logra estos resultados siguen siendo limitados, y OpenAI ha mantenido en secreto muchos aspectos del modelo.
El futuro de la inteligencia artificial general
El verdadero potencial de o3 solo podrá evaluarse a través de un trabajo extensivo que incluya más pruebas y evaluaciones en el mundo real. Si el modelo demuestra ser tan adaptable como un ser humano promedio, podría tener un impacto revolucionario en la economía y la tecnología, acelerando el progreso hacia la inteligencia artificial general. Este avance podría marcar el inicio de una nueva era de IA capaz de mejorar y adaptarse de manera autónoma.
Si, por el contrario, los resultados son menos sorprendentes de lo esperado, el avance seguiría siendo impresionante, pero el impacto en la vida cotidiana podría ser más limitado. En cualquier caso, el sistema o3 ha dejado claro que la búsqueda de la IAG avanza a un ritmo más rápido de lo que muchos anticipaban, y este logro de OpenAI podría ser solo el principio de una nueva fase en el desarrollo de la inteligencia artificial.