Google de Alphabet presentó el jueves un par de sistemas de inteligencia artificial que demostraron avances en la resolución de problemas matemáticos complejos, una frontera clave del desarrollo de la IA generativa.
La clase actual de modelos de IA, que funcionan prediciendo estadísticamente la siguiente palabra, ha tenido dificultades con las matemáticas abstractas, que requieren mayores capacidades de razonamiento similares a la inteligencia humana.
DeepMind, la unidad de inteligencia artificial de la compañía, publicó resultados que muestran que sus nuevos modelos de inteligencia artificial en desarrollo, llamados AlphaProof y AlphaGeometry 2, resolvieron cuatro de seis preguntas en la Olimpiada Internacional de Matemáticas de 2024, una importante competencia para estudiantes de secundaria.
Google dijo en una publicación de blog que una pregunta se resolvió en minutos, pero otras tardaron hasta tres días, más que el límite de tiempo de la competencia. Aun así, los resultados representan las mejores calificaciones de la competencia obtenidas por un sistema de inteligencia artificial hasta la fecha.
La compañía dijo que creó AlphaProof, un sistema centrado en el razonamiento, combinando una versión de Gemini, el modelo de lenguaje detrás de su chatbot del mismo nombre, con AlphaZero, otro sistema de inteligencia artificial que anteriormente superó a los humanos en juegos de mesa como ajedrez y Go. AlphaProof resolvió tres de los problemas de la competencia, incluida la pregunta más difícil, que fue resuelta por solo cinco de más de 600 concursantes humanos.
AlphaGeometry 2 resolvió un problema matemático adicional.
Reuters informó a principios de julio que OpenAI, respaldado por Microsoft, estaba desarrollando una tecnología de razonamiento con el nombre en código «Strawberry». El proyecto, anteriormente conocido como Q*, se consideró un gran avance que varios investigadores del personal escribieron una carta a la junta directiva de OpenAI en noviembre advirtiendo que podría amenazar a la humanidad, como informó Reuters por primera vez.