Apple comienza el segundo trimestre del año anunciando novedades en Inteligencia Artificial (IA).
El objetivo de este nuevo sistema es mejorar la conversación, permitiendo interacciones más naturales gracias al contexto visual.
Además, las posibilidades no solo pasan por aportar más información, también sería posible hacer preguntas concretas sobre lo que muestra la pantalla.
Por supuesto, poder ver, leer y entender la información de la pantalla no es algo nuevo, la mayoría de lenguajes y compañías están trabajando en algo similar con objetivos muy diversos.
Leer más: WhatsApp habilitó más funciones nuevas en abril
Le puede interesar: ¿Qué significa el emoji que mueve la cabeza de forma horizontal en WhatsApp?
Apple es una de las más interesadas, pues su catálogo está lleno de dispositivos con paneles y puede sacar mucho jugo de este sistema.
A pesar de no ser la primera en anunciar su investigación, sí ha conseguido ser una de las mejores, los investigadores han dejado por escrito que la versión más avanzada de ReALM es capaz de superar a GPT-4 en la captación de referencias visuales (referencias de la pantalla).
El informe publicado por Apple muestra una tabla de puntuaciones en las que ReALM-3B, su versión más potente, es capaz de superar a MARRS, GPT-3.5 y GPT-4 en aciertos en pantalla.
Desde la compañía destacan que su sistema es mucho más pequeño y aun así está ofreciendo los mejores resultados.