Te presentamos GPT-4o, la Inteligencia Artificial que habla, ve y escucha
OpenAI, la compañía de Sam Altman, presentó su modelo de inteligencia artificial más avanzado hasta la fecha, GPT-4o.
Este anuncio se produjo durante el evento anual de OpenAI, donde se esperaba que la compañía lanzara su propio buscador.
GPT-4o, que estará disponible de forma gratuita para todos los usuarios a través de la aplicación ChatGPT, permite interactuar con voz, audio e imágenes de una manera increíblemente rápida.
Durante la presentación, uno de los ingenieros de OpenAI demostró cómo la tecnología podía adivinar rápidamente su ubicación en un estudio de grabación.
Una revolución en la inteligencia artificial
La latencia, un tema crucial en estos modelos de interacción, se redujo notablemente. Esto significa que las conversaciones con GPT-4o se sentirán más reales y menos sintéticas. Incluso es posible interrumpir a la tecnología para modificar la solicitud mientras se escucha su respuesta.
El nombre GPT-4o proviene de “omni”, que significa omnicanal. Esto refleja la disponibilidad del modelo en todos los canales posibles.
Según OpenAI, «Con GPT-4o, entrenamos un único modelo nuevo de extremo a extremo en texto, visión y audio, lo que significa que todas las entradas y salidas son procesadas por la misma red neuronal».
Enterate mucho más en este video…