Google I/O 2024: la era Géminis en las búsquedas - La IA creará dibujos, vídeos y música, y avisará de los estafadores telefónicos
Por: Viktor Tsyrfa | 15.05.2024, 10:21
En la actual conferencia Google I/O, el gigante de las búsquedas demostró que no tiene intención de renunciar a su liderazgo en la introducción de la inteligencia artificial. La IA se integrará más estrechamente en Google Fotos, Google Camera, Gmail, la búsqueda y otras aplicaciones, y Gemini se convertirá en el principal asistente personal con el que se podrá comunicar mediante texto, voz y cámara.
Google I/O 2024: lo más destacado
- Gemini se convertirá en el asistente principal de Android. No se sabe nada del destino de Google Assistant, pero todos conocemos los hábitos de Google.
- Generación de imágenes: según la descripción detallada, Gemini creará imágenes incluso de objetos inexistentes. También puede crear hermosas leyendas.
- Generación de vídeo por descripción. El vídeo se puede extender a la duración deseada. Una herramienta muy prometedora para que los bloggers consigan inserciones de vídeo temáticas gratuitas.
- Music AI Sandbox - una herramienta para generar por descripción de texto una muestra de música o procesar la pista de audio de entrada.
- Google Fotos analizará ahora el contexto completo de las fotos. Será posible no sólo buscar imágenes por la descripción de lo que se toma en ellas, sino también hacer selecciones temáticas, por ejemplo, progresos de entrenamientos a lo largo del año, etc.
- API Gemini 1.5 Pro es un modelo de lenguaje que proporcionará 1 Mn de tokens para procesar consultas, recordar el historial de conversaciones y tener en cuenta el mayor contexto entre competidores. El número de tokens disponibles se duplicará en verano. Gemini 1.5 Flash - API de IA rápida para obtener resultados casi en tiempo real.
- La IA para el aprendizaje sistematizará y explicará el material didáctico, incluidos ejemplos cotidianos.
- Círculo para buscar - el chip anunciado en el Galaxy S24 Ultra, que luego llegó al Google Pixel, pronto aparecerá en todos los smartphones Android. A modo de recordatorio, basta con rodear con un círculo un objeto en la pantalla para que Google determine qué se representa exactamente allí y lance una búsqueda de ese objeto.
- Análisis profundo del contexto. Por ejemplo, si le pide a Gemini que le organice un viaje, no sólo le comprará el billete, sino que también le sugerirá un lugar donde alojarse y consultará la previsión meteorológica. O cuando pida unos zapatos, será capaz de ajustar su talla a partir de su correspondencia de Gmail.
- Gemini puede consultarse no sólo por texto o voz, sino también por cámara. En el vídeo de demostración, Gemini explicaba lo que hacía el objeto del fotograma, analiza código de software sobre la marcha y explica lo que hace, resuelve rompecabezas, recuerda dónde estaba el objeto que se veía antes en el fotograma.
- La era Géminis de la búsqueda. La búsqueda no sólo producirá inmediatamente extractos y respuestas generados por la IA, sino que ahora podrá hacer planes y tareas. Podrás introducir consultas complejas y entonces Géminis trazará una ruta, comprobará la valoración de un establecimiento o creará un menú para la semana si es necesario, haciendo inmediatamente una lista de compras y lugares donde realizarlas.
- Gmail proporcionará ahora un extracto de correos electrónicos, y será posible combinar varios correos y hacer un extracto de correos electrónicos juntos. La IA también podrá responder a todos los remitentes de esos correos, añadir tareas al calendario o incluso crear una tabla en Google Sheets con todas las ofertas similares que hayan llegado al correo.
- Para el trabajo en equipo, Gemini analizará todos tus chats de trabajo, buscará y analizará información en ellos, y responderá a los compañeros adecuados aunque no sepas en qué chat se está produciendo la discusión adecuada.
- A Gemini se le puede enviar un archivo PDF de hasta 1.500 páginas para que lo analice y pida una breve traducción. O un vídeo de hasta 1 hora de duración, y Gemini analizará todos los fragmentos y, si es necesario, mostrará exactamente el segmento que necesita el usuario.
- Se puede preguntar a Gemini por qué no funciona un determinado mecanismo, como una consola de DJ o una cámara, y la IA dará una respuesta sobre cómo arreglarlo. Para ello, la IA reconoce el mecanismo en el cuadro, su modelo, la acción que intenta hacer el usuario, utiliza estos datos para hacer una búsqueda, la analiza y extrae exactamente la información necesaria.
- La IA para programadores generará código según la descripción de la tarea, creará una base de datos de fotos de objetos y buscará errores.
- Protección contra llamadas fraudulentas. La IA analizará sus conversaciones en tiempo real, y si el interlocutor se comporta de forma sospechosa, por ejemplo, le pide sus datos bancarios, emitirá una señal sonora y una advertencia sobre un posible fraude.
- La inteligencia artificial soportará 35 idiomas y tendrá la mayor ventana contextual de cualquier competidor.
Este año, Sundar Pichai respondió al humor sobre la presentación de Google I/O del año pasado e inmediatamente proporcionó la estadística de que el acrónimo "AI" se pronunció 120 veces en la presentación de casi 2 horas. Y luego una vez más.
Fuente: Google I/O