Google utilizó su conferencia anual I/O del martes para revelar una actualización integral de la aplicación Gemini, posicionando el servicio como un compañero de IA de stack completo en lugar de un chatbot independiente. La empresa destacó cuatro nuevos componentes: un "Resumen Diario" personalizado que agrega datos de bandeja de entrada, calendario y tareas; un rediseño basado en un nuevo lenguaje visual "Neural Expressive"; Gemini Omni, un modelo de video generativo que combina texto, audio, imágenes y movimiento; y Gemini Spark, un agente de IA basado en la nube que funciona las 24 horas del día.

Resumen Diario es la primera característica que llega a los usuarios. Disponible hoy para los suscriptores de Google AI en Estados Unidos, el resumen extrae información de la bandeja de entrada, calendario y tareas más urgentes de un usuario, y luego la ordena por prioridad y sugiere los siguientes pasos. Google dice que el resumen va más allá de un simple resumen, colocando los elementos más importantes en la parte superior y ofreciendo recomendaciones accionables.

La revisión visual de la aplicación reemplaza el diseño anterior con animaciones fluidas, colores vibrantes, nueva tipografía y retroalimentación háptica. Google describe el cambio como una reconstrucción desde cero, con el objetivo de hacer que la experiencia se sienta más dinámica e intuitiva. Las respuestas de Gemini ya no aparecen como una pared de texto; en cambio, los puntos clave aparecen en negrita en la parte superior de la pantalla, mientras que los detalles adicionales, imágenes o cronogramas se desplazan hacia abajo.

Gemini Spark, actualmente en pruebas, se promociona como un asistente de IA personal las 24 horas del día que ayuda a los usuarios navegar sus vidas digitales. Debido a que Spark se ejecuta en la nube, puede continuar operando incluso cuando un teléfono está bloqueado. Los primeros probadores podrán crear flujos de trabajo personalizados, y Google planea abrir la característica a los suscriptores de Google AI Ultra la próxima semana.

Gemini Omni marca la entrada de Google en la generación de video a gran escala. El modelo combina las capacidades de lenguaje de Gemini con las herramientas de generación de medios de Google, lo que permite a los usuarios ingresar una solicitud como "explicación de animación de arcilla de plegamiento de proteínas" y recibir un video coherente y de alta calidad. Los usuarios también pueden cargar audio, imágenes o metraje existente para guiar la salida. Omni se está implementando en Google Flow y YouTube Shorts para los suscriptores de Google AI, lo que subraya el impulso de la empresa hacia la creación de contenido multimodal.

Google informa que la aplicación Gemini ya alcanza a más de 900 millones de usuarios mensuales en más de 230 países y admite más de 70 idiomas. Con las nuevas características, la empresa espera retener su base de usuarios masiva mientras atrae a aquellos que han migrado a competidores como OpenAI\'s ChatGPT o Anthropic\'s Claude. Al combinar herramientas de productividad, un socio de IA constante y generación de video avanzada en una sola aplicación, Google señala su intención de convertir a Gemini en el centro central para tareas de IA cotidianas.

This article was written with the assistance of AI.
News Factory SEO helps you automate news content for your site.