Bard, el bot conversacional de inteligencia artificial de Google, a partir de ahora permite crear imágenes con base en simples descripciones de texto. Por ahora, la opción sólo está disponible en inglés.
Google anunció que a partir de ahora Bard podrá crear imágenes fotorrealistas de alta calidad en base a simples indicaciones escritas y hacer realidad cualquier idea. La empresa también presentó nuevas actualizaciones para mejorar la capacidad de la herramienta, entre ellas corroborar respuestas arrojadas en conversaciones y la disponibilidad de Gemini Pro en todos los idiomas. A continuación un resumen de las nuevas funcionalidades:
-
La imaginación se vuelve realidad
Para darle forma a las ideas creativas, Bard podrá generar una amplia variedad de imágenes personalizadas a partir de una breve descripción. Por ejemplo, se le puede pedir que arme una imagen de un perro en una tabla de surf, y ofrecerá resultados fotorrealistas de alta calidad entre las cuales se puede elegir la que mejor se adecúe a lo imaginado.
Esto surge con la integración de la tecnología de procesamiento de texto a imagen más avanzada de la compañía “Imagen 2”, que permite a todas las personas repensar la forma de hacer las cosas y recibir ayuda creativa con Bard. Estará disponible en inglés en la mayoría de los países y territorios donde ya funciona la herramienta.
Para ayudar a todas las personas a diferenciar las imágenes originales de las generadas con Inteligencia Artificial, Bard emplea SynthID, una herramienta desarrollada por Google DeepMind, que agrega una marca de agua imperceptible directamente en los píxeles de las nuevas imágenes.
-
Ampliar respuestas con el buscador
La función “Doble verificación” permite corroborar todas las respuestas que Bard ofrece. Estará disponible en más de 40 idiomas y 230 países y territorios. ¿Cómo se utiliza?. Al iniciar una conversación, debajo de la respuesta aparecerá el ícono “G” que permitirá buscar en Google las respuestas generadas por Bard y profundizar en esa información, así como también identificar distintas fuentes que validen dichos datos. También se podrá hacer clic en frases resaltadas para obtener información que respalde o contradiga lo que responde.
-
Gemini Pro en todos los idiomas
A finales del 2023, la compañía anunció la integración de Gemini Pro a Bard en inglés, con el objetivo de potenciar las habilidades de comprensión, razonamiento, resumen y codificación de la herramienta. Ahora, el modelo de lenguaje multimodal más avanzado hasta el momento estará disponible en todos los idiomas (incluido el español ).
Recientemente, uno de los principales líderes de modelos lingüísticos y asistentes de IA en todos los idiomas: la Organización de grandes sistemas de modelo (sus siglas en inglés, LMSYS), realizó una tabla de posiciones que clasifica modelos de IA según su rendimiento. Bard, con Gemini Pro, ocupó el segundo puesto en el ranking, y además se reveló que la herramienta está evolucionando a pasos agigantados gracias a las constantes mejoras.
Con estos avances, Bard se convierte en una herramienta gratuita, accesible globalmente y útil para todo tipo de tareas, desde ayudar en las actividades cotidianas hasta en grandes proyectos.