Google ha sorprendido al mundo de la tecnología con el lanzamiento de su última creación en el ámbito de la Inteligencia Artificial (IA), denominada Gemini.
Gemini destaca por su capacidad multimodal, permitiéndole “razonar con fluidez mediante textos, imágenes, video, audio y códigos”, gracias a su avanzado modelo de “comprensión masiva de lenguaje multitareas” (MMLU, por sus siglas en inglés).
La herramienta se lanzará en tres formatos: Nano, la versión más sencilla para dispositivos móviles; Pro, una versión intermedia; y Ultra, la más potente diseñada para abordar tareas de gran complejidad.
Una de las características impresionantes de Gemini es su habilidad para procesar información visual y auditiva, generando contenido en formato de texto, audio o imágenes. Durante la presentación, la herramienta demostró su capacidad para detectar errores en problemas matemáticos complejos, ofreciendo respuestas precisas y explicando los pasos para llegar a ellas. También mostró su destreza al proporcionar información detallada sobre un objeto, como un pato, basándose en un simple dibujo, e incluso participó en retos populares como “piedra, papel o tijera”.
Gemini es compatible con lenguajes de código comunes como Java, Python, C++ y Go. Aunque no está exenta de errores, Google afirma que la herramienta puede corregirlos en un 90% de los casos cuando se le notifica.
Esta nueva creación de Google se integrará con su sistema de chat actual, conocido como Bard, que ya opera en varios idiomas, incluido el español.
Hasta el momento, Google no ha revelado detalles sobre cómo planea monetizar Gemini, limitándose a anunciar que estará disponible para el público a partir del 13 de diciembre. La comunidad tecnológica espera ansiosamente para explorar las capacidades y aplicaciones prácticas de esta innovadora herramienta de IA.