Todo lo que debes saber sobre Gemini

Irene Horna, Head of Research & Ambassador IA de ROI UP Agency, responsable del área de SEO de la compañía durante los últimos 13 años, gran aficionada a las humanidades y entusiasta de la transformación digital, nos habla sobre Gemini.

Cuando leemos u oímos hablar de esta herramienta podemos encontrarnos con qué no sabemos exactamente a qué nos referimos. Literalmente “Gemini” es una Inteligencia Artificial multimodal creada desde cero por Google. Existen tres versiones diferentes: Nano, Pro y Ultra, cada una diseñada para diferentes necesidades y casos de uso. A la vez, existen tres productos basados en estas tecnologías:
Gemini, app Google Gemini y Gemini Advanced.

App Google Gemini

Google ha lanzado la app para Android (próximamente también en IOs) “Google Gemini” en inglés para Estados Unidos. En un asistente personal que te ayudará a realizar numerosas tareas. El ejemplo que pone Google es a partir de una imagen que hayas hecho, ya sea foto o pantallazo de algo que hayas visto, o un artículo que estés
leyendo, puedas hacerle preguntas. Con tu voz podrás poner alarmas, llamar a tus contactos o controlar los dispositivos inteligentes de tu casa que estén conectados. Próximamente será lanzado en otros idiomas y otros países.

Bard ahora es Gemini

Bard es una herramienta de Google creada con Inteligencia Artificial que permite obtener respuestas complejas a lo que se desee preguntar, es el chat de IA Generativa de Google. Puede crear texto, traducir idiomas, escribir diferentes tipos de contenido creativo y responder a diferentes tipos de preguntas (programación, matemáticas, ciencia, etc.)

¿En qué ha cambiado Bard?

Ahora Bard con Gemini (la versión) Pro está disponible en 40 idiomas en 230 países y territorios. La herramienta puede entender mejor, resumir mejor, razonar mejor, hacer mejores brain stormings, escribir y planificar mejor.

Su velocidad de respuesta ha aumentado, así como su precisión en las respuestas.

Además, ahora permite la creación de imágenes y la posibilidad de hacer “double check” en otros idiomas además del inglés. La función del “double-check” permite a los usuarios dar feedback sobre las respuestas que le ofrece esta IA multimodal.

Según Google y Large Model Systems Organization (que ha realizado test a ciegas con otros competidores a petición de Google), Bard que ahora funciona con Gemini Pro y se llama, simplemente “Gemini” es uno de los asistentes disponibles más preferidos (independiente de si es gratis o no) por los usuarios. Señalan que han dado un “salto impresionante” hacia adelante.

Gemini Advanced

Gemini Advanced – Upgrade de Google One

Google ha lanzado también “Gemini Advanced” que es una versión mejorada de su servicio Google One que integra Gemini Ultra.

 

Inteligencia Artificial multimodal

Gemini es multimodal de manera nativa. Puede procesar y comprender información de formatos, incluyendo texto, imágenes, audio y código.

La multimodalidad nativa le permite realizar tareas complejas que requieren la integración de diferentes tipos de datos. Por ejemplo, puede crear descripciones de imágenes que incluyen información contextual, traducir textos a diferentes idiomas mientras conserva su significado original, o incluso escribir código a partir de una descripción en lenguaje natural.

Disponible en tres versiones: Nano, Pro y Ultra

Gemini Pro está disponible a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI para que desarrolladores y empresas puedan integrar sus capacidades en sus propias aplicaciones y servicios. Esta versión está orientada a desarrolladores y empresas que buscan crear aplicaciones y servicios con IA multimodal avanzada. Esta es la versión integrada en lo que antes conocíamos como Bard que ahora se llama “Gemini” a secas.

Precio de la API de Gemini PRO

Actualmente está disponible la versión gratuita y permite hasta 60 consultas por minuto. Próximamente, no se sabe cuándo, saldrá la versión de pago para cuando se necesiten más de 60 QPM (consulta por minuto). Se cobrará tanto por hacer la consulta como por devolver resultado.

  • Precio (entrada / consulta) $0,00025 cada 1.000 caracteres y $0,0025 por imagen
  • Precio de respuesta $0,0005 / 1.000 caracteres

Curiosamente en la versión gratuita si estarán disponibles lo que Google llama “datos de entrada y salida que usamos para mejorar nuestros productos”, pero no en la de pago.

La versión Nano estará disponible en dispositivos Android 14 a través de AICore, una nueva funcionalidad del sistema. Gemini Nano está optimizada para dispositivos móviles y aplicaciones de bajo consumo, como la generación de respuestas inteligentes en teclados o la síntesis de voz.

Gemini Ultra ha sido lanzada el 8 de febrero. Está diseñada para centros de datos y tareas que requieren una gran potencia de procesamiento, como la generación de contenido multimedia de alta calidad o el análisis de grandes conjuntos de datos multimodales. Puedes acceder a ella contratando “Gemini Advanced” como un upgrade de Google One, siendo también una versión avanzada del chat de Inteligencia Artificial gratuito “Gemini”.

La API de Gemini Ultra para desarrolladores aún no ha sido lanzada.

Beneficios según Google: rendimiento superior

En pruebas comparativas de Google, ha demostrado superar a otros modelos de IA líderes en tareas como la traducción, la respuesta a preguntas y la generación de código. Según el propio Google, Gemini puede ayudar al desarrollo y mejora de:

  • La creación de contenido – IA Generativa: puede generar contenido multimedia de alta calidad, como imágenes, vídeos y textos, de forma automática y personalizada.
  • La traducción: la capacidad multimodal permite una traducción más precisa y natural entre diferentes idiomas, incluso aquellos con estructuras gramaticales muy diferentes.
  • La atención al cliente: puede usarse para crear chatbots y sistemas de atención al cliente que sean más inteligentes y eficientes, capaces de comprender y responder a las necesidades de los usuarios de forma personalizada.
  • La educación.
  • La investigación.
  • Para profesionales: Google permite que se integre la API de Gemini en aplicaciones creadas con Google AI Studio y Google Cloud Vertex AI.

Comparación con ChatGPT4

Según Google, la versión Ultra es mejor que ChatGPT4 en las siguientes disciplinas:

  • Capacidad general de respuesta.
  • Razonamiento con varios pasos.
  • Comprensión lectora.
  • Matemáticas (algebra, geometría, cálculos matemáticos, etc.).
  • Generación de código Python.
  • Imágenes.
  • Vídeos.
  • Audios.

En lo referente al razonamiento sobre tareas cotidianas, ChatGPT4, por el momento, es mejor.

El futuro de Gemini

  • Búsqueda de Google. Gemini seguirá estando integrado con SGE (Search Generative Experience) de Search y mejorará las funcionalidades que ahora ofrece.
  • Otros Servicios de Google. Google apuesta por incluir próximamente funcionalidades con Gemini en Google Ads, Chrome y Duet AI.
  • La API de Gemini Ultra para desarrolladores próximamente
  • La app de “Google Gemini” estará disponible en más países e idiomas, además de en IOs.
  • La versión Nano será lanzada próximamente.

TE PUEDE GUSTAR

La IA Generativa ha llegado para quedarse.  Cada vez son más los sectores en los que su aplicación se ha convertido en una herramienta

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio