Gemini: conheça IA do Google que interage por vídeo e áudio

O Google anunciou novidades sobre a inteligência artificial Gemini. Conheça mais sobre a ferramenta da empresa

12:32 | 15/05/2024 Autor Évila Silveira

Ver perfil do autor

Gemini agora é capaz de conversar por ligação e descrever objetos em tempo real Crédito: Reprodução/Freepik

O Google anunciou novos recursos para o Gemini e uma nova versão da inteligência artificial: o Gemini 1.5 Flash, que é mais leve e eficaz para aplicações multimodais. A novidade foi compartilhada durante o Google I/O 2024, evento que começou nessa terça-feira, 14, nos Estados Unidos.

A empresa focou a abertura do evento em trazer mais da inteligência artificial generativa, que é assunto no momento. O Gemini 1.5 Flash, concorrente do ChatGPT, conseguiu descrever em tempo real objetos e informações capturadas pela câmera do celular durante uma demonstração.

É + que streaming. É arte, cultura e história.

+ filmes, séries e documentários

+ reportagens interativas

+ colunistas exclusivos

Assine

Confira a seguir mais sobre a ferramenta e quais as novidades que ela apresenta.

Gemini: o que é a assistente virtual?

Gemini é o modelo de linguagem de Inteligência Artificial do Google. Ele possui uma estrutura multimodal capaz de realizar diversas tarefas, como transcrições de vídeos, geração de imagens e de gráficos, busca de erros em uma planilha de dados, análise de textos acadêmicos, dentre outras.

As novidades da assistente agora são realizar tarefas mais completas e interagir de forma ainda mais presente com o usuário.

Gemini Ultra, Pro, Nano e Flash: qual a diferença?

Gemini Ultra

É a versão mais avançada e completa da IA. Ela é capaz de entender e interpretar imagens e vídeos em diferentes linguagens da expressão humana, incluindo musical, visual e em código. Isso significa que a IA é capaz de descrever uma partitura, por exemplo.

O Google diz que, em comparação ao rival GPT-4, o modelo Ultra tem resultados melhores em testes de geração de código em Python, desafios de matemática e respostas sobre conhecimentos gerais. Ele custa R$ 96,99/mês, via assinatura do Google One AI Premium.

LEIA TAMBÉM | ChatGPT fica mais rápido e 50% mais barato

Gemini Pro

Pensado para desenvolvedores, o Gemini Pro é capaz de entender diferentes idiomas, extrair informações de áudios e de vídeos sem a necessidade de realizar uma transcrição escrita.

Sua principal característica é a quantidade de contexto que pode processar. O Gemini 1.5 Pro está disponível ao público em versão “preview” na Vertex AI, plataforma de construção de aplicações de IA voltada para empresas.

Gemini Nano

O Geminio Nano é uma versão “compacta” dos modelos Pro e Ultra, capaz de rodar diretamente em celulares. Em conjunto com a câmera, ele poderá sugerir filtros e edições que realcem a foto.

Ela pode transcrever áudios de reuniões e entrevistas, destacar as partes mais importantes e prever as próximas palavras durante uma digitação, funcionando em conjunto com o WhatsApp. A versão está disponível em alguns celulares Androids mais modernos.

Grok: conheça a IA do X, disponível apenas para usuários premium

Gemini Flash

O grande astro do evento foi o anúncio da versão mais leve do Gemini. Segundo o Google, o Gemini 1.5 Flash é indicado para fazer resumos, interpretar tabelas, criar legendas para imagens e vídeos e extrair documentos de arquivos.

Gemini: sinergia entre aplicações do Google

Uma demonstração vista durante o evento foi a capacidade do Gemini de “ler” uma foto contendo diversos compromissos e, a partir disso, criar eventos e marcações no seu calendário.

A IA agora é capaz de conduzir trabalho de integração entre o Gemini e as várias aplicações do Google. Dentro do e-mail, por exemplo, será possível pedir para a ferramenta organizar as mensagens por assunto, encontrar documentos específicos na caixa de entrada e até criar planilhas.

Cibersegurança: desafio para as empresas em 2024; CONFIRA

Gemini: planejamento avançado

Agora, a assistente virtual é mais inteligente quando se trata de planejamento de atividades. O Gemini pode responder a coisas como "Planeje uma viagem em família para Buenos Aires que minha esposa possa experimentar a culinária local".

Dentro desse exemplo, o Gemini vai puxar os dados das passagens de avião, estadia de hotel e estabelecer uma lista com sugestões de restaurantes mais turísticos. As atividades poderão ser sincronizadas no Google Maps e, caso confirmadas, também marcadas no calendário.

Gemini: ferramenta interage com usuário

Em uma demonstração durante o evento, a assistente conseguiu descrever em tempo real objetos e informações capturadas pela câmera do celular. A partir dessas imagens, ela também mostrou ser capaz de lembrar, por exemplo, onde o usuário deixou um objeto.

Uma nova função do Gemini é a chamada Gemini Live que permite transformar o aplicativo em um assistente de voz. Ele funciona como se estivesse conversando com a IA em uma ligação e ela responderá instantaneamente.

Como reconhecer fotos criadas por inteligência artificial? DESCUBRA

Gemini: quando poderá ser utilizado?

É importante ressaltar que, quando o assunto é inteligência artificial, nem sempre os avanços são disponibilizados para todos. No caso do Google, isso depende de fatores como qual dispositivo terá compatibilidade ou se o uso será pago ou gratuito.

Muitas atualizações estão sendo feitas na estrutura do Gemini e o processo será gradual. A maioria das novidades tende a priorizar clientes pagantes primeiro e, à medida que se popularizam, serem liberadas para uso gratuito.

Flash, a nova versão, se encontra disponível em forma de prévia, por meio do Google AI Studio (voltado para desenvolvedores), em alguns territórios.

Dúvidas, Críticas e Sugestões? Fale com a gente