Gemini: conheça IA do Google que interage por vídeo e áudio
O Google anunciou novidades sobre a inteligência artificial Gemini. Conheça mais sobre a ferramenta da empresa
O Google anunciou novos recursos para o Gemini e uma nova versão da inteligência artificial: o Gemini 1.5 Flash, que é mais leve e eficaz para aplicações multimodais. A novidade foi compartilhada durante o Google I/O 2024, evento que começou nessa terça-feira, 14, nos Estados Unidos.
A empresa focou a abertura do evento em trazer mais da inteligência artificial generativa, que é assunto no momento. O Gemini 1.5 Flash, concorrente do ChatGPT, conseguiu descrever em tempo real objetos e informações capturadas pela câmera do celular durante uma demonstração.
É + que streaming. É arte, cultura e história.
Confira a seguir mais sobre a ferramenta e quais as novidades que ela apresenta.
Gemini: o que é a assistente virtual?
Gemini é o modelo de linguagem de Inteligência Artificial do Google. Ele possui uma estrutura multimodal capaz de realizar diversas tarefas, como transcrições de vídeos, geração de imagens e de gráficos, busca de erros em uma planilha de dados, análise de textos acadêmicos, dentre outras.
As novidades da assistente agora são realizar tarefas mais completas e interagir de forma ainda mais presente com o usuário.
LEIA TAMBÉM | Inteligência Artificial na mobilidade urbana em 2024
Gemini Ultra, Pro, Nano e Flash: qual a diferença?
Gemini Ultra
É a versão mais avançada e completa da IA. Ela é capaz de entender e interpretar imagens e vídeos em diferentes linguagens da expressão humana, incluindo musical, visual e em código. Isso significa que a IA é capaz de descrever uma partitura, por exemplo.
O Google diz que, em comparação ao rival GPT-4, o modelo Ultra tem resultados melhores em testes de geração de código em Python, desafios de matemática e respostas sobre conhecimentos gerais. Ele custa R$ 96,99/mês, via assinatura do Google One AI Premium.
LEIA TAMBÉM | ChatGPT fica mais rápido e 50% mais barato
Gemini Pro
Pensado para desenvolvedores, o Gemini Pro é capaz de entender diferentes idiomas, extrair informações de áudios e de vídeos sem a necessidade de realizar uma transcrição escrita.
Sua principal característica é a quantidade de contexto que pode processar. O Gemini 1.5 Pro está disponível ao público em versão “preview” na Vertex AI, plataforma de construção de aplicações de IA voltada para empresas.
Gemini Nano
O Geminio Nano é uma versão “compacta” dos modelos Pro e Ultra, capaz de rodar diretamente em celulares. Em conjunto com a câmera, ele poderá sugerir filtros e edições que realcem a foto.
Ela pode transcrever áudios de reuniões e entrevistas, destacar as partes mais importantes e prever as próximas palavras durante uma digitação, funcionando em conjunto com o WhatsApp. A versão está disponível em alguns celulares Androids mais modernos.
Grok: conheça a IA do X, disponível apenas para usuários premium
Gemini Flash
O grande astro do evento foi o anúncio da versão mais leve do Gemini. Segundo o Google, o Gemini 1.5 Flash é indicado para fazer resumos, interpretar tabelas, criar legendas para imagens e vídeos e extrair documentos de arquivos.
Gemini: sinergia entre aplicações do Google
Uma demonstração vista durante o evento foi a capacidade do Gemini de “ler” uma foto contendo diversos compromissos e, a partir disso, criar eventos e marcações no seu calendário.
A IA agora é capaz de conduzir trabalho de integração entre o Gemini e as várias aplicações do Google. Dentro do e-mail, por exemplo, será possível pedir para a ferramenta organizar as mensagens por assunto, encontrar documentos específicos na caixa de entrada e até criar planilhas.
Gemini: planejamento avançado
Agora, a assistente virtual é mais inteligente quando se trata de planejamento de atividades. O Gemini pode responder a coisas como "Planeje uma viagem em família para Buenos Aires que minha esposa possa experimentar a culinária local".
Dentro desse exemplo, o Gemini vai puxar os dados das passagens de avião, estadia de hotel e estabelecer uma lista com sugestões de restaurantes mais turísticos. As atividades poderão ser sincronizadas no Google Maps e, caso confirmadas, também marcadas no calendário.
Gemini: ferramenta interage com usuário
Em uma demonstração durante o evento, a assistente conseguiu descrever em tempo real objetos e informações capturadas pela câmera do celular. A partir dessas imagens, ela também mostrou ser capaz de lembrar, por exemplo, onde o usuário deixou um objeto.
Uma nova função do Gemini é a chamada Gemini Live que permite transformar o aplicativo em um assistente de voz. Ele funciona como se estivesse conversando com a IA em uma ligação e ela responderá instantaneamente.
Como reconhecer fotos criadas por inteligência artificial? DESCUBRA
Gemini: quando poderá ser utilizado?
É importante ressaltar que, quando o assunto é inteligência artificial, nem sempre os avanços são disponibilizados para todos. No caso do Google, isso depende de fatores como qual dispositivo terá compatibilidade ou se o uso será pago ou gratuito.
Muitas atualizações estão sendo feitas na estrutura do Gemini e o processo será gradual. A maioria das novidades tende a priorizar clientes pagantes primeiro e, à medida que se popularizam, serem liberadas para uso gratuito.
Flash, a nova versão, se encontra disponível em forma de prévia, por meio do Google AI Studio (voltado para desenvolvedores), em alguns territórios.
Dúvidas, Críticas e Sugestões? Fale com a gente