Sobre nós Menções legais Contato

Esta nova IA rivaliza com tudo o que você achava possível na tecnologia

Prepare-se: a nova inteligência artificial do Google está chegando para colocar tudo o que você achava possível em tecnologia à prova. Daqui para frente, até a ficção científica vai parecer tímida perto de Gemini, a IA que promete unir ciência e imaginação. Pronto para reavaliar seus conceitos sobre o que uma IA pode fazer?

De ChatGPT a Bard: é hora de mudar a guarda?

Quem reinou sozinho até agora no mundo das inteligências artificiais conversacionais foi o ChatGPT. Mas, segundo os próprios comunicados da Google e comparações recentes, a liderança já está ameaçada: Bard, a IA generativa da Google, agora opera com o suporte do novíssimo modelo Gemini. Para quem lembra do LaMDA, o modelo anterior do Bard que não decolou, o Gemini chega como resposta e, quem sabe, solução definitiva.

O que torna o Gemini tão especial?

Google descreve o Gemini como seu modelo de IA mais potente até hoje – e não faltam razões para esse entusiasmo. O sistema é multimodal, ou seja, entende, processa e integra diferentes tipos de dados de entrada:

  • Texto
  • Áudio
  • Imagem
  • Vídeo
  • Código de computador

A DeepMind, unidade de IA da Google, reforça: Gemini é capaz de generalizar, compreender fluentemente e combinar diferentes fontes de informações entre texto, código, áudio, imagem e vídeo. A própria empresa garante que o desempenho vai além do já consagrado GPT-4.

Três variantes para dominar todos os cenários

Gemini chega em três versões distintas:

  • Gemini Ultra: O modelo mais avançado, reservado para as tarefas mais complexas. Está previsto para início de 2024, inclusive como motor de uma versão parruda do Bard.
  • Gemini Pro: Apresentado pela DeepMind como “o melhor modelo para atuar numa ampla gama de tarefas”. Já está integrado ao Bard (mas apenas em inglês e fora da Europa, por enquanto – Google já publicou os países que têm acesso liberado).
  • Gemini Nano: A leve do trio, vem nativa no Google Pixel 8. Aqui a aposta é automação prática: geração automática de resumos para gravações de voz, respostas inteligentes no Gboard e muito mais para tornar o uso diário mais esperto. Sim, seu celular pode ficar ainda mais inteligente (mas só se for Pixel 8).

Gemini VS GPT: duelo de titãs da IA

Por desempenho, Gemini já chega com um título importante na bagagem. De acordo com a Google, é o primeiro modelo a superar especialistas humanos no teste MMLU (Massive Multitask Language Understanding – ou “Compreensão Maciça e Multitarefa de Linguagens”). Este teste desafia IAs em tarefas variadas, da ciência à literatura e história, para avaliar a compreensão e solução de problemas.

Na prática, testes realizados colocaram Gemini Pro, GPT-3.5 e GPT-4 frente a frente. Um desafio? Completar a famosa sequência numérica: 3, 4, 7, 11, 18, ?. Dentre as opções (20, 24, 29, 33), a resposta correta é 29. Nessa prova:

  • Gemini Pro acertou (mesmo sem muita convicção, mas detalhou seu raciocínio passo a passo).
  • GPT-4 também acertou com processo claro e resposta precisa.
  • GPT-3.5… chutou 34. Pois é, alguém precisava errar.

Aliás, Gemini Pro foi além, sugerindo até o uso da famosa sequência de Fibonacci para resolver o desafio, enquanto justificava a lógica adotada. Mostrou método e até nomeou regras usadas no processo – está querendo impressionar, claramente.

Segundo a Google DeepMind, testes comparativos mostraram que Gemini superou o GPT-4 em 30 de 32 competências avaliadas. Contudo, os próprios responsáveis pelos testes lembram: essas provas isoladas ilustram diferenças de funcionamento, mas não definem o desempenho absoluto das IAs em todas as situações.

Não menos importante: o Gemini Ultra, anunciado como a versão mais poderosa, só estará acessível em 2024. E a promessa é de uma compreensão multimodal (texto, áudio, imagem, vídeo, código) verdadeiramente revolucionária – por enquanto, só para sonhar com as demos do Google.

Conclusão: chegou a era do “vale tudo” da IA?

Seja você fã de ciência ou de ficção científica, eis que surge uma IA multiuso, multimodal e, ao que tudo indica, multitalentosa. O ChatGPT, veterano da área, talvez precise arrumar as malas – ao menos na forma 3.5. Afinal, com as próximas evoluções do GPT-4 e a chegada triunfal do Gemini Ultra, parece que a competição só vai esquentar.

Enquanto isso, fica o convite: acompanhe as versões, escolha seu preferido e prepare-se para um futuro em que a pergunta “IA faz isso?” será cada vez mais respondida por um “claro que sim” – agora, com sotaque de Bard alimentado por Gemini.

Beatriz Marques
Beatriz Marques
Como redatora apaixonada na Rádio Miróbriga, me esforço todos os dias para contar histórias que ressoem com a nossa comunidade. Com mais de 10 anos de experiência no jornalismo, já cobri uma ampla gama de assuntos, desde questões locais até investigações aprofundadas. Meu compromisso é sempre buscar a verdade e apresentar relatos autênticos que inspirem e informem nossos ouvintes.