Gemini: entenda mais sobre o novo lançamento do Google

O Gemini, sendo um modelo multimodal, pode compreender informações de várias fontes, como texto, imagens, vídeo, áudio e código

A Google fez lançamento de sua nova arma: o Gemini, seu mais recente modelo de linguagem (LLM). Este LLM já está disponível para testes e promete ser a inteligência artificial mais avançada até agora. Ao contrário das expectativas, a Google optou por lançar seu novo modelo de IA agora, em três variantes: Nano, Pro e Ultra. O Gemini, sendo um modelo multimodal, pode compreender informações de várias fontes, como texto, imagens, vídeo, áudio e código, tornando-se o “modelo mais flexível até o momento”, de acordo com a explicação da Google.

“Projetamos o Gemini para ser nativamente multimodal, pré-treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoamos com dados multimodais adicionais para refinar ainda mais sua eficácia”, disse Demis Hassabis, diretor-executivo da DeepMind, subsidiária de IA do Google.

O Gemini Ultra, só estará disponível no início do próximo ano. De acordo com a Google, os resultados do Gemini Ultra superam ligeiramente os do GPT-4, da OpenAI, em 30 dos 32 testes acadêmicos de uso geral. O Gemini alcançou uma pontuação de 90,04% no MMLU (compreensão de linguagem multitarefa em massa), tornando-se o primeiro modelo a superar especialistas humanos em um teste abrangendo 57 disciplinas, como Física, História, Medicina e Ética, juntamente com habilidades de resolução de problemas.

O Gemini foi projetado do zero pela Google, adotando uma abordagem diferente para lidar com problemas. Sendo nativamente multimodal, o Gemini é pré-treinado desde o início para combinar diferentes modalidades. Ele é capaz de interpretar desenhos em tempo real, relacionar objetos e sugerir músicas conforme recebe instruções.

A Google destaca o novo sistema de geração de código do Gemini, o AlphaCode2, que demonstra bom desempenho em Matemática Complexa e compreensão teórica da Ciência da Computação. O Gemini Ultra é considerado o modelo mais eficiente até agora, consumindo menos energia do que pode fornecer, graças à inclusão do sistema TPU v5p, a unidade de processamento de tensores mais poderosa da Google.

Embora a Google não tenha compartilhado oficialmente o número de parâmetros, o Gemini Ultra é elogiado como o modelo mais eficiente já criado. O Bard, chatbot do Google, receberá uma grande atualização ao mudar para o Gemini Pro, estando disponível em inglês em mais de 180 países e na Europa nos próximos meses. A Google planeja lançar o Bard Advanced no próximo ano, integrando o Gemini Ultra.

A IA também estará disponível em serviços como buscador, Ads, Chrome e Duet AI. A partir de 13 de dezembro, os desenvolvedores poderão acessar o Gemini Pro por meio da API do Google AI Studio ou Vertex AI.

A Google assegura que o Gemini será submetido a avaliações de segurança abrangentes, trabalhando com especialistas externos para identificar pontos cegos e aplicando classificadores de segurança específicos para conteúdos relacionados à violência ou estereótipos negativos. Sundar Pichai, CEO da Google, considera o lançamento do Gemini como o início de uma nova era, enquanto o GPT-5 é aguardado para o próximo ano.

“Estamos abordando esse trabalho com ousadia e responsabilidade.Isso significa sermos ambiciosos em nossa pesquisa e buscar capacidades que trarão benefícios enormes para as pessoas e a sociedade, ao mesmo tempo em que construímos salvaguardas e trabalhamos em colaboração com governos e especialistas para enfrentar os riscos à medida que a IA se torna mais capaz”, disse Sundar Pichai, diretor-executivo da Alphabet, controladora do Google.

Na integra

Gemini: entenda mais sobre o novo lançamento do Google

Leia também