Alibaba lança nova versão de modelo de IA e diz competir com DeepSeek; entenda
Em declaração, a empresa disse que o nomeado Qwen2.5 Max "alcança desempenho competitivo em relação aos modelos de primeira linha"A Alibaba, gigante chinesa de comércio eletrônico, responsável de diversas plataformas, inclusive o Aliexpress, lançou uma nova versão de seu modelo de inteligência artificial (IA) que, segundo ela, supera o DeepSeek-V3, lançado nesta semana pela startup com o mesmo nome, em vários benchmarks (Padrão de referência do mercado utilizado para avaliar o desempenho).
Em declaração, a empresa disse que o nomeado Qwen2.5 Max "alcança desempenho competitivo em relação aos modelos de primeira linha".
É + que streaming. É arte, cultura e história.
De acordo com o apresentado, a nova versão da IA contará com um modelo de Mistura de Especialistas (MoE), o que possibilita uma expansão no volume de dados com menos custo computacional, em larga escala.
O grupo de empresas ainda informa, que o modelo foi pré-treinado com mais de 20 trilhões de tokens e aprimorado com metodologias de Ajuste Fino Supervisionado (SFT, sigla em inglês) e Aprendizado por Reforço a partir de Feedback Humano (RLHF, sigla em inglês), técnicas que também auxiliam na melhora do desempenho.
Leia mais
Além disso, reforça que o Qwen2.5 Max "demonstrou vantagens significativas em relação a maioria dos líderes do setor", Como o DeepSeek V3 e GPT-4o, e que estão otimistas em relação aos avanços futuros.
O anúncio acontece depois do lançamento do DeepSeek gerar grandes movimentações no mercado na segunda-feira, 27, derrubando em quase R$ 1 trilhão o valor de mercado de algumas das maiores empresas de tecnologia (Bigtechs).
O modelo de IA da startup da China tem habilidades para resolução de problemas comparáveis ao modelo GPT-4, da Open AI, operando com menos custos. (Com Agência Estado)