A redução de preço da Tongyi Qianwen em 97% e o lançamento de vários modelos Código aberto estão a provocar uma tendência de redução de custos na indústria de IA.

A onda de redução de preços dos grandes modelos varre a indústria, Código aberto + redução de preços da Tongyi Qianwen em dupla ação

Recentemente, a Alibaba Cloud anunciou uma redução significativa nos preços de chamadas API da sua série de grandes modelos Tongyi Qianwen. Entre eles, o preço de entrada do modelo principal Qwen-Long caiu de 0,02 yuan por mil tokens para 0,5 yuan por milhão de tokens, uma redução de até 97%. Esta medida marca a entrada da indústria de grandes modelos em um novo ciclo de redução de preços.

Na verdade, a Tongyi Qianwen não é a primeira fornecedora de grandes modelos a adotar uma estratégia de redução de preços. Desde maio, várias empresas de IA conhecidas lançaram produtos a preços baixos ou reduziram os preços dos produtos existentes:

  • O preço da nova API de modelo de uma empresa de quantificação de Código aberto é apenas cerca de um por cento do GPT-4 Turbo.
  • Uma empresa de IA reduziu em 80% o preço de chamada do seu modelo pessoal.
  • Uma empresa de IA conhecida lançou um novo produto com desempenho comparável ao GPT-4, mas com metade do preço.
  • Duas principais grandes modelos de uma empresa de motores de busca anunciaram que estarão totalmente gratuitos.
  • Uma empresa de tecnologia de voz anunciou que sua API estará disponível gratuitamente e de forma permanente.

Os analistas da indústria acreditam que esta onda de grandes reduções de preços pode ser originada pelo avanço da tecnologia de inferência de grandes modelos e pela diminuição dos custos. A redução de preços ajuda a diminuir a barreira de entrada para os desenvolvedores de aplicações de IA, promovendo uma aplicação mais ampla da tecnologia de IA.

Além de reduzir os preços, a Ali Tongyi também adotou uma estratégia de Código aberto. No dia 9 de maio, a Ali Tongyi lançou uma série de modelos de linguagem com parâmetros que variam de 5 milhões a 110 bilhões, para atender a diferentes necessidades de cenários:

  • Modelo de pequeno tamanho (0.5B-14B) adequado para implantação em dispositivos de lado do cliente, como smartphones e PCs.
  • Modelo de tamanho médio (32B) busca um equilíbrio entre desempenho e eficiência
  • Modelo de grande dimensão (72B-110B) suporta aplicações empresariais e de pesquisa.

Além disso, a Tongyi também lançou modelos multimodais de visão, áudio e código em Código aberto. Esta série de iniciativas visa proporcionar mais opções aos desenvolvedores e promover o desenvolvimento diversificado de aplicações de IA.

Especialistas do setor afirmam que "redução de preços + Código aberto" está se tornando a estratégia consensual entre os fabricantes globais de grandes modelos. Isso ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: preços elevados de API e qualidade insuficiente dos modelos de código aberto, acelerando assim a implementação de aplicações de IA. Com os avanços na tecnologia de grandes modelos e a diminuição dos custos, espera-se que as aplicações de IA no futuro floresçam em uma variedade de formas.

GPT4.23%
TURBO-2.48%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • Partilhar
Comentar
0/400
MondayYoloFridayCryvip
· 23h atrás
Enrolou-se, enrolou-se
Ver originalResponder0
0xOverleveragedvip
· 23h atrás
idiotas党赢麻了
Ver originalResponder0
GasFeeCrybabyvip
· 07-21 17:52
Pobreza! Outra guerra de queimar dinheiro!
Ver originalResponder0
TheMemefathervip
· 07-21 17:44
Descer, descer, descer. De qualquer forma, não posso usar.
Ver originalResponder0
MEVHuntervip
· 07-21 17:38
Quem joga arbitragem não gosta de queda de preços. Esta onda pode ser uma boa oportunidade para a arbitragem de GPU.
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)