La compétition de puissance de calcul à l'ère de l'IA : le jeu entre rêve et coût
Les grandes entreprises poursuivent sans relâche leur rêve d'IA
Cette semaine, les rapports financiers des géants de la technologie comme Microsoft, Google et Meta ont été publiés. À l'exception de Meta, les résultats financiers de Microsoft et Google ont été impressionnants, ce qui a stimulé leurs actions. Ces entreprises améliorent continuellement la croissance de leurs revenus cloud et leur rentabilité globale grâce à la logique de cycle positif "revenu-dépense-nouveau revenu". L'IA stimule rapidement la croissance des activités telles que la publicité et la recherche. En même temps, la "course à l'armement" en matière de puissance de calcul entre les principaux fournisseurs de cloud est en plein essor, et la possibilité d'une réduction des dépenses en capital à court terme est presque nulle. Dans les premières étapes de l'ère de l'IA, les principaux acteurs doivent continuer à investir pour survivre dans un environnement concurrentiel intense. Selon les prévisions du fournisseur de puissance de calcul CoreWeave, le point d'équilibre entre l'offre et la demande de puissance de calcul pour l'IA ne sera probablement atteint qu'en 2030.
Les applications de l'IA sont encore à mûrir.
Le marché s'attend à voir des applications d'IA "ancrées dans la réalité" qui peuvent vraiment améliorer la productivité ou faciliter la vie. Cette année, nous avons déjà été témoins de la performance impressionnante d'OpenAI Sora et de l'ascension du modèle national Kimi. À l'avenir, nous espérons voir des mises à jour continues des grands modèles comme GPT, Gemini, Llama, ainsi que l'introduction de grands modèles par des géants comme Microsoft et Apple sur des appareils tels que les PC et les téléphones. Le chemin vers l'AGI est sinueux et long, et il pourrait encore falloir un certain temps avant que des applications d'IA vraiment transformantes pour la société ne voient le jour.
Suivez "Puissance de calcul à bon rapport qualité-prix"
En regardant les époques 4G et 5G, la baisse des coûts du trafic mobile a entraîné l'âge d'or des applications mobiles. De même, la baisse des coûts unitaires de la puissance de calcul sera une condition nécessaire pour que l'humanité entre dans l'ère de l'AGI. Une puissance de calcul AI bon marché, accessible et stable est la base de la naissance d'applications AI majeures. Prenons Sora comme exemple, son ouverture au public nécessitera encore plusieurs mois, une raison importante étant le besoin d'optimiser la puissance de calcul requise pour l'inférence. Les principaux fournisseurs de cloud ont la capacité d'investir des sommes énormes pour maintenir leur compétitivité, mais cela ne représente pas la demande totale du marché. Ce dont les petites et moyennes entreprises ont vraiment besoin, c'est d'une puissance de calcul à bon rapport qualité-prix.
Décomposer le coût de la puissance de calcul, à l'exception d'environ 10 % de coûts d'exploitation électrique, la quasi-totalité est un investissement en actifs fixes, y compris les GPU, les équipements réseau, le refroidissement, etc. En ce qui concerne les GPU, TSMC est en train d'étendre la capacité de production CoWoS nécessaire pour la puissance de calcul AI, et la capacité de production mensuelle devrait atteindre près de 40 000 unités d'ici la fin de l'année, soit une augmentation de plus de 150 % par rapport à la capacité de production totale de 2023. En ce qui concerne les équipements réseau, le GB200 de NVIDIA utilise de nombreux câbles en cuivre pour des connexions à courte distance, montrant qu'il ne recherche pas seulement une performance ultra-élevée, mais qu'il doit également prendre en compte le contrôle des coûts pour ses clients. Les fabricants de modules optiques promeuvent également activement des solutions de connexion optique à haut rapport coût-efficacité comme LPO. En matière de refroidissement, avec l'augmentation de la densité de puissance par rack, le refroidissement liquide surpassera le refroidissement par air en termes de rapport coût-efficacité.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
8 J'aime
Récompense
8
4
Partager
Commentaire
0/400
LightningSentry
· 07-20 20:31
Ne brûlez pas d'argent ici.
Voir l'originalRépondre0
LiquidatedAgain
· 07-20 20:30
buy the dip Puissance de calcul encore une fois va être Être liquidé.
Voir l'originalRépondre0
ChainBrain
· 07-20 20:28
C'est juste une spéculation sur la puissance de calcul~
Voir l'originalRépondre0
PerennialLeek
· 07-20 20:26
Encore une fois, on vient prendre les pigeons pour investir de l'argent~
Compétition de puissance de calcul à l'ère de l'IA : le jeu entre les investissements des géants et la demande de rapport qualité-prix élevé
La compétition de puissance de calcul à l'ère de l'IA : le jeu entre rêve et coût
Les grandes entreprises poursuivent sans relâche leur rêve d'IA
Cette semaine, les rapports financiers des géants de la technologie comme Microsoft, Google et Meta ont été publiés. À l'exception de Meta, les résultats financiers de Microsoft et Google ont été impressionnants, ce qui a stimulé leurs actions. Ces entreprises améliorent continuellement la croissance de leurs revenus cloud et leur rentabilité globale grâce à la logique de cycle positif "revenu-dépense-nouveau revenu". L'IA stimule rapidement la croissance des activités telles que la publicité et la recherche. En même temps, la "course à l'armement" en matière de puissance de calcul entre les principaux fournisseurs de cloud est en plein essor, et la possibilité d'une réduction des dépenses en capital à court terme est presque nulle. Dans les premières étapes de l'ère de l'IA, les principaux acteurs doivent continuer à investir pour survivre dans un environnement concurrentiel intense. Selon les prévisions du fournisseur de puissance de calcul CoreWeave, le point d'équilibre entre l'offre et la demande de puissance de calcul pour l'IA ne sera probablement atteint qu'en 2030.
Les applications de l'IA sont encore à mûrir.
Le marché s'attend à voir des applications d'IA "ancrées dans la réalité" qui peuvent vraiment améliorer la productivité ou faciliter la vie. Cette année, nous avons déjà été témoins de la performance impressionnante d'OpenAI Sora et de l'ascension du modèle national Kimi. À l'avenir, nous espérons voir des mises à jour continues des grands modèles comme GPT, Gemini, Llama, ainsi que l'introduction de grands modèles par des géants comme Microsoft et Apple sur des appareils tels que les PC et les téléphones. Le chemin vers l'AGI est sinueux et long, et il pourrait encore falloir un certain temps avant que des applications d'IA vraiment transformantes pour la société ne voient le jour.
Suivez "Puissance de calcul à bon rapport qualité-prix"
En regardant les époques 4G et 5G, la baisse des coûts du trafic mobile a entraîné l'âge d'or des applications mobiles. De même, la baisse des coûts unitaires de la puissance de calcul sera une condition nécessaire pour que l'humanité entre dans l'ère de l'AGI. Une puissance de calcul AI bon marché, accessible et stable est la base de la naissance d'applications AI majeures. Prenons Sora comme exemple, son ouverture au public nécessitera encore plusieurs mois, une raison importante étant le besoin d'optimiser la puissance de calcul requise pour l'inférence. Les principaux fournisseurs de cloud ont la capacité d'investir des sommes énormes pour maintenir leur compétitivité, mais cela ne représente pas la demande totale du marché. Ce dont les petites et moyennes entreprises ont vraiment besoin, c'est d'une puissance de calcul à bon rapport qualité-prix.
Décomposer le coût de la puissance de calcul, à l'exception d'environ 10 % de coûts d'exploitation électrique, la quasi-totalité est un investissement en actifs fixes, y compris les GPU, les équipements réseau, le refroidissement, etc. En ce qui concerne les GPU, TSMC est en train d'étendre la capacité de production CoWoS nécessaire pour la puissance de calcul AI, et la capacité de production mensuelle devrait atteindre près de 40 000 unités d'ici la fin de l'année, soit une augmentation de plus de 150 % par rapport à la capacité de production totale de 2023. En ce qui concerne les équipements réseau, le GB200 de NVIDIA utilise de nombreux câbles en cuivre pour des connexions à courte distance, montrant qu'il ne recherche pas seulement une performance ultra-élevée, mais qu'il doit également prendre en compte le contrôle des coûts pour ses clients. Les fabricants de modules optiques promeuvent également activement des solutions de connexion optique à haut rapport coût-efficacité comme LPO. En matière de refroidissement, avec l'augmentation de la densité de puissance par rack, le refroidissement liquide surpassera le refroidissement par air en termes de rapport coût-efficacité.