Puissance de calcul devient un nouveau modèle de service, la fièvre des "grands modèles" pourrait se refroidir
L'entraînement de grands modèles nécessite un important soutien en puissance de calcul, ce qui fait de la puissance de calcul un nouveau modèle commercial. Cependant, l'industrie fait face à des défis tels que la pénurie de GPU haut de gamme et des coûts élevés. Avec un marché tendant vers la rationalité, la fièvre de "l'alchimie" des grands modèles pourrait progressivement se calmer, et les fournisseurs de services de puissance de calcul doivent anticiper et se transformer à temps.
Le grand modèle météorologique Pangu, entraîné par Bi Kaifeng, diplômé de l'Université Tsinghua, a utilisé 200 cartes GPU pour un pré-entraînement de 2 mois. En tenant compte d'un coût de 7,8 yuans par heure et par carte GPU, le coût de l'entraînement pourrait dépasser 2 millions de yuans. De plus, le coût pour entraîner un grand modèle général pourrait être multiplié par cent.
Actuellement, la Chine compte plus de 100 grands modèles de plus de 10 milliards de paramètres. Cependant, la demande en GPU haut de gamme dépasse l'offre, le prix d'une carte graphique NVIDIA A100 ayant été spéculé entre 200 000 et 300 000 yuan, et le loyer mensuel d'un serveur A100 atteignant également 50 000 à 70 000 yuan. Malgré cela, certaines entreprises font encore face à des problèmes de fournisseurs qui ne respectent pas leurs engagements.
Il est généralement admis dans l'industrie qu'il est difficile de poursuivre le développement de grands modèles sans le soutien de milliards de fonds. À mesure que le marché devient plus rationnel, les entreprises ajusteront également leurs stratégies et leurs contrôles de coûts.
Face à la Puissance de calcul insuffisante, les entreprises ont pris diverses mesures d'adaptation :
Utiliser des données de haute qualité pour améliorer l'efficacité de l'entraînement
Améliorer la stabilité de l'infrastructure, réaliser un fonctionnement stable à long terme au niveau de mille calories.
Optimiser la gestion des ressources de puissance de calcul, augmenter le taux d'utilisation.
Passer de l'architecture cloud à l'architecture supercalculateur
Utiliser des plateformes nationales pour remplacer les GPU Nvidia
La puissance de calcul est devenue un nouveau mode de service. Les services de puissance de calcul incluent la puissance de calcul générale, la puissance de calcul intelligente et la puissance de calcul supercalculateur, fournis aux utilisateurs via des API et d'autres moyens. En amont de la chaîne industrielle, les ressources de base sont fournies, tandis qu'au milieu, la production et la planification de la puissance de calcul sont gérées, et en aval se trouvent les utilisateurs du secteur.
Actuellement, les services de puissance de calcul adoptent principalement deux modes de facturation : à la consommation et par abonnement annuel ou mensuel. À l'avenir, nous allons également promouvoir "l'intégration et la fusion de la puissance de calcul et du réseau", afin de réaliser une planification flexible à travers les architectures, les régions et les fournisseurs de services.
Avec la normalisation de la demande pour les grands modèles, les services de puissance de calcul sont en train de former rapidement une chaîne d'industrie et un modèle commercial uniques. Malgré la pénurie actuelle de GPU haut de gamme, l'offre et la demande finiront par s'équilibrer à long terme. Les fournisseurs de services de puissance de calcul doivent ajuster leur stratégie en temps opportun pour se préparer aux changements du marché.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
12 J'aime
Récompense
12
4
Partager
Commentaire
0/400
GhostAddressMiner
· Il y a 13h
Tu lances un modèle à un milliard qui consomme 200w, tss tss, derrière cette opération, il y a certainement un soutien du capital.
L'émergence de nouveaux modèles de services de puissance de calcul, la tendance des grands modèles pourrait se refroidir.
Puissance de calcul devient un nouveau modèle de service, la fièvre des "grands modèles" pourrait se refroidir
L'entraînement de grands modèles nécessite un important soutien en puissance de calcul, ce qui fait de la puissance de calcul un nouveau modèle commercial. Cependant, l'industrie fait face à des défis tels que la pénurie de GPU haut de gamme et des coûts élevés. Avec un marché tendant vers la rationalité, la fièvre de "l'alchimie" des grands modèles pourrait progressivement se calmer, et les fournisseurs de services de puissance de calcul doivent anticiper et se transformer à temps.
Le grand modèle météorologique Pangu, entraîné par Bi Kaifeng, diplômé de l'Université Tsinghua, a utilisé 200 cartes GPU pour un pré-entraînement de 2 mois. En tenant compte d'un coût de 7,8 yuans par heure et par carte GPU, le coût de l'entraînement pourrait dépasser 2 millions de yuans. De plus, le coût pour entraîner un grand modèle général pourrait être multiplié par cent.
Actuellement, la Chine compte plus de 100 grands modèles de plus de 10 milliards de paramètres. Cependant, la demande en GPU haut de gamme dépasse l'offre, le prix d'une carte graphique NVIDIA A100 ayant été spéculé entre 200 000 et 300 000 yuan, et le loyer mensuel d'un serveur A100 atteignant également 50 000 à 70 000 yuan. Malgré cela, certaines entreprises font encore face à des problèmes de fournisseurs qui ne respectent pas leurs engagements.
Il est généralement admis dans l'industrie qu'il est difficile de poursuivre le développement de grands modèles sans le soutien de milliards de fonds. À mesure que le marché devient plus rationnel, les entreprises ajusteront également leurs stratégies et leurs contrôles de coûts.
Face à la Puissance de calcul insuffisante, les entreprises ont pris diverses mesures d'adaptation :
La puissance de calcul est devenue un nouveau mode de service. Les services de puissance de calcul incluent la puissance de calcul générale, la puissance de calcul intelligente et la puissance de calcul supercalculateur, fournis aux utilisateurs via des API et d'autres moyens. En amont de la chaîne industrielle, les ressources de base sont fournies, tandis qu'au milieu, la production et la planification de la puissance de calcul sont gérées, et en aval se trouvent les utilisateurs du secteur.
Actuellement, les services de puissance de calcul adoptent principalement deux modes de facturation : à la consommation et par abonnement annuel ou mensuel. À l'avenir, nous allons également promouvoir "l'intégration et la fusion de la puissance de calcul et du réseau", afin de réaliser une planification flexible à travers les architectures, les régions et les fournisseurs de services.
Avec la normalisation de la demande pour les grands modèles, les services de puissance de calcul sont en train de former rapidement une chaîne d'industrie et un modèle commercial uniques. Malgré la pénurie actuelle de GPU haut de gamme, l'offre et la demande finiront par s'équilibrer à long terme. Les fournisseurs de services de puissance de calcul doivent ajuster leur stratégie en temps opportun pour se préparer aux changements du marché.