Entretien avec Tengyan | L'académicien Wu Hequan : Les avantages, les défis et les voies d'innovation du développement de modèles à grande échelle en Chine

Source de l'image : générée par l'outil d'IA illimitée

Alors que ChatGPT déclenchait un engouement mondial, le modèle d'IA derrière lui a soudainement bondi. Tout le monde veut savoir, quelles sont les dimensions et les normes pour évaluer le niveau d'un grand modèle ?

Le lancement de ChatGPT nous permet de voir l'écart entre la Chine et les États-Unis sur l'AIGC. Alors, quel est l'état de développement actuel du grand modèle chinois ? À quelles opportunités et défis le développement de modèles à grande échelle de la Chine sera-t-il confronté à l'avenir ?

Nous sommes actuellement dans une période critique pour le développement de l'intelligence artificielle généraliste. Face à la tendance au développement de la recherche indépendante sur de grands modèles par diverses institutions, comment améliorer l'efficacité de la puissance de calcul et éviter efficacement les duplications de bas niveau ?

Certaines personnes dans l'industrie craignent que l'IA ne détruise des êtres humains. Cette inquiétude n'est-elle pas fondée ? Comment pouvons-nous prévenir les problèmes avant qu'ils ne surviennent et réaliser les résultats prévisibles et le comportement contrôlable de l'IA ?

Avec diverses questions sur l'AIGC, **Tencent Research Institute a interviewé en exclusivité Wu Hequan, un académicien de l'Académie chinoise d'ingénierie et un expert faisant autorité dans le domaine des communications dans mon pays. **

【Interviewer】

Niu Fulian Chercheur principal, Institut de recherche Tencent

Wu Chunling Chercheur principal à l'Institut de recherche Tencent

Wang Qiang Expert principal de l'Institut de recherche Tencent

(ci-après dénommé T)

L'échelle totale de la puissance de calcul existante de la Chine par rapport aux États-Unis : il y a un écart, mais pas grand

**T : Certaines personnes disent que le développement de modèles à grande échelle en Chine a 1 à 2 ans de retard sur les pays étrangers. Que pensez-vous du développement actuel des modèles à grande échelle en Chine ? **

**Wu Hequan : **La Chine a commencé plus tard que les États-Unis dans le développement de modèles à grande échelle. Après la sortie de ChatGPT, de nombreuses unités nationales ont indiqué qu'elles développaient des modèles génératifs à grande échelle. À l'heure actuelle, il n'y a que quelques entreprises telles que Microsoft et Google aux États-Unis. Par rapport à la recherche sur les modèles à grande échelle, mon pays a plus d'unités qui développent des modèles à grande échelle que les États-Unis, mais le grand nombre de sujets de recherche ne signifie pas que la Chine a un haut niveau de recherche et de développement dans les modèles à grande échelle. On dit que le nombre de paramètres d'un grand modèle domestique atteint 1,75 billion, dépassant GPT-4, mais il n'y a aucun rapport sur son application. ** Bien que certaines entreprises chinoises aient prétendu lancer des chatbots similaires à ChatGPT, ils ne sont actuellement pas aussi bons que ChatGPT en termes de prise en charge multilingue, et il existe toujours un écart en termes de vitesse de réponse en termes de capacités de dialogue chinois. **

** Nous ne remarquons que ChatGPT maintenant, qui cible les tâches génératives et complète principalement la génération du langage comme le chat et l'écriture. Le modèle BERT de Google accorde plus d'attention au jugement et à la prise de décision, mettant l'accent sur la compréhension du langage comme la réponse aux questions et l'extraction des relations sémantiques. tâche, la technologie du modèle BERT mérite également notre attention. ** L'évaluation du niveau des modèles à grande échelle doit être multidimensionnelle, exhaustivité, rationalité, facilité d'utilisation, rapidité de réponse, coût, efficacité énergétique, etc. ** D'une manière générale, l'écart entre le développement de modèles à grande échelle dans mon pays et dans les pays étrangers est de 1 à 2 ans La base n'est toujours pas claire et il n'est pas significatif de tirer cette conclusion maintenant. **

Les entreprises chinoises ont des avantages naturels par rapport aux entreprises étrangères dans l'obtention du corpus chinois et la compréhension de la culture chinoise.** La Chine a les catégories de fabrication les plus complètes et a des conditions favorables pour la formation AIGC pour les industries réelles. En termes de puissance de calcul, la Chine a déjà de bonnes bases. **Selon le rapport OpenAI, la puissance de calcul requise pour former le modèle GPT3 est aussi élevée que 3,64EFlops/jour, ce qui équivaut à 3-4 Pengcheng Cloud Brain II (Pengcheng Cloud Brain II est de 1Eflops, c'est-à-dire des dizaines de milliards de calculs en virgule flottante par seconde). ** Selon les données à fin 2022, les États-Unis représentent 36 % de la puissance de calcul mondiale et la Chine 31 %. Parmi eux, la Chine est nettement supérieure aux États-Unis (selon les données au fin 2021, l'échelle de l'informatique intelligente aux États-Unis représente 15 % de l'échelle totale de l'informatique intelligente mondiale, et la Chine 26 %). Mon pays n'est pas seulement une grande entreprise Internet dotée d'une puissance de calcul considérable, mais aussi les laboratoires nationaux et les laboratoires soutenus par certaines administrations municipales disposent également de ressources de puissance de calcul à grande échelle.On peut dire que la Chine peut également atteindre le support de puissance de calcul requis pour la formation de grands modèles. ** Il est entendu que Pengcheng Lab conçoit Pengcheng Cloud Brain III, qui a une puissance de calcul de 16 EFlops, soit trois fois plus élevée que celle de GPT-3. Il est estimé à 6 milliards de yuans et continuera à fournir un calcul puissant puissance pour la formation à l'intelligence artificielle.

** Recherche et développement de l'AIGC en Chine : nécessité de reconnaître les lacunes, de se concentrer sur les défis et d'innover **

**T : En plus de nos bonnes bases en puissance de calcul, quels sont selon vous les défis à relever pour construire un modèle à grande échelle en Chine ? **

Wu Hequan : La puissance de calcul seule ne suffit pas. Nous sommes toujours confrontés à de nombreux défis dans les aspects suivants :

**Tout d'abord, le fondement du grand modèle est le cadre d'apprentissage en profondeur. Tensorflow et PyTorch aux États-Unis cultivent l'écologie du cadre d'apprentissage en profondeur depuis de nombreuses années. Bien que les entreprises nationales aient également développé indépendamment le cadre d'apprentissage en profondeur, le le test de marché ne suffit pas, et l'écologie reste à construire.

**Deuxièmement, l'extension de l'AIGC aux applications industrielles peut nécessiter plus d'un grand modèle. L'intégration efficace de plusieurs grands modèles pose des défis en matière de normalisation et de fusion de données.

Troisièmement, les grands modèles nécessitent une formation massive sur les données. La Chine a des milliers d'années de civilisation, mais la plupart des dépôts culturels riches n'ont pas été numérisés. Le chinois représente moins de 0,1 % du corpus utilisé dans la formation ChatGPT. Bien que les sociétés Internet de mon pays disposent d'une grande quantité de données de réseau telles que le commerce électronique, les réseaux sociaux et la recherche, les types de données ne sont pas suffisamment complets et la crédibilité des connaissances en ligne n'est pas strictement garantie. utilisé pour la formation nécessite encore beaucoup de travaux miniers.

Quatrièmement, la puce GPU sur laquelle s'appuie la formation des grands modèles est représentée par la puce A100 de Nvidia, mais la puce n'a pas été exportée vers la Chine par les États-Unis, et les performances des GPU nationaux doivent être testées plus avant. encore un écart d'efficacité.

Cinquièmement, il n'y a pas quelques techniciens engagés dans la recherche sur l'IA en Chine, mais il y a toujours une pénurie de talents dotés de capacités de conception d'architecture et de prompteurs de formation aux données AIGC. Avant l'émergence de ChatGPT, certains pensaient que le nombre d'articles et de brevets en Chine en matière d'IA était comparable à celui des États-Unis. ** Le lancement de ChatGPT nous a fait voir l'écart entre la Chine et les États-Unis sur l'AIGC. Maintenant nous devons clairement comprendre et prêter attention aux défis auxquels nous sommes confrontés, faire de véritables innovations, transformer les défis en opportunités et apporter la contribution de la Chine au nouveau cycle de suivi de l'IA. **

Il est recommandé d'ouvrir la plate-forme nationale de puissance de calcul pour prendre en charge diverses formations de modèles à grande échelle

**T : ChatGPT est sans aucun doute une énorme innovation. Comment la Chine devrait-elle encourager des innovations comme celle-ci à l'avenir, et quels aspects du travail devrait-elle faire ? **

**Wu Hequan : **Le développement de l'intelligence artificielle de discriminative à générative est une innovation marquante, et elle a commencé à entrer dans la voie de l'intelligence artificielle générale. De GPT-3 à GPT-4, il est passé de la saisie de texte à la saisie graphique partielle, c'est-à-dire qu'il a augmenté la capacité de comprendre les graphiques.Sur cette base, il n'est pas loin de mettre en œuvre une architecture d'apprentissage en profondeur et un modèle général. pour prendre en charge l'entrée de données multimodale. Oui, mais la généralisation des tâches de grands modèles et le raffinement de l'invocation à la demande de grands modèles nécessitent encore plus d'investissement et d'innovation. L'apprentissage des données sans étiquette et non supervisé pour les graphiques et les vidéos est beaucoup plus difficile que le langage et la saisie de texte.

Nous sommes maintenant dans une période critique de développement vers l'intelligence artificielle générale. Pour notre pays, il s'agit d'une rare opportunité de développement par saute-mouton et aussi d'un défi de taille. La puissance de calcul, les modèles et les données sont les conditions nécessaires au succès de ChatGPT et seront également les facteurs essentiels du succès de l'intelligence artificielle généraliste.En outre, l'écologie, le mécanisme et les talents les plus innovants en sont la clé. La Chine est comparable aux États-Unis en termes d'échelle totale de puissance de calcul, mais la coordination de la puissance de calcul entre les centres de données est toujours confrontée à des défis institutionnels, et le taux d'utilisation et l'efficacité de la puissance de calcul dans de nombreux centres de calcul intelligents ne sont pas élevés. ** De nombreuses unités recherchent de grands modèles de manière indépendante, et la duplication de bas niveau est inévitable. ** Il est recommandé de former une force conjointe avec une division raisonnable du travail sous la coordination des plans nationaux scientifiques et technologiques et industriels. Il est recommandé d'ouvrir la plate-forme de puissance de calcul du laboratoire national pour prendre en charge divers entraînements de modèles à grande échelle. ** Par exemple, la puissance de calcul de Pengcheng Cloud Brain a atteint les 3/4 de la capacité totale, ce qui peut supporter l'échelle de 200 milliards de paramètres comparables à GPT-3. Grand modèle de langage chinois pré-entraîné open source. **Dans le même temps, il est recommandé de former une alliance de puissance de calcul pour concentrer les ressources de puissance de calcul des GPU haut de gamme existants et fournir la puissance de calcul requise pour l'entraînement des données de modèles à grande échelle. **Actuellement, le "China Computing Power Network (C2NET)" principalement construit par le laboratoire Pengcheng a été connecté à plus de 20 centres de calcul intelligent, de supercalcul et de données à grande échelle, et la puissance de calcul hétérogène agrégée a atteint 3EFlops. eux, la puissance de calcul de l'IA auto-développée dépasse 1,8EFlops. De plus, l'application des chatbots n'est qu'un moyen intuitif de former et de tester l'AIGC, mais le chat n'est pas seulement nécessaire. Il est nécessaire de développer divers modèles pour les applications industrielles basées sur de grands modèles, afin de rendre les grands modèles efficaces dans l'industrie. dès que possible Cultivez plus de talents dans l'application de tous les horizons de la vie. **

** Les grandes applications de l'industrie du modèle nécessitent des talents complets qui comprennent à la fois la technologie de l'industrie et la formation à l'IA **

**T : Jusqu'à présent, nous avons vu l'application de ChatGPT dans certains domaines, tels que les chatbots, la génération de texte et la reconnaissance vocale. Y aura-t-il des opportunités d'application dans l'industrie physique et sur le terrain à l'avenir ? Quels sont les obstacles encore rencontrés dans l'application de grands modèles dans l'industrie physique ? **

**Wu Hequan : **Sur la base des chatbots ChatGPT existants, après avoir complété une formation pertinente sur les connaissances de l'industrie et de l'entreprise, ils peuvent entreprendre un travail de service client intelligent dans les entreprises, en remplaçant les travailleurs pour fournir aux clients des services avant-vente et après-vente. Dans le processus de conception et de fabrication qui nécessite une programmation logicielle, ChatGPT peut remplacer les programmeurs pour effectuer des tâches de programmation et vérifier les bogues logiciels. Peut entreprendre la collecte, la traduction et l'arrangement des documents et des matériaux requis dans le processus de conception et de production. Après une formation professionnelle, les grands modèles de type AIGC peuvent être utilisés pour concevoir des logiciels EDA, tels que des outils logiciels pour la conception de circuits intégrés. Dans les sociétés d'animation et de jeux, des robots formés sur la base de grands modèles de type AIGC peuvent écrire des scripts, créer des scripts de jeu et les programmer en fonction d'invites, et terminer le rendu des animations 3D.

Cependant, ChatGPT n'est pas un modèle général, et il est difficile de l'appliquer directement au processus de fabrication de l'industrie réelle.Cependant, il peut être basé sur le principe de la formation ChatGPT et utiliser le graphe de connaissances des industries et des entreprises pour in- formation approfondie. Il est possible de développer un grand modèle dédié aux entreprises pour compléter cela. Le défi du premier emploi est d'avoir besoin de talents qui ne sont pas seulement familiers avec le processus de téléchargement d'entreprise et la technologie de lien clé, mais qui maîtrisent également la formation au big data en intelligence artificielle technologie.

De se concentrer sur les résultats à se concentrer sur le processus, l'intégration de la technologie et du système juridique domine le processus de raisonnement de l'AIGC

**T:ChatGPT fera également diverses erreurs, et cela entraînera également des problèmes d'éthique, de sécurité et de confidentialité. Lors de l'application de grands modèles à l'avenir, comment pouvons-nous créer un environnement de développement inclusif et sûr ? **

**Wu Hequan :**L'émergence de l'IA générative a porté l'attention de la société à l'intelligence artificielle à un niveau sans précédent. Tout en déclenchant une recrudescence de la recherche sur l'IA dans les milieux scientifiques et industriels, de nombreux experts craignent que l'intelligence artificielle ne détruise les êtres humains et appel à l'arrêt des recherches sur le GPT-5. Les inquiétudes de certains experts ne sont pas sans fondement, car le processus de pensée des robots ChatGPT est actuellement opaque. Les humains ont créé ChatGPT, mais à l'heure actuelle, les humains ne saisissent pas pleinement son processus de raisonnement. L'inconnaissable sera incontrôlable et il existe des risques d'anomalie du robot. , anomie éthique et comportement hors de contrôle.

**La solution n'est pas d'arrêter la recherche sur l'intelligence artificielle, mais de se concentrer sur la recherche AIGC au lieu de se concentrer sur les résultats, de concevoir et de mener son processus de raisonnement, afin que les résultats puissent être attendus et que les comportements puissent être contrôlés. **La promotion et l'application du grand modèle à l'avenir nécessitent une évaluation sûre et crédible par une institution qualifiée, et le processus de raisonnement du grand modèle est traçable après inspection. Dans le même temps, il est nécessaire d'établir des lois et réglementations correspondantes en matière de gouvernance de l'IA pour empêcher une formation AIGC trompeuse, tenir les sujets de formation AIGC responsables et punir sévèrement la complicité et la complicité de crimes. Par la complémentarité de la technologie et du système judiciaire, l'intelligence artificielle est devenue une véritable assistante fidèle de l'être humain.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)