Fuente de la imagen: Generada por la herramienta de IA Unbounded
Cuando ChatGPT desencadenó una locura mundial, el modelo de IA detrás de él surgió repentinamente. Todos quieren saber, ¿cuáles son las dimensiones y estándares para evaluar el nivel de un modelo grande?
El lanzamiento de ChatGPT nos permite ver la brecha entre China y Estados Unidos en AIGC Entonces, ¿cuál es el estado de desarrollo actual del gran modelo de China? ¿Qué oportunidades y desafíos enfrentará el desarrollo de modelos a gran escala de China en el futuro?
Actualmente nos encontramos en un período crítico para el desarrollo de la inteligencia artificial general. Frente a la tendencia de desarrollo de la investigación independiente en modelos grandes por parte de varias instituciones, ¿cómo mejorar la eficiencia de la potencia informática y evitar efectivamente la duplicación de bajo nivel?
A algunas personas en la industria les preocupa que la IA destruya a los seres humanos. ¿Esta preocupación es infundada? ¿Cómo podemos prevenir problemas antes de que sucedan y obtener los resultados predecibles y el comportamiento controlable de la IA?
Con varias preguntas sobre AIGC, **Tencent Research Institute entrevistó exclusivamente a Wu Hequan, académico de la Academia China de Ingeniería y experto autorizado en el campo de las comunicaciones en mi país. **
【Entrevistador】
Niu Fulian Investigador sénior, Instituto de Investigación Tencent
Wu Chunling Investigador sénior en el Instituto de Investigación Tencent
Wang Qiang Experto sénior del Instituto de Investigación Tencent
(en lo sucesivo, T)
La escala total del poder de cómputo existente de China en comparación con los Estados Unidos: hay una brecha, pero no grande
**T: Algunas personas dicen que el desarrollo del modelo a gran escala de China está 1 o 2 años por detrás de los países extranjeros. ¿Qué piensa del desarrollo actual de los modelos a gran escala de China? **
**Wu Hequan: **China comenzó más tarde que Estados Unidos en el desarrollo de modelos a gran escala. Después de que salió ChatGPT, muchas unidades domésticas expresaron que están desarrollando modelos generativos a gran escala. En la actualidad, solo hay unos pocos compañías como Microsoft y Google en los EE. UU. En comparación con la investigación de modelos a gran escala, mi país tiene más unidades que desarrollan modelos a gran escala que los Estados Unidos, pero la gran cantidad de sujetos de investigación no significa que China tenga un alto nivel de investigación y desarrollo en modelos a gran escala. Se dice que la cantidad de parámetros de un modelo doméstico grande llega a 1,75 billones, superando a GPT-4, pero no hay informes de su aplicación. **Aunque algunas empresas chinas han afirmado lanzar chatbots similares a ChatGPT, actualmente no son tan buenos como ChatGPT en términos de soporte multilingüe, y todavía hay una brecha en términos de velocidad de respuesta en términos de capacidades de diálogo en chino. **
**Solo notamos ChatGPT ahora, que se enfoca en tareas generativas y principalmente completa la generación de lenguaje, como chatear y escribir. El modelo BERT de Google presta más atención al juicio y la toma de decisiones, enfatizando la comprensión del lenguaje, como la respuesta a preguntas y la extracción de relaciones semánticas. la tecnología del modelo BERT también merece nuestra atención. **La evaluación del nivel de los modelos a gran escala debe ser multidimensional, integral, racional, fácil de usar, velocidad de respuesta, costo, eficiencia energética, etc. **En términos generales, la brecha entre el desarrollo de modelos a gran escala en mi país y en el extranjero es de 1 a 2 años. La base aún no está clara y no tiene sentido sacar esta conclusión ahora. **
Las empresas chinas tienen ventajas naturales sobre las empresas extranjeras en la obtención del corpus chino y la comprensión de la cultura china **China tiene las categorías de fabricación más completas y tiene condiciones favorables para la formación de AIGC para industrias reales. En términos de poder de cómputo, China ya tiene una buena base. **Según el informe de OpenAI, la potencia informática necesaria para entrenar el modelo GPT3 es de 3,64 EFlops/día, lo que equivale a 3-4 Pengcheng Cloud Brain II (Pengcheng Cloud Brain II es 1Eflops, es decir, decenas de miles de millones de cálculos de punto flotante por segundo). **Según los datos a finales de 2022, Estados Unidos representa el 36 % de la potencia informática mundial y China el 31 %, entre ellos, China supera significativamente a Estados Unidos (según los datos del A fines de 2021, la escala de la computación inteligente en los Estados Unidos representa el 15 % de la escala total de la computación inteligente global, y China representa el 26 %. Mi país no solo es una gran empresa de Internet con un poder informático considerable, sino también Los laboratorios nacionales y los laboratorios apoyados por algunos gobiernos municipales también tienen recursos de poder de cómputo a gran escala.Se puede decir que China también puede lograr el soporte de poder de cómputo requerido para entrenar modelos grandes. **Se entiende que Pengcheng Lab está diseñando Pengcheng Cloud Brain III, que tiene un poder de cómputo de 16EFlops, que es tres veces más alto que el de GPT-3. Se espera que cueste 6 mil millones de yuanes y continuará brindando un cómputo poderoso potencia para el entrenamiento de inteligencia artificial fuerte apoyo.
Investigación y desarrollo de AIGC en China: es necesario reconocer la brecha, centrarse en los desafíos e innovar
**T: Además de nuestra buena base en potencia informática, ¿qué desafíos cree que existen para construir un modelo a gran escala en China? **
Wu Hequan: El poder de cómputo por sí solo no es suficiente. Todavía enfrentamos muchos desafíos en los siguientes aspectos:
**En primer lugar, la base del gran modelo es el marco de aprendizaje profundo. Tensorflow y PyTorch en los Estados Unidos han estado cultivando la ecología del marco de aprendizaje profundo durante muchos años. Aunque las empresas nacionales también han desarrollado de forma independiente el marco de aprendizaje profundo, el la prueba de mercado no es suficiente, y la ecología aún debe construirse.
** En segundo lugar, extender AIGC a aplicaciones industriales puede requerir más de un modelo grande. La forma de integrar de manera eficiente múltiples modelos grandes presenta desafíos en la estandarización y la fusión de datos.
Tercero, los modelos grandes requieren un entrenamiento de datos masivo. China tiene miles de años de civilización, pero la mayoría de los ricos depósitos culturales no se han digitalizado. El chino representa menos del 0,1 % del corpus utilizado en el entrenamiento de ChatGPT. Aunque las empresas de Internet de mi país tienen una gran cantidad de datos de red, como comercio electrónico, redes sociales y búsqueda, los tipos de datos no son lo suficientemente completos y la credibilidad del conocimiento en línea no está estrictamente garantizada. usado para entrenamiento todavía necesita mucho trabajo de minería.
Cuarto, el chip GPU en el que se basa el entrenamiento de modelos grandes está representado por el chip A100 de Nvidia, pero Estados Unidos ha restringido la exportación del chip a China, y el rendimiento de las GPU nacionales necesita más pruebas. todavía hay una brecha en la eficiencia.
Quinto, no son pocos los técnicos que se dedican a la investigación de IA en China, pero todavía hay una escasez de talentos con capacidades de diseño de arquitectura e indicadores de capacitación de datos AIGC. Antes del surgimiento de ChatGPT, algunas personas pensaban que la cantidad de documentos y patentes en China en IA era comparable a la de los EE. UU. **El lanzamiento de ChatGPT nos hizo ver la brecha entre China y los Estados Unidos en AIGC. Ahora Necesitamos comprender claramente y prestar atención a los desafíos que enfrentamos, hacer innovaciones reales, convertir los desafíos en oportunidades y hacer la contribución de China a la nueva ronda de seguimiento de la IA. **
Se recomienda abrir la plataforma de potencia informática nacional para admitir varios modelos de formación a gran escala
**T: ChatGPT es sin duda una gran innovación. ¿Cómo debería China fomentar innovaciones como esta en el futuro y qué aspectos del trabajo debería hacer? **
**Wu Hequan: **El desarrollo de la inteligencia artificial de discriminativa a generativa es una innovación histórica y ha comenzado a entrar en el camino de la inteligencia artificial general. De GPT-3 a GPT-4, se ha desarrollado desde la entrada de texto a la entrada gráfica parcial, es decir, ha aumentado la capacidad de comprensión de los gráficos.Sobre esta base, no está lejos implementar una arquitectura de aprendizaje profundo y un modelo general. para admitir la entrada de datos multimodal. Sí, pero la generalización de tareas de modelos grandes y el refinamiento de la invocación bajo demanda de modelos grandes aún requieren una mayor inversión e innovación. El aprendizaje de datos sin etiquetar y sin supervisión para gráficos y videos es mucho más difícil que el idioma. y entrada de texto.
Ahora estamos en un período crítico de desarrollo hacia la inteligencia artificial general.Para nuestro país, esta es una oportunidad única para el desarrollo de saltos y también un desafío severo. La potencia informática, los modelos y los datos son las condiciones necesarias para el éxito de ChatGPT y también serán los factores esenciales para el éxito de la inteligencia artificial general. Además, la ecología, los mecanismos y los talentos más innovadores son la clave. China es comparable a los Estados Unidos en términos de la escala total de poder de cómputo, pero la coordinación del poder de cómputo entre los centros de datos aún enfrenta desafíos institucionales, y la tasa de utilización y la eficiencia del poder de cómputo en muchos centros de cómputo inteligentes no son altas. **Muchas unidades investigan modelos grandes de forma independiente, y es inevitable repetir a un nivel bajo Se recomienda formar una fuerza conjunta con una división razonable del trabajo bajo la coordinación de los planes nacionales de ciencia y tecnología e industriales. Se recomienda abrir la plataforma de poder de cómputo del laboratorio nacional para admitir varios entrenamientos de modelos a gran escala. Por ejemplo, el poder de cómputo de Pengcheng Cloud Brain ha alcanzado 3/4 de la capacidad total, que puede soportar la escala de 200 mil millones de parámetros comparables a GPT-3 Modelo grande de idioma chino preentrenado de código abierto. **Al mismo tiempo, se recomienda formar una alianza de poder de cómputo para concentrar los recursos de poder de cómputo de las GPU de gama alta existentes y proporcionar la potencia de cómputo requerida para el entrenamiento de datos de modelos a gran escala. **Actualmente, la "Red de energía de computación de China (C2NET)", construida principalmente por Pengcheng Laboratory, se ha conectado a más de 20 centros de datos, supercomputación y computación inteligente a gran escala, y la potencia de computación heterogénea agregada ha alcanzado 3EFlops. ellos, la potencia informática de IA de desarrollo propio supera los 1,8 EFlops. Además, la aplicación de chatbots es solo una forma intuitiva de entrenar y probar AIGC, pero el chat no solo es necesario, es necesario desarrollar varios modelos para aplicaciones industriales basadas en modelos grandes, para que los modelos grandes sean efectivos en la industria. tan pronto como sea posible Cultivar más talentos en la aplicación de todos los ámbitos de la vida. **
Las aplicaciones de la industria de modelos grandes requieren talentos integrales que comprendan tanto la tecnología de la industria como la capacitación en IA
**T: Hasta ahora hemos visto la aplicación de ChatGPT en algunos campos, como chatbots, generación de texto y reconocimiento de voz. ¿Habrá algunas oportunidades de aplicación en la industria física y el campo en el futuro? ¿Qué obstáculos aún se enfrentan en la aplicación de modelos grandes en la industria física? **
**Wu Hequan: **Basado en los chatbots ChatGPT existentes, después de complementar la capacitación relevante de la industria y el conocimiento empresarial, pueden realizar un trabajo inteligente de servicio al cliente en las empresas, reemplazando a los trabajadores para brindar a los clientes servicios de preventa y posventa. En el proceso de diseño y fabricación que requiere programación de software, ChatGPT puede reemplazar a los programadores para completar tareas de programación y verificar errores de software. Puede encargarse de la recopilación, traducción y disposición de los documentos y materiales necesarios en el proceso de diseño y producción. Después de la capacitación profesional, los modelos grandes similares a AIGC se pueden usar para diseñar software EDA, como software de herramientas para diseño de circuitos integrados. En las empresas de animación y juegos, los robots entrenados en modelos grandes similares a AIGC pueden escribir guiones, crear guiones de juegos y programarlos de acuerdo con indicaciones, y completar la representación de animaciones 3D.
Sin embargo, ChatGPT no es un modelo general y es difícil aplicarlo directamente al proceso de fabricación de la industria real. Sin embargo, puede basarse en el principio de entrenar a ChatGPT y usar el gráfico de conocimiento de industrias y empresas para obtener información. Capacitación profunda. Es posible desarrollar un gran modelo dedicado a las empresas para completar esto. El desafío del primer trabajo es necesitar talentos que no solo estén familiarizados con el proceso de carga empresarial y la tecnología de enlace clave, sino que también dominen la capacitación de big data de inteligencia artificial. tecnología.
De centrarse en los resultados a centrarse en el proceso, la integración de la tecnología y el sistema legal domina el proceso de razonamiento de AIGC
**T:ChatGPT también cometerá varios errores y traerá algunos problemas éticos, de seguridad y de privacidad. Al aplicar modelos grandes en el futuro, ¿cómo podemos crear un entorno inclusivo, seguro y de desarrollo? **
**Wu Hequan:**El surgimiento de la IA generativa ha llevado la atención de la sociedad a la inteligencia artificial a un nivel sin precedentes. Mientras desencadena un aumento en la investigación de la IA en los círculos científicos e industriales, a muchos expertos les preocupa que la inteligencia artificial destruya a los seres humanos y Convocatoria para detener la investigación sobre GPT-5. Las preocupaciones de algunos expertos no son infundadas, porque el proceso de pensamiento de los robots ChatGPT es actualmente opaco. Los humanos han creado ChatGPT, pero en la actualidad los humanos no comprenden completamente su proceso de razonamiento. Lo incognoscible será incontrolable y existen riesgos de anomalías en los robots. , anomia ética y comportamiento fuera de control.
**La solución no es detener la investigación en inteligencia artificial, sino centrarse en la investigación AIGC en lugar de centrarse en los resultados, diseñar y liderar su proceso de razonamiento, de modo que se puedan esperar resultados y controlar los comportamientos. **La promoción y aplicación del modelo grande en el futuro requiere una evaluación segura y creíble por parte de una institución calificada, y el proceso de razonamiento del modelo grande es rastreable después de la inspección. Al mismo tiempo, es necesario establecer leyes y reglamentos de gobernanza de IA correspondientes para evitar la capacitación engañosa de AIGC, responsabilizar a los sujetos de capacitación de AIGC y castigar severamente la complicidad y los delitos de complicidad. A través de la complementariedad de la tecnología y el sistema legal, la inteligencia artificial se ha convertido en un asistente verdaderamente leal para los seres humanos.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Entrevista de Tengyan | Académico Wu Hequan: Las ventajas, los desafíos y los caminos de innovación del desarrollo de modelos a gran escala de China
Cuando ChatGPT desencadenó una locura mundial, el modelo de IA detrás de él surgió repentinamente. Todos quieren saber, ¿cuáles son las dimensiones y estándares para evaluar el nivel de un modelo grande?
El lanzamiento de ChatGPT nos permite ver la brecha entre China y Estados Unidos en AIGC Entonces, ¿cuál es el estado de desarrollo actual del gran modelo de China? ¿Qué oportunidades y desafíos enfrentará el desarrollo de modelos a gran escala de China en el futuro?
Actualmente nos encontramos en un período crítico para el desarrollo de la inteligencia artificial general. Frente a la tendencia de desarrollo de la investigación independiente en modelos grandes por parte de varias instituciones, ¿cómo mejorar la eficiencia de la potencia informática y evitar efectivamente la duplicación de bajo nivel?
A algunas personas en la industria les preocupa que la IA destruya a los seres humanos. ¿Esta preocupación es infundada? ¿Cómo podemos prevenir problemas antes de que sucedan y obtener los resultados predecibles y el comportamiento controlable de la IA?
Con varias preguntas sobre AIGC, **Tencent Research Institute entrevistó exclusivamente a Wu Hequan, académico de la Academia China de Ingeniería y experto autorizado en el campo de las comunicaciones en mi país. **
【Entrevistador】
Niu Fulian Investigador sénior, Instituto de Investigación Tencent
Wu Chunling Investigador sénior en el Instituto de Investigación Tencent
Wang Qiang Experto sénior del Instituto de Investigación Tencent
(en lo sucesivo, T)
La escala total del poder de cómputo existente de China en comparación con los Estados Unidos: hay una brecha, pero no grande
**T: Algunas personas dicen que el desarrollo del modelo a gran escala de China está 1 o 2 años por detrás de los países extranjeros. ¿Qué piensa del desarrollo actual de los modelos a gran escala de China? **
**Wu Hequan: **China comenzó más tarde que Estados Unidos en el desarrollo de modelos a gran escala. Después de que salió ChatGPT, muchas unidades domésticas expresaron que están desarrollando modelos generativos a gran escala. En la actualidad, solo hay unos pocos compañías como Microsoft y Google en los EE. UU. En comparación con la investigación de modelos a gran escala, mi país tiene más unidades que desarrollan modelos a gran escala que los Estados Unidos, pero la gran cantidad de sujetos de investigación no significa que China tenga un alto nivel de investigación y desarrollo en modelos a gran escala. Se dice que la cantidad de parámetros de un modelo doméstico grande llega a 1,75 billones, superando a GPT-4, pero no hay informes de su aplicación. **Aunque algunas empresas chinas han afirmado lanzar chatbots similares a ChatGPT, actualmente no son tan buenos como ChatGPT en términos de soporte multilingüe, y todavía hay una brecha en términos de velocidad de respuesta en términos de capacidades de diálogo en chino. **
**Solo notamos ChatGPT ahora, que se enfoca en tareas generativas y principalmente completa la generación de lenguaje, como chatear y escribir. El modelo BERT de Google presta más atención al juicio y la toma de decisiones, enfatizando la comprensión del lenguaje, como la respuesta a preguntas y la extracción de relaciones semánticas. la tecnología del modelo BERT también merece nuestra atención. **La evaluación del nivel de los modelos a gran escala debe ser multidimensional, integral, racional, fácil de usar, velocidad de respuesta, costo, eficiencia energética, etc. **En términos generales, la brecha entre el desarrollo de modelos a gran escala en mi país y en el extranjero es de 1 a 2 años. La base aún no está clara y no tiene sentido sacar esta conclusión ahora. **
Las empresas chinas tienen ventajas naturales sobre las empresas extranjeras en la obtención del corpus chino y la comprensión de la cultura china **China tiene las categorías de fabricación más completas y tiene condiciones favorables para la formación de AIGC para industrias reales. En términos de poder de cómputo, China ya tiene una buena base. **Según el informe de OpenAI, la potencia informática necesaria para entrenar el modelo GPT3 es de 3,64 EFlops/día, lo que equivale a 3-4 Pengcheng Cloud Brain II (Pengcheng Cloud Brain II es 1Eflops, es decir, decenas de miles de millones de cálculos de punto flotante por segundo). **Según los datos a finales de 2022, Estados Unidos representa el 36 % de la potencia informática mundial y China el 31 %, entre ellos, China supera significativamente a Estados Unidos (según los datos del A fines de 2021, la escala de la computación inteligente en los Estados Unidos representa el 15 % de la escala total de la computación inteligente global, y China representa el 26 %. Mi país no solo es una gran empresa de Internet con un poder informático considerable, sino también Los laboratorios nacionales y los laboratorios apoyados por algunos gobiernos municipales también tienen recursos de poder de cómputo a gran escala.Se puede decir que China también puede lograr el soporte de poder de cómputo requerido para entrenar modelos grandes. **Se entiende que Pengcheng Lab está diseñando Pengcheng Cloud Brain III, que tiene un poder de cómputo de 16EFlops, que es tres veces más alto que el de GPT-3. Se espera que cueste 6 mil millones de yuanes y continuará brindando un cómputo poderoso potencia para el entrenamiento de inteligencia artificial fuerte apoyo.
Investigación y desarrollo de AIGC en China: es necesario reconocer la brecha, centrarse en los desafíos e innovar
**T: Además de nuestra buena base en potencia informática, ¿qué desafíos cree que existen para construir un modelo a gran escala en China? **
Wu Hequan: El poder de cómputo por sí solo no es suficiente. Todavía enfrentamos muchos desafíos en los siguientes aspectos:
**En primer lugar, la base del gran modelo es el marco de aprendizaje profundo. Tensorflow y PyTorch en los Estados Unidos han estado cultivando la ecología del marco de aprendizaje profundo durante muchos años. Aunque las empresas nacionales también han desarrollado de forma independiente el marco de aprendizaje profundo, el la prueba de mercado no es suficiente, y la ecología aún debe construirse.
** En segundo lugar, extender AIGC a aplicaciones industriales puede requerir más de un modelo grande. La forma de integrar de manera eficiente múltiples modelos grandes presenta desafíos en la estandarización y la fusión de datos.
Tercero, los modelos grandes requieren un entrenamiento de datos masivo. China tiene miles de años de civilización, pero la mayoría de los ricos depósitos culturales no se han digitalizado. El chino representa menos del 0,1 % del corpus utilizado en el entrenamiento de ChatGPT. Aunque las empresas de Internet de mi país tienen una gran cantidad de datos de red, como comercio electrónico, redes sociales y búsqueda, los tipos de datos no son lo suficientemente completos y la credibilidad del conocimiento en línea no está estrictamente garantizada. usado para entrenamiento todavía necesita mucho trabajo de minería.
Cuarto, el chip GPU en el que se basa el entrenamiento de modelos grandes está representado por el chip A100 de Nvidia, pero Estados Unidos ha restringido la exportación del chip a China, y el rendimiento de las GPU nacionales necesita más pruebas. todavía hay una brecha en la eficiencia.
Quinto, no son pocos los técnicos que se dedican a la investigación de IA en China, pero todavía hay una escasez de talentos con capacidades de diseño de arquitectura e indicadores de capacitación de datos AIGC. Antes del surgimiento de ChatGPT, algunas personas pensaban que la cantidad de documentos y patentes en China en IA era comparable a la de los EE. UU. **El lanzamiento de ChatGPT nos hizo ver la brecha entre China y los Estados Unidos en AIGC. Ahora Necesitamos comprender claramente y prestar atención a los desafíos que enfrentamos, hacer innovaciones reales, convertir los desafíos en oportunidades y hacer la contribución de China a la nueva ronda de seguimiento de la IA. **
Se recomienda abrir la plataforma de potencia informática nacional para admitir varios modelos de formación a gran escala
**T: ChatGPT es sin duda una gran innovación. ¿Cómo debería China fomentar innovaciones como esta en el futuro y qué aspectos del trabajo debería hacer? **
**Wu Hequan: **El desarrollo de la inteligencia artificial de discriminativa a generativa es una innovación histórica y ha comenzado a entrar en el camino de la inteligencia artificial general. De GPT-3 a GPT-4, se ha desarrollado desde la entrada de texto a la entrada gráfica parcial, es decir, ha aumentado la capacidad de comprensión de los gráficos.Sobre esta base, no está lejos implementar una arquitectura de aprendizaje profundo y un modelo general. para admitir la entrada de datos multimodal. Sí, pero la generalización de tareas de modelos grandes y el refinamiento de la invocación bajo demanda de modelos grandes aún requieren una mayor inversión e innovación. El aprendizaje de datos sin etiquetar y sin supervisión para gráficos y videos es mucho más difícil que el idioma. y entrada de texto.
Ahora estamos en un período crítico de desarrollo hacia la inteligencia artificial general.Para nuestro país, esta es una oportunidad única para el desarrollo de saltos y también un desafío severo. La potencia informática, los modelos y los datos son las condiciones necesarias para el éxito de ChatGPT y también serán los factores esenciales para el éxito de la inteligencia artificial general. Además, la ecología, los mecanismos y los talentos más innovadores son la clave. China es comparable a los Estados Unidos en términos de la escala total de poder de cómputo, pero la coordinación del poder de cómputo entre los centros de datos aún enfrenta desafíos institucionales, y la tasa de utilización y la eficiencia del poder de cómputo en muchos centros de cómputo inteligentes no son altas. **Muchas unidades investigan modelos grandes de forma independiente, y es inevitable repetir a un nivel bajo Se recomienda formar una fuerza conjunta con una división razonable del trabajo bajo la coordinación de los planes nacionales de ciencia y tecnología e industriales. Se recomienda abrir la plataforma de poder de cómputo del laboratorio nacional para admitir varios entrenamientos de modelos a gran escala. Por ejemplo, el poder de cómputo de Pengcheng Cloud Brain ha alcanzado 3/4 de la capacidad total, que puede soportar la escala de 200 mil millones de parámetros comparables a GPT-3 Modelo grande de idioma chino preentrenado de código abierto. **Al mismo tiempo, se recomienda formar una alianza de poder de cómputo para concentrar los recursos de poder de cómputo de las GPU de gama alta existentes y proporcionar la potencia de cómputo requerida para el entrenamiento de datos de modelos a gran escala. **Actualmente, la "Red de energía de computación de China (C2NET)", construida principalmente por Pengcheng Laboratory, se ha conectado a más de 20 centros de datos, supercomputación y computación inteligente a gran escala, y la potencia de computación heterogénea agregada ha alcanzado 3EFlops. ellos, la potencia informática de IA de desarrollo propio supera los 1,8 EFlops. Además, la aplicación de chatbots es solo una forma intuitiva de entrenar y probar AIGC, pero el chat no solo es necesario, es necesario desarrollar varios modelos para aplicaciones industriales basadas en modelos grandes, para que los modelos grandes sean efectivos en la industria. tan pronto como sea posible Cultivar más talentos en la aplicación de todos los ámbitos de la vida. **
Las aplicaciones de la industria de modelos grandes requieren talentos integrales que comprendan tanto la tecnología de la industria como la capacitación en IA
**T: Hasta ahora hemos visto la aplicación de ChatGPT en algunos campos, como chatbots, generación de texto y reconocimiento de voz. ¿Habrá algunas oportunidades de aplicación en la industria física y el campo en el futuro? ¿Qué obstáculos aún se enfrentan en la aplicación de modelos grandes en la industria física? **
**Wu Hequan: **Basado en los chatbots ChatGPT existentes, después de complementar la capacitación relevante de la industria y el conocimiento empresarial, pueden realizar un trabajo inteligente de servicio al cliente en las empresas, reemplazando a los trabajadores para brindar a los clientes servicios de preventa y posventa. En el proceso de diseño y fabricación que requiere programación de software, ChatGPT puede reemplazar a los programadores para completar tareas de programación y verificar errores de software. Puede encargarse de la recopilación, traducción y disposición de los documentos y materiales necesarios en el proceso de diseño y producción. Después de la capacitación profesional, los modelos grandes similares a AIGC se pueden usar para diseñar software EDA, como software de herramientas para diseño de circuitos integrados. En las empresas de animación y juegos, los robots entrenados en modelos grandes similares a AIGC pueden escribir guiones, crear guiones de juegos y programarlos de acuerdo con indicaciones, y completar la representación de animaciones 3D.
Sin embargo, ChatGPT no es un modelo general y es difícil aplicarlo directamente al proceso de fabricación de la industria real. Sin embargo, puede basarse en el principio de entrenar a ChatGPT y usar el gráfico de conocimiento de industrias y empresas para obtener información. Capacitación profunda. Es posible desarrollar un gran modelo dedicado a las empresas para completar esto. El desafío del primer trabajo es necesitar talentos que no solo estén familiarizados con el proceso de carga empresarial y la tecnología de enlace clave, sino que también dominen la capacitación de big data de inteligencia artificial. tecnología.
De centrarse en los resultados a centrarse en el proceso, la integración de la tecnología y el sistema legal domina el proceso de razonamiento de AIGC
**T:ChatGPT también cometerá varios errores y traerá algunos problemas éticos, de seguridad y de privacidad. Al aplicar modelos grandes en el futuro, ¿cómo podemos crear un entorno inclusivo, seguro y de desarrollo? **
**Wu Hequan:**El surgimiento de la IA generativa ha llevado la atención de la sociedad a la inteligencia artificial a un nivel sin precedentes. Mientras desencadena un aumento en la investigación de la IA en los círculos científicos e industriales, a muchos expertos les preocupa que la inteligencia artificial destruya a los seres humanos y Convocatoria para detener la investigación sobre GPT-5. Las preocupaciones de algunos expertos no son infundadas, porque el proceso de pensamiento de los robots ChatGPT es actualmente opaco. Los humanos han creado ChatGPT, pero en la actualidad los humanos no comprenden completamente su proceso de razonamiento. Lo incognoscible será incontrolable y existen riesgos de anomalías en los robots. , anomia ética y comportamiento fuera de control.
**La solución no es detener la investigación en inteligencia artificial, sino centrarse en la investigación AIGC en lugar de centrarse en los resultados, diseñar y liderar su proceso de razonamiento, de modo que se puedan esperar resultados y controlar los comportamientos. **La promoción y aplicación del modelo grande en el futuro requiere una evaluación segura y creíble por parte de una institución calificada, y el proceso de razonamiento del modelo grande es rastreable después de la inspección. Al mismo tiempo, es necesario establecer leyes y reglamentos de gobernanza de IA correspondientes para evitar la capacitación engañosa de AIGC, responsabilizar a los sujetos de capacitación de AIGC y castigar severamente la complicidad y los delitos de complicidad. A través de la complementariedad de la tecnología y el sistema legal, la inteligencia artificial se ha convertido en un asistente verdaderamente leal para los seres humanos.