Le gouvernement chinois a clairement placé le développement de l’industrie nationale de l’intelligence artificielle en tête de ses priorités, ce qui devrait contribuer à dissiper les inquiétudes persistantes concernant le retard du pays par rapport aux économies avancées dans les technologies clés, selon les experts.
Les dernières inquiétudes sont apparues en février lorsque l’entreprise américaine OpenAI, qui avait fait sensation avec ChatGPT, a lancé un modèle de conversion de texte en vidéo appelé Sora, provoquant une onde de choc dans l’industrie chinoise de l’intelligence artificielle. Les réactions allaient de l’admiration et de l’appréciation à l' »angoisse de l’IA ».
Pourquoi des technologies révolutionnaires comme ChatGPT et Sora n’ont-elles pas vu le jour en Chine ? Le fossé entre la Chine et les États-Unis en matière d’IA est-il en train de se creuser ? La Chine a-t-elle perdu le fil de la technologie ? Son dynamisme en matière d’innovation a-t-il perdu de sa force ? De telles questions ont suscité l’inquiétude des internautes et des experts du secteur.
Selon Shen Hao, ingénieur en chef adjoint de l’Institut de recherche sur l’intelligence artificielle de Shanghai, il est naturel d’éprouver une telle inquiétude, mais ce qu’elle indique en réalité, c’est le sentiment sous-jacent d’urgence de rattraper les énormes changements apportés par les technologies de pointe.
Les initiés du secteur pensent que Sora – qui permet aux utilisateurs de créer des vidéos photoréalistes d’une durée maximale d’une minute, à partir de messages écrits par eux – finira par réduire l’écart entre la Chine et les États-Unis dans le domaine de l’IA. En effet, les entreprises chinoises ne tarderont probablement pas à redoubler d’efforts pour fabriquer des produits similaires, compte tenu de leurs avantages uniques.
Mais ils pensent également que Sora est un signal d’alarme pour la Chine, car il montre qu’il y a un écart avec les homologues américains en termes de développement de l’IA, en particulier sur des aspects tels que la puissance de calcul et le talent.
« L’écart entre la Chine et les États-Unis dans le domaine de l’IA réside principalement dans l’orientation (technologique). Une fois l’orientation définie, les entreprises chinoises peuvent rapidement rattraper leur retard grâce à leurs capacités d’apprentissage rapide », a déclaré Zhou Hongyi, fondateur et président de 360 Security Technology, qui est également membre du 14e comité national de la Conférence consultative politique du peuple chinois, l’organe consultatif politique le plus important du pays.
M. Zhou a expliqué qu’il pourrait s’agir d’un transformateur, un modèle d’apprentissage profond qui apprend le contexte et la signification en suivant les relations dans les données séquentielles. ChatGPT et Sora sont tous deux basés sur des transformateurs.
« Il existe un écart entre la Chine et les États-Unis en termes de développement de l’IA. Mais l’écart n’est pas aussi important que celui qui existe dans le domaine des machines de lithographie des semi-conducteurs.
Si l’on considère que les transformateurs, les produits de type Sora ou Sora sont tous fondamentalement des « logiciels », ce fossé entre la Chine et les États-Unis en matière d’IA peut être comblé d’ici un à deux ans », a déclaré M. Zhou.
Entre décembre et février, plus de 10 sociétés cotées en bourse et actives dans les domaines liés à l’IA, dont Wondershare, BroadV, Eclicktech et Hanvon Technology, ont toutes révélé leurs investissements et leurs progrès dans le développement de modèles de conversion de texte en vidéo.
Bien que les technologies actuelles de conversion texte-vidéo développées par les entreprises chinoises soient moins efficaces que Sora, les experts de l’industrie estiment que la Chine dispose déjà de toute l’infrastructure de base nécessaire pour développer des produits similaires à Sora, notamment de grands modèles linguistiques, DALL.E 3, des ensembles de données vidéo à grande échelle, des systèmes informatiques d’IA et des piles d’outils de développement de grands modèles.
Les LLM servent de modèles de base, ou de modèles à usage général pré-entraînés sur d’énormes ensembles de données. DALL.E 3 est un système d’IA qui prend un texte en entrée et génère une nouvelle image en sortie.
Ma Xin, secrétaire général du comité des normes métavers de l’IEEE et président du groupe de travail sur les normes métavers de l’IEEE, a déclaré que Sora a effectivement un fort impact visuel, mais qu’il ne se détache pas de ChatGPT et de DALL.E pour atteindre un autre niveau.
« Les capacités de Sora sont toutes perçues – elles n’existent que dans l’esprit des gens. À court terme, il ne peut qu’aider à améliorer l’efficacité, en termes d’interaction avec les gens, mais il n’est pas possible de pénétrer véritablement le domaine industriel », a déclaré M. Ma.
Zhou Chengxiong, analyste de l’Institut des sciences et du développement de l’Académie chinoise des sciences, a déclaré : « Bien que la plupart des grandes percées actuelles dans la technologie de l’IA proviennent d’entreprises américaines, les retardataires ont également des avantages évidents. Par exemple, les retardataires sont confrontés à moins de risques et d’incertitudes au cours de leur progression ».
La Chine a une énorme opportunité d’être à l’avant-garde du monde dans l’application des technologies de l’IA à l’avenir, a-t-il déclaré.
Wang Peng, expert principal de l’Institut de recherche de Tencent, est du même avis. M. Wang a déclaré que le lancement de Sora prouve une fois de plus que la transformation par diffusion est une voie possible pour l’IA multimodale.
Les transformateurs de diffusion adhèrent aux meilleures pratiques des transformateurs de vision, qui se sont révélés plus efficaces pour la reconnaissance visuelle que les réseaux convolutionnels traditionnels.
« Il est encore possible pour les principaux fabricants chinois d’IA d’exploiter les ressources existantes pour rattraper le niveau actuel de Sora en un an environ », a-t-il déclaré.
Le mois dernier, la Commission de supervision et d’administration des actifs appartenant à l’État (SASAC) du Conseil des affaires d’État, le cabinet chinois, a déclaré que le pays encouragerait les entreprises d’État administrées de manière centralisée à intégrer le développement de l’IA dans leur planification globale, à promouvoir activement le renouveau industriel et à accélérer la mise en place et le développement de l’industrie de l’IA.
Mardi, le rapport sur le travail gouvernemental soumis à la législature nationale pour délibération a assuré que la Chine promouvra le développement innovant de l’économie numérique, développera activement l’industrie numérique, transformera les industries traditionnelles avec des technologies numériques, et intégrera pleinement la technologie numérique dans l’économie réelle.
Plus précisément, le pays accélérera le lancement d’une initiative AI Plus, la R&D et l’application du big data et de l’IA, et construira des clusters d’industrie numérique avec une compétitivité internationale, selon le rapport.
Les entreprises chinoises se sont également empressées de lancer de grands modèles d’IA pour concurrencer les jeux ChatGPT et GPT-4.0 d’OpenAI. Auparavant, Baidu, Sense-Time et des start-ups spécialisées dans l’IA telles que Baichuan Intelligent Technology et Zhipu AI ont lancé leurs chatbots d’IA.
Zhou Yu, président de Beijing Fanyu Technology Co, une startup spécialisée dans les produits et services de traitement du langage naturel, a déclaré que les enjeux étant élevés, les startups chinoises et américaines semblent adopter des approches différentes pour développer des LLM qui alimentent l’IA générative.
« Les fondateurs des startups américaines mettent davantage l’accent sur la recherche et le développement de la technologie sous-jacente et sur les innovations révolutionnaires. Les États-Unis sont un leader mondial en termes de matériel et de cadres d’apprentissage profond », a déclaré M. Zhou.
« Les startups chinoises spécialisées dans l’IA se concentrent davantage sur les applications, et ceux qui les lancent sont plus aptes à adapter la technologie à diverses industries et à commercialiser différentes applications. Elles sont également plus flexibles dans la création de produits et d’innovations personnalisés », a-t-elle ajouté.
Zhou Hongyi, de 360, a déclaré que 2024 devrait être « l’année de l’application » pour l’IA chinoise, estimant que les grands modèles auront un grand potentiel dans de nombreux domaines verticaux des entreprises cette année.
« Le développement d’un grand modèle universel qui surpasse GPT-4.0 peut être un défi pour le moment, mais GPT-4.0 sait actuellement tout, mais n’est pas spécialisé », a déclaré M. Zhou.
« Si nous pouvons exceller dans un domaine commercial particulier en formant un grand modèle avec des données commerciales uniques et en l’intégrant à de nombreux outils commerciaux dans ce secteur vertical, ce grand modèle sera non seulement intelligent, mais il possédera également des connaissances uniques, voire des mains et des pieds. Il est tout à fait possible que la Chine dépasse le GPT-4.0 dans certains domaines verticaux ».
Mais tout le monde n’est pas d’accord. Wang Peng, chercheur à l’Académie des sciences sociales de Pékin, a déclaré que la Chine devrait faire plus d’efforts pour combler l’écart avec les États-Unis dans le développement de l’IA, en particulier dans les technologies clés et les soutiens connexes.
« La puissance de calcul, les serveurs en nuage et les puces d’IA sont essentiels à l’industrie de l’IA, et leur niveau technique et leur performance déterminent directement la profondeur des applications d’IA. La Chine a encore un écart évident avec les États-Unis en ce qui concerne ces facteurs clés », a déclaré M. Wang.
Chen Zhi, chercheur à l’Institut de l’innovation et du développement de l’Académie chinoise des sciences et technologies pour le développement, a déclaré : « Mais pour la Chine comme pour les États-Unis, la voie du développement de l’IA est semée d’embûches et nécessite des efforts considérables. Si les deux pays collaborent et se complètent en termes de ressources, ils peuvent tirer parti de leurs forces relatives pour engranger des bénéfices mutuels, promouvoir le progrès technologique et garantir l’application sûre, digne de confiance et fiable de l’IA. »