Huawei accusé de plagier le LLM Qwen d’Alibaba

Une querelle publique sur l’originalité d’un modèle menace le front collaboratif chinois en matière d’IA, Huawei niant les accusations d’un lanceur d’alerte qui affirme que le modèle Qwen d’Alibaba a été cloné, alors que la surveillance mondiale s’intensifie.
La division de recherche en IA de Huawei a rejeté les accusations selon lesquelles son modèle linguistique Pangu Pro aurait copié des éléments d’un modèle d’Alibaba, marquant une escalade significative dans l’écosystème chinois de l’IA, alors que les géants de la technologie abandonnent leur approche collaborative au profit de disputes publiques acharnées. Le laboratoire Noah Ark Lab du géant des télécommunications a publié samedi un démenti, après qu’une entité appelée HonestAGI a publié une analyse technique affirmant que le modèle Pangu Pro Mixture of Experts (MoE) de Huawei présentait une corrélation extraordinaire avec le modèle Qwen 2.5 14B d’Alibaba, a rapporté Reuters. L’analyse affirmait que le modèle avait été dérivé par « upcycling » plutôt que d’avoir été entraîné à partir de zéro. Cette confrontation publique marque un changement radical par rapport à l’unité dont faisait preuve jusqu’à présent la Chine pour contester la domination occidentale dans le domaine de l’IA. Selon les analystes du secteur, ces luttes intestines pourraient nuire à la capacité de la Chine à présenter un front uni face à ses concurrents américains tels que OpenAI, Google DeepMind et Anthropic.
L’analyse GitHub d’HonestAGI a revendiqué un coefficient de corrélation de 0,927 entre les deux modèles, en utilisant ce qu’elle a appelé « l’empreinte digitale du modèle » pour identifier les schémas qui révéleraient la dérivation d’un modèle à partir d’un autre. Noah Ark Lab a répondu que son modèle « n’était pas basé sur l’entraînement incrémental des modèles d’autres fabricants » et qu’il présentait « des innovations clés en matière de conception architecturale et de caractéristiques techniques ». La société a souligné que Pangu Pro était le premier modèle à grande échelle entièrement construit sur les puces Ascend de Huawei, ajoute le rapport. « Ce différend met en évidence l’évolution de la dynamique de maturation de l’écosystème chinois de l’IA et la pression qui s’exerce pour rester compétitif et innover plus rapidement que l’approche collaborative traditionnelle que nous avons connue jusqu’à présent », a déclaré Neil Shah, vice-président de la recherche et partenaire chez Counterpoint Research.
La concurrence atteint son paroxysme
La controverse s’est intensifiée lorsqu’un prétendu initié de Huawei a publié des accusations détaillées concernant la copie systématique de modèles au sein de l’entreprise. L’informateur anonyme, qui se présente comme un membre de l’équipe Pangu, a accusé la direction d’avoir « cloné » les modèles Qwen d’Alibaba et de la start-up DeepSeek tout en les présentant comme des créations originales. « Ils ont « cloné » Qwen-1.5 (110B), l’ont enveloppé de couches supplémentaires et ont apporté des modifications, créant ainsi un modèle pseudo-135B “V2” », a écrit le lanceur d’alerte dans son document. « Ce modèle rebaptisé, dont le code s’appelle toujours « Qwen », a été commercialisé auprès des clients. » Ces allégations n’ont pas pu être vérifiées de manière indépendante et l’identité du lanceur d’alerte reste inconnue. Ce différend survient alors que les entreprises chinoises spécialisées dans l’IA se bousculent après la sortie en janvier du modèle R1 de DeepSeek, qui a stupéfié la Silicon Valley par son approche à faible coût et haute performance. Alibaba a précipité la sortie de son modèle Qwen 2.5-Max quelques semaines plus tard, affirmant qu’il offrait des performances supérieures dans plusieurs benchmarks. « Ce qui était autrefois une initiative d’innovation alignée sur les objectifs de l’État est aujourd’hui remodelé par une concurrence dictée par le marché, où la rapidité de mise à l’échelle prime souvent sur la transparence », a déclaré Sanchit Vir Gogia, analyste en chef et CEO de Greyhound Research.
Un déficit de confiance apparaît
Cette évolution a soulevé des questions délicates quant à la crédibilité de toutes les parties. L’analyse technique de la méthodologie d’HonestAGI a révélé des failles potentielles, les chercheurs ayant trouvé des corrélations similaires entre des modèles non liés utilisant la même technique d’empreinte digitale. Les critiques ont également découvert des références inventées à des recherches inexistantes dans l’article d’HonestAGI. « De plus, cela constitue une arme à double tranchant pour la stratégie chinoise visant à favoriser l’ouverture des modèles, car cela pourrait donner lieu à des dérivés des meilleurs modèles existants », a ajouté M. Shah. « Nous avons déjà vu cela se produire avec OpenAI-DeepSeek. » Ce différend met en évidence les défis plus larges auxquels est confronté le secteur de l’IA, alors que les coûts de développement montent en flèche et que la réutilisation des modèles devient courante. Vershita Srivastava, directrice des pratiques chez Everest Group, a déclaré que le secteur avait besoin de meilleurs outils pour gérer de telles controverses.
« L’industrie doit adopter un cadre complet qui inclut des techniques avancées d’empreinte digitale et de tatouage numérique permettant de retracer de manière fiable la lignée des modèles », a déclaré Mme Srivastava. Le caractère public de ce litige marque un tournant pour le secteur chinois de l’IA, qui avait jusqu’à présent maintenu un semblant de collaboration. M. Gogia a averti que ces luttes intestines pourraient avoir des conséquences durables au-delà des frontières chinoises. « Cet épisode souligne que les fournisseurs chinois opèrent désormais sous le regard du public, et que toute érosion de la confiance pourrait avoir des conséquences géopolitiques et commerciales durables », a-t-il déclaré. Cette controverse pourrait contraindre les entreprises, notamment en Asie du Sud-Est et au Moyen-Orient, à réévaluer leurs partenariats avec les fournisseurs chinois d’IA. Ces allégations ont également mis en évidence ce que M. Gogia appelle « l’insuffisance croissante des cadres traditionnels de propriété intellectuelle lorsqu’ils sont appliqués aux LLM ». Les techniques d’empreinte digitale au niveau des paramètres sont prometteuses, mais elles restent contestées sur le plan scientifique et n’ont pas été testées juridiquement.
Un marché en proie aux divisions
Cette querelle met en évidence la manière dont les leaders chinois de l’IA ciblent des marchés différents tout en poursuivant le même objectif. La famille Qwen d’Alibaba se concentre sur les applications grand public avec des services similaires à ChatGPT et a été téléchargée plus de 40 millions de fois depuis son passage en open source. Les modèles Pangu de Huawei ciblent les entreprises clientes dans les secteurs de l’administration, de la finance et de l’industrie manufacturière. Malgré son entrée précoce sur le marché des grands modèles linguistiques avec le lancement de Pangu en 2021, Huawei a du mal à suivre le rythme de ses concurrents. La société a mis en open source ses modèles Pangu Pro MoE en juin, dans l’espoir de stimuler leur adoption grâce à un accès gratuit pour les développeurs.
La dernière controverse souligne l’urgence de normes à l’échelle du secteur. « Sans définitions convenues de la dérivation, en particulier dans les modèles entraînés sur des corpus partagés, les fournisseurs sont confrontés à un paysage réglementaire flou », a fait remarquer M. Gogia. « Cette ambiguïté ouvre la voie à des accusations tendancieuses et sape la collaboration open source. » M. Srivastava a souligné la nécessité de cadres juridiques, affirmant qu’il est « impératif d’établir des définitions claires pour les modèles dérivés et de mettre en œuvre des cadres de licence nuancés qui favorisent une réutilisation responsable, imposent une attribution appropriée et respectent les restrictions d’utilisation ». La manière dont cette controverse sera résolue créera des précédents importants pour les litiges en matière de propriété intellectuelle dans un paysage de l’IA de plus en plus concurrentiel. Le succès d’opérations agiles telles que DeepSeek a bouleversé les idées reçues sur ce qu’il faut pour développer une IA de pointe, faisant apparaître les bureaucraties lourdes comme des handicaps plutôt que des atouts.Alibaba n’a pas immédiatement répondu aux demandes de commentaires.