La censure de DeepSeek est un coup de semonce – et un signal d’alarme

L'industrie de l'IA est en effervescence au sujet d'un nouveau modèle de langage à grande échelle qui mène la lutte contre les meilleurs du secteur comme OpenAI et Anthropic. Mais non sans son généreux lot de surprises. Le nom est DeepSeek .

Il vient de Chine. C'est open source. Plus important encore, il aurait été développé à une fraction du coût par rapport à ce que les leaders actuels de l'industrie d'OpenAI, Meta et Google ont brûlé.

"L'abordabilité ouvre la porte aux petites entreprises et aux startups pour tirer parti d'une technologie avancée d'IA qui était auparavant inaccessible", a déclaré Mel Morris, chef d'un moteur basé sur l'IA pour les chercheurs, à Digital Trends.

À la suite des discussions d’experts et du buzz de Wall Street, Nvidia – le seigneur du matériel d’IA – a vu près de 600 milliards de dollars effacer sa part de marché. Satya Nadella, partisan d'OpenAI et chef de Microsoft, parle du paradoxe de Jevons .

DeepSeek AI fonctionnant sur un iPhone.
Nadeem Sarwar / Tendances numériques

L’arrivée de DeepSeek est même assimilée au moment Spoutnik , mais non sans doutes plus profonds. La plus grande préoccupation concerne la façon dont l'entreprise stocke une énorme partie des données des utilisateurs sur des serveurs basés en Chine, une stratégie qui a plongé TikTok dans l'enfer d'une interdiction nationale .

"Si vous utilisez leur API (ou application) hébergée par une première partie, il est très probable que le trafic puisse être vu et partagé avec divers acteurs au niveau de l'État", a déclaré Randall Hunt, PDG de la société d'ingénierie cloud Caylent, à Digital Trends.

Il existe cependant un autre aspect de DeepSeek qui imite la version chinoise d’un Internet étroitement contrôlé. Censure.

"La modélisation des récompenses dans le modèle est fortement influencée par les lois de censure chinoise", ajoute Hunt, qui a travaillé dans des sociétés d'ingénierie telles que la NASA, SpaceX, Amazon et Meta.

Comment DeepSeek adopte la censure

"Désolé, cela dépasse mon champ d'action actuel."

"Parlons d'autre chose."

« Je ne sais pas encore comment aborder ce type de question. Parlons plutôt de problèmes de mathématiques, de codage et de logique ! »

Preuve de biais de censure dans les réponses mobiles de DeepSeek AI
Nadeem Sarwar / Tendances numériques

Telles sont quelques-unes des réponses que vous obtenez lorsque vous abordez des sujets tels que les droits de l'homme ouïghours, la secte religieuse Falun Gong, la destitution de l'ancien dirigeant Hu Jintao, la provocation des troupes sur le territoire indien de Galwan ou les moines tibétains luttant pour la liberté.

Ce sont tous des sujets fortement censurés sur l’écosystème Internet chinois et sur les sites de médias sociaux. Le grand pare-feu de Chine , comme on l'appelle.

Des événements comme le massacre de Tiananmen sont interdits. Même les mentions indirectes, comme « l’homme qui se tenait devant les chars », faisant référence à l’image emblématique d’un manifestant bloquant la marche des chars, renvoient à une non-réponse.

La stratégie n’est pas surprenante. En octobre de l'année dernière, les régulateurs chinois de l'Internet ont même lancé une répression contre les mèmes, les jeux de mots, les blagues, les jeux de mots et les homophones qui tentent de contourner les sujets interdits.

La mention de sujets comme Winnie l'ourson – lourdement censurée en Chine en raison d'un vieux mème faisant penser à la similitude du personnage avec le Premier ministre Xi Jinping – est strictement interdite.

Biais de censure dans les réponses générées par DeepSek AI.
Différence dans les réponses générées par Google Gemini (à gauche) et DeepSeek (à droite). Nadeem Sarwar / Tendances numériques

Cela peut faire une blague sur le président américain Donald Trump et son amour de l’argent. Cela ne fera pas la même chose même si vous essayez « Xi dada » dans la même invite de requête. "Parlons d'autre chose", répond DeepSeek.

Mais contrairement au Grand Pare-feu, nous avons ici affaire à un modèle de langage étendu. Il n'effectue pas toujours une correspondance de mots ou de hachage pour détecter et bloquer automatiquement les termes offensants. La situation avec DeepSeek est un peu délicate.

Sur la base de son ensemble de données de formation, il refuse catégoriquement de répondre à quelques sujets. Dans quelques cas, cependant, il commencerait à rédiger une longue réponse comme un chatbot classique, mais s'arrêterait à mi-chemin et renverrait son message d'erreur répétitif. Comme nous l'avons vu avec ChatGPT, il s'agit d'un type de jailbreak pour DeepSeek qui contourne ses restrictions habituelles.

Cela ressemble à une erreur. Pourtant, en même temps, il est plus difficile de trouver toute l’étendue de la censure dans DeepSeek que de parcourir une liste définie par l’État de sujets bloqués et de contenus interdits.

DeepSeek AI censure les résultats sur mobile.
Les réponses de DeepSeek sont soit censurées, soit elles répètent le programme du gouvernement. Nadeem Sarwar / Tendances numériques

Pour une poignée d’autres sujets comme le droit à l’avortement, la représentation LGBTQ et le féminisme, il dresse un tableau fleuri du gouvernement chinois, qui contredit les réalités du terrain.

Cela ment également, à l’image des réponses que nous voyons habituellement de la part des médias d’État ou des responsables des ambassades. Sur certains sujets, il réécrit entièrement la vérité et chante la gloire du gouvernement, contredisant la vérité découverte par les journalistes, les lanceurs d’alerte et les organisations de défense des droits de l’homme.

DeepSeek est intrinsèquement indulgent envers la Chine, mais « accepte » occasionnellement quelques vérités largement connues. En un mot, ce n'est pas un outil de recherche fiable dans la même veine que Deep Research de Gemini .

Pourquoi DeepSeek est-il problématique ?

Komninos Chatzipapas, fondateur de HeraHaven.AI , une société qui permet aux utilisateurs d'interagir avec des compagnons IA, a expérimenté DeepSeek via un fournisseur basé aux États-Unis. Il explique à Digital Trends que la censure est au cœur même du modèle sous-jacent, et pas seulement comme une couche superficielle.

Comment DeepSeek AI censure les recherches mobiles.
DeepSeek commence parfois à collecter les réponses, mais finit par tout effacer au profit de la censure. Nadeem Sarwar / Tendances numériques

"Bien que l'on puisse éventuellement affiner R1 pour lui apprendre à répondre à toutes les questions, je suis contre ce type de censure sur le modèle de base car cela pourrait le biaiser en étant pro-Chine dans d'autres questions posées par les utilisateurs", dit-il. "Il n'y a aucun problème à parler de la controverse américaine."

Broadridge, une société basée à New York qui s'est classée troisième dans le classement fintech 2024 d'IDC, a expérimenté DeepSeek et affirme que l'entreprise a été impressionnée par sa qualité.

Joseph Lo, responsable des plates-formes d'entreprise de l'entreprise, déclare à Digital Trends que DeepSeek est une bonne nouvelle pour les investisseurs et qu'il prouve que de grands progrès technologiques sont possibles.

La sécurité reste cependant une préoccupation. « Chez Broadridge, nous pensons que le service hébergé de DeepSeek ne devrait être utilisé pour aucune application au sein des services financiers en raison de son traitement dans des zones non américaines », ajoute Lo.

L'application mobile de DeepSeek AI s'est livrée à la censure.
DeepSeek censurera même les jeux de mots sur des sujets controversés. Nadeem Sarwar / Tendances numériques

Il n’est pas le seul leader du secteur préoccupé par les risques liés à la vie privée. Aleksandr Yampolskiy, membre du Conseil Forbes qui a dirigé les efforts de sécurité chez Oracle et Goldman Sachs, a également recommandé la prudence.

"Nous pouvons certainement avoir la possibilité que des logiciels espions chinois stockent toutes les entrées, ce qui constituerait une approche de type "cheval de Troie" plus dangereuse que Tiktok", prévient-il. Pour rappel, TikTok a suscité des critiques non seulement à cause du stockage de données en Chine, mais également à cause de son rôle présumé dans l'influence des élections .

Ben Walker, chef de Ditto, affirme que les entreprises qui déploient DeepSeek avec sa nature censurée intacte pourraient être confrontées à des pressions juridiques et réglementaires. Il a cité l'exemple des services de transcription fournis par son entreprise, destinés aux cabinets d'avocats, aux instituts universitaires, aux services de police et aux agences fédérales.

"Si un cabinet d'avocats utilisait DeepSeek pour transcrire les déclarations de témoins dans une affaire de secrets commerciaux impliquant une fabrication chinoise, l'IA pourrait ignorer des phrases clés sur l'emplacement des usines et les méthodes de production", explique Walker à Digital Trends. « Les avocats passeraient alors à côté de preuves cruciales parce que la transcription censurée laisse de côté les détails qui déclenchent les filtres de l’IA. »

Les entreprises sont-elles prêtes pour DeepSeek ?

Les utilisateurs mobiles sont confrontés à un biais de censure avec DeepSeek AI.
Le comportement de censure de DeepSeek reflète celui du Grand Pare-feu sur Internet en Chine. Nadeem Sarwar / Tendances numériques

L’arrivée de DeepSeek a non seulement ébranlé le cercle technologique de l’IA, mais a également eu un écho parmi les échelons supérieurs de la bureaucratie, jusqu’au président Trump. Les sanctions commerciales de ce dernier pourraient entraver jusqu’où la Chine peut aller dans la course à l’IA.

Au cours de la deuxième semaine de janvier, le gouvernement américain a annoncé de nouvelles règles d'exportation « AI Diffusion » qui visent à restreindre l'accès de la Chine au matériel avancé (lire : le genre de choses qui ont transformé Nvidia en un géant d'un billion de dollars) et aux modèles d'IA. Trump semble avoir l’intention de faire exactement cela.

"Trump peut conserver l'avantage américain en matière d'IA", titre le Wall Street Journal , rédigé par le fondateur et chef d'Anthropic, Dario Amodei. « La Chine essaie de rattraper son retard. Les États-Unis ont besoin d’efforts de développement proactifs et de contrôles stricts des exportations.

DeepSeek a littéralement donné forme à ces craintes. Et ce n'est que le premier à le faire.

"La sortie de DeepSeek, AI par une entreprise chinoise, devrait être un signal d'alarme pour nos industries sur le fait que nous devons nous concentrer au laser sur la compétition pour gagner", a déclaré Trump cité par Reuters .

Les biais de censure influencent les résultats mobiles de DeepSeek AI.
Les conclusions tirées par DeepSeek en réponse aux requêtes font plier la position de l'État. Nadeem Sarwar / Tendances numériques

Les dernières restrictions commerciales, qui reflètent la stratégie qui a récemment paralysé le géant chinois Huawei , sont logiques d’un point de vue centré sur les États-Unis. Si l’ombre de la Chine apparaît sur les produits nationaux d’IA, qui sont considérablement moins chers et aux performances équivalentes, qu’est-ce qui pourrait empêcher leur adoption dans le reste du monde ?

Eh bien, des risques tangibles sont en jeu pour les entreprises. Steven Hall, membre consultatif du Consortium for Information & Software Quality et directeur de l'IA chez Information Services Group, note que la mise à l'échelle d'un produit d'IA respectueux de la censure sera plus difficile pour les entreprises et comporte une multitude de risques.

"Ils peuvent éroder la confiance des consommateurs, attirer un examen réglementaire et limiter l'efficacité opérationnelle", a déclaré Hall à Digital Trends. « Les organisations qui s’appuient sur des modèles censurés ou biaisés pourraient être confrontées à des atteintes à leur réputation et à des problèmes de conformité, en particulier lorsque la transparence et la neutralité sont attendues. »

L'image plus profonde

Interroger DeepSeek AI sur la censure dans ses réponses.
Nadeem Sarwar / Tendances numériques

«Je pense que la Chine doit être très heureuse de voir qu'elle a réussi à forcer le gouvernement américain à imiter de plus en plus l'implication active et concrète du gouvernement chinois dans ce qui est sur le papier censé être un marché libre, un esprit de laissez-faire. entreprises technologiques indépendantes », a déclaré Brad Greenspan, fondateur de MySpace – le premier réseau social à trouver une audience mondiale et qui a ouvert la voie à de nouveaux venus comme Facebook – à Digital Trends.

Le lobby technologique, en particulier le proverbial « baiser du ring » des dirigeants de l'IA, est ouvertement effronté. Outre les dons personnels, la présence de personnalités technologiques telles que Sam Altman d'OpenAI, Elon Musk, le chef de Google Sundar Pichai, Mark Zuckerberg de Meta, Tim Cook d'Apple et le fondateur d'Amazon Jeff Bezos était un signe clair que les acteurs de l'IA ont besoin de quelque chose – une sorte de un contrôle, ou une assurance, que seule la bureaucratie peut garantir, afin qu'ils puissent tirer profit de leur IA sans craindre que les nouveaux arrivants chinois ne mangent leur déjeuner.

Cependant, les règles commerciales complexes et les sanctions nuisent également au respect des règles commerciales par les acteurs locaux. L’expansion à l’étranger, les frais juridiques et la R&D mondiale leur nuiront également.

« La seule différence que je vois comme caractéristique déterminante est que la Chine consacre beaucoup moins de temps et d’efforts à prétendre publiquement et à prétendre ne pas essayer de banzai les bureaucrates dans leurs meilleures entreprises », ajoute Greenspan.

Gémeaux, ChatGPT, Humane Pin et Rabbit R1.
DeepSeek a ébranlé les principaux acteurs de l'industrie de l'IA. Tendances numériques

Le problème de cette course et du battage médiatique autour de la menace chinoise, c’est qu’il n’y a pas de gagnants clairs. Il n’y en aura jamais.

Les États-Unis ont fait de leur mieux pour freiner les progrès de la Chine dans la course aux véhicules électriques. Pourtant, des sociétés comme BYD ont réussi à battre Tesla, en termes de livraisons et de revenus . Tesla n’est même pas un leader dans le domaine très important de l’autonomie des véhicules électriques.

La Chine a également battu les États-Unis en termes de documents de recherche de haute qualité au cours des deux dernières années, dans différents domaines. L’IA en fait partie. Les observateurs de l’industrie affirment que nous effleurons à peine la surface avec DeepSeek.

D’autres percées de ce type en provenance de Chine, issues de géants technologiques ainsi que de laboratoires obscurs, seront bientôt disponibles. Lorsque cela se produira, il serait intéressant de voir si la sécurité reste la préoccupation majeure ou si la censure apparaît comme le nouveau drapeau alarmiste.

Pour un outil qui est intrinsèquement un prédicteur de mots, DeepSeek est un signal clair que les discussions sur la censure ne feront que s'intensifier à mesure que nous découvrirons comment elles affectent ce qu'un outil d'IA générative est censé faire et ce qu'il finit par fournir.