DeepSeek a un nouveau rival, et vous pouvez l’essayer dès maintenant

Alibaba vient de dévoiler son dernier modèle de raisonnement, et il semble que DeepSeek et OpenAI pourraient avoir de quoi s'inquiéter – du moins si toutes les promesses d'Alibaba s'avèrent vraies. C'est open-source, alors je l'ai vérifié. Vous pouvez également l'essayer gratuitement, même si, sans surprise, vous constaterez qu'il y a certaines choses dont il ne vous parlera pas.

Le nouveau modèle, baptisé QwQ-32b (Quan-with-Questions), fonctionne avec beaucoup moins de paramètres, ce qui signifie qu'il nécessite moins de ressources, mais Alibaba affirme qu'il fonctionne au même niveau que DeepSeek ou o1-mini d'OpenAI.

Le grand modèle de langage (LLM) R1 de DeepSeek a fait fureur plus tôt en février lors de sa sortie, soudainement capable de rivaliser avec l'étalon-or établi par ChatGPT et d'autres alternatives, mais à un coût bien inférieur. Il semble qu’Alibaba pousse encore plus loin les limites.

DeepSeek AI fonctionnant sur un iPhone.
Nadeem Sarwar / Tendances numériques

Comme l'explique VentureBeat , DeepSeek-R1 nécessite 671 milliards de paramètres pour fonctionner, dont 37 milliards sont activés. Pendant ce temps, le nouveau QwQ-32b d'Alibaba peut se contenter de 32 milliards de paramètres. Ces chiffres sont totalement abstraits pour beaucoup, mais il existe une énorme différence en termes de puissance de calcul ; alors que DeepSeek R1 nécessite 1 600 Go de VRAM pour fonctionner, QwQ-32b peut se débrouiller avec seulement 24 Go de VRAM. Dans la plupart des cas, cela signifiera le H100 de Nvidia ou équivalent, mais même le RTX 4090 axé sur les jeux arbore 24 Go. Le dernier RTX 5090 porte ce chiffre à 32 Go.

Le QwQ-32b d'Alibaba est disponible sous licence Apache 2.0, ce qui signifie que les entreprises et les chercheurs peuvent l'utiliser. Plus important encore, nous pouvons l'utiliser en essayant Qwen Chat d'Alibaba. Comme DeepSeek, il présente certaines limitations , mais présente également quelques avantages immédiats que j'ai remarqués assez rapidement.

Il semble donner des réponses assez approfondies, même à des questions simples et rapides. Cela peut être bien, mais d'une certaine manière, c'était surtout ennuyeux car cela vous donne beaucoup de contexte inutile que vous n'avez pas demandé. J'aime le fait qu'il vous montre l'ensemble de son processus de raisonnement, qui est similaire à la fonctionnalité Deep Thinking de ChatGPT, mais avec beaucoup moins de profondeur.

Interrogé sur des questions politiques, Qwen Chat le signale comme inapproprié. Il existe peut-être des moyens de le jailbreaker – c’était possible avec DeepSeek, après tout – mais je n’y suis pas encore parvenu.

Reste à savoir si les affirmations d'Alibaba se révéleront vraies, mais il semble que ChatGPT et DeepSeek aient désormais un nouveau rival.