Version Huawei Xiaoyi testée de DeepSeek, y a-t-il une différence par rapport à la version complète de R1 ?
Pendant la Fête du Printemps, ce qui est le plus populaire sur Internet, ce ne sont pas les sketches du Gala de la Fête du Printemps ou les films de la Fête du Printemps, mais DeepSeek.
Ce cheval noir de l'IA de Chine a atteint des performances comparables à OpenAI o1 avec des coûts de formation extrêmement faibles. Avec sa forte maîtrise de la langue chinoise, son moment d'éveil du cyberespace et son esprit open source, il a rapidement remué le cercle de l'IA dirigé par ChatGPT.
Lorsque sa propre famille réussit, les autres membres de la famille doivent subvenir à leurs besoins. Ainsi, pendant que les habitants de tout le pays profitent de joyeuses fêtes, les programmeurs sont à nouveau occupés.
Alors que Tencent Cloud, MiTa AI, Alibaba Cloud, Baidu Smart Cloud et la National Supercomputing Internet Platform ont annoncé leur accès à DeepSeek, les téléphones mobiles, en tant que terminal intelligent personnel le plus couramment utilisé, ont également inauguré sa présence.
Parmi eux, Huawei est celui qui évolue le plus rapidement.
Pas grand chose à dire, DeepSeek étant le premier à être intégré à un smartphone, nous avons immédiatement réalisé un test pratique pour voir ses performances réelles.
Après la mise à niveau de Xiaoyi Assistant vers la version 11.2.10.310, DeepSeek est officiellement apparu sur Agent Plaza de Xiaoyi Assistant.
Entrez dans l'interface principale de l'application Xiaoyi Assistant, cliquez sur "Découvrir" dans la barre de navigation et vous pourrez voir l'existence de DeepSeek en un coup d'œil. À en juger par la couverture, le DeepSeek actuellement connecté est la version bêta de R1.
Par rapport à l'application officielle, le DeepSeek-R1 Beta connecté à Huawei Xiaoyi conserve généralement le style de conception et la logique cohérents de Xiaoyi Assistant. L'interface est simple et intuitive, divisée en parties supérieure et inférieure.
La première moitié est une auto-introduction de DeepSeek-R1 Beta et montre quelques problèmes courants prédéfinis que les nouveaux utilisateurs peuvent choisir et essayer. La partie inférieure est une boîte de dialogue prenant en charge la saisie vocale. Le contenu vocal de l'utilisateur sera automatiquement converti en texte et envoyé instantanément, ce qui est pratique et rapide.
▲ Gauche : version Xiaoyi de DeepSeek / Droite : application officielle DeepSeek
Cliquez sur l'avatar de DeepSeek-R1 Beta pour accéder à la page de détails, qui contient une introduction plus détaillée :
Je suis un agent déployé sur la base de la version open source DeepSeek, conçu pour aider les utilisateurs de Hongmeng à acquérir une expérience de réflexion approfondie.
De plus, la version Xiaoyi de DeepSeek-R1 Beta ne prend en charge que des paramètres simples, notamment le timbre de l'agent, l'effacement du contexte et la suppression des enregistrements de conversation. Cela signifie que vous ne pouvez pas ouvrir une nouvelle boîte de dialogue. Si vous souhaitez recommencer, vous pouvez uniquement effacer le contexte et supprimer les enregistrements de conversation.
▲ Le réglage le plus riche est en fait le ton de Xiaoyi
Avant de commencer le test détaillé, nous avons encore quelques précautions et détails que vous devez connaître à l'avance :
- DeepSeek-R1 Beta accessible par Huawei Xiaoyi n'est disponible que dans la version Hongmeng de sang pur de Xiaoyi Assistant. Les utilisateurs de Hongmeng 4.3 ne peuvent temporairement pas en profiter.
- La version Xiaoyi de DeepSeek prend en charge une réflexion approfondie grâce à sa fonction de signature, mais ne fournit pas de processus de réflexion détaillé
- La version Xiaoyi de DeepSeek ne propose actuellement pas d'option pour la fonction de recherche Internet dans la boîte de dialogue, mais parfois des pages Web de référence en ligne seront affichées dans la réponse.
- La version Xiaoyi de DeepSeek offrira quelques options d'extension après avoir répondu aux questions pour préparer les utilisateurs à d'autres questions. Ceci n'est pas disponible dans l'application officielle.
La longueur du contexte est légèrement courte, suffisante pour un usage quotidien
Lors de la mesure des performances de l'IA, il existe un facteur important : la longueur du contexte.
La longueur du contexte (Context length) fait référence à la longueur du texte qu'un grand modèle de langage peut simultanément prendre en compte et mémoriser lors du traitement du texte.
Par exemple, si la longueur du contexte d'un modèle est de 2 048 jetons, alors lors de la génération ou de la compréhension du texte, il ne peut « voir » que des informations jusqu'à 2 048 jetons, et les informations au-delà de cette longueur seront ignorées ou perdues par le modèle.
Autrement dit, si le contexte n’est pas assez long, l’IA risque d’oublier ce que vous avez dit auparavant en discutant.
Bien que la version bêta DeepSeek-R1 consultée par Xiaoyi ne divulgue pas les données de longueur de contexte, nous pouvons concevoir une méthode simple pour les tests préliminaires.
J'ai préparé les trois premiers chapitres de "La Romance des Trois Royaumes", soit environ 15 000 mots, je les ai saisis dans DeepSeek-R1 connecté à Huawei Xiaoyi, et je lui ai demandé de sortir les 100 derniers mots.
Répété plusieurs fois, DeepSeek-R1 connecté à Huawei Xiaoyi affiche toutes les invites :
Attendez un instant, attendez un instant et réessayez.
Lorsque j’ai raccourci l’article au premier chapitre, soit environ 4 500 mots, cela a toujours échoué.
En désespoir de cause, j'ai modifié un communiqué de presse que j'avais écrit et j'en ai extrait environ 700 mots, et j'ai finalement obtenu un résultat réussi.
Cette durée est fondamentalement suffisante pour communiquer sur des problèmes simples du quotidien, mais si vous souhaitez discuter avec lui de la vie, vous pourriez être un professeur de philosophie sujet à l'amnésie.
Y a-t-il une différence entre la qualité de sortie et la version complète de R1 ?
Il est temps que tout le monde en entende à nouveau parler. Depuis le développement de l’IA, diverses méthodes de test ont été utilisées. Nous avons sélectionné une série de questions, depuis celles qui sont faciles à comprendre pour les humains mais faciles à comprendre pour l’IA, jusqu’à la faisabilité de répondre aux besoins quotidiens, et avons effectué des tests détaillés.
En tant que questions classiques qui ont autrefois bouleversé la plupart de la communauté de l'IA, « Qu'est-ce qui est le plus grand, 9.11 ou 9.8 ? » et « Combien de r y a-t-il dans Strawberry ? » ont été intégrés aux sessions de tests régulières.
▲ Gauche : version Xiaoyi de DeepSeek / Droite : application officielle DeepSeek
Étonnamment, lorsqu'il s'agit de savoir combien de r il y a dans Strawberry, le DeepSeek-R1 Beta connecté à Huawei Xiaoyi s'est en fait renversé. Même lorsque la source de référence a été donnée, elle a quand même donné la réponse à deux r, et il y avait également une erreur dans la position où r est apparu.
Il n'y a aucune surprise dans l'application officielle de DeepSeek, qui non seulement donne la bonne réponse mais indique également avec précision la position de r.
De plus, par rapport à l'application officielle, DeepSeek connecté à Huawei Xiaoyi présente une autre différence significative : le processus de réflexion du modèle R1 est caché.
Bien que ce processus n'interfère pas avec la réponse la plupart du temps, une IA capable de démontrer le processus de réflexion rend évidemment les gens plus confiants. En même temps, si l'utilisateur souhaite ajuster la question, il peut aider à comprendre en visualisant la logique de pensée affichée par l'IA pour éviter que l'IA ne parvienne à capturer avec précision la pensée de l'utilisateur.
▲ À en juger par le processus de réflexion fourni par l’application officielle, il existe plusieurs R qui posent encore problème à l’IA.
J'avais l'habitude d'utiliser l'application officielle de DeepSeek, mais la perte soudaine de mon processus de réflexion m'a rendu un peu incertain.
J'ai donc confié le problème du chariot à deux DeepSeeks. Cette question de réflexion classique impliquant l'éthique morale a testé leur profondeur de compréhension de questions morales complexes pour voir si ce processus de réflexion peut être caché pour répondre à une réponse méthodique et complète, et éviter l'écueil du « comment choisir » que j'ai prédéfini.
Sur cette question, DeepSeek-R1 Beta n'a commis aucune erreur et n'est pas tombé dans le gouffre de ma conception. Les conséquences des deux choix ont été présentées en détail dans la réponse et ont été analysées en détail sous différents points de vue et perspectives. Elle a rappelé que quel que soit le choix fait, il faut soigneusement considérer ses implications éthiques, ses impacts potentiels et ses conséquences.
Si de simples questions morales et éthiques ne suffisent pas, essayez des questions plus difficiles pour tester votre capacité de raisonnement, votre jugement et votre compréhension des relations logiques :
"Il y a trois personnes debout à une extrémité du pont. Elles doivent passer de l'autre côté du pont, mais le pont ne peut supporter que deux personnes qui traversent en même temps, et il n'y a qu'une seule lampe de poche sur le pont. Les trois personnes traversent le pont à des vitesses différentes : une personne met 1 minute pour traverser le pont, l'autre prend 2 minutes et la dernière prend 5 minutes. Seules deux personnes peuvent traverser le pont ensemble à la fois, et il doit y avoir une lampe de poche sur le pont. Question : Comment pouvons-nous les amener à traverser le pont dans le le temps le plus court ?"
Ce test est plus intéressant. La version bêta de DeepSeek-R1 consultée par Xiaoyi est arrivée à la conclusion que cela prend 12 minutes. Cette réponse est la même que la conclusion de ChatGPT, tandis que l'application officielle DeepSeek a proposé une réponse plus courte, et en même temps elle a également fourni suffisamment de contexte pour le débat en termes de logique de pensée.
▲ Gauche : version Xiaoyi de DeepSeek / Milieu : application officielle DeepSeek / Droite : ChatGPT-4o
Après avoir testé l'éthique, la logique et les mathématiques, nous avons finalement testé un test plus proche des scénarios d'usage ordinaires, mais difficile pour l'IA d'être naturelle : l'écriture chinoise.
J'ai conçu un sujet vidéo et demandé au DeepSeek-R1 Beta connecté à Xiaoyi de m'aider à produire une ligne simple. En tenant compte de la conception de l'écran, j'ai également présenté l'apparence du paravent Huawei Mate X6 sous la forme d'un croquis pour voir comment il se comporte lorsque les utilisateurs mettent en avant des exigences de tâches complexes :
"Je souhaite faire une vidéo sur le paravent Huawei Mate X6. Je montrerai l'apparence du paravent tout en donnant une évaluation neutre. L'intégralité de la vidéo sera présentée sous la forme d'un croquis à deux. S'il vous plaît, aidez-moi à concevoir les lignes. Les lignes doivent être humoristiques et intéressantes, et conserver un ton familier. En même temps, la conception de l'écran doit être prise en considération. "
La version bêta de DeepSeek-R1 consultée par Xiaoyi m'a donné une conception complète de ligne de dialogue après une brève réflexion. Sur la base des différentes caractéristiques du paravent, un total de quatre scènes et une fin ont été conçues. La structure globale est assez complète et les lignes familières sont bien faites. En même temps, chaque ligne de dialogue reçoit une conception d'écran correspondante.
Il convient de noter que si le langage familier n’est pas requis, les réponses qu’il donnera seront trop formelles et rigoureuses, et auront quand même un petit goût d’IA.
En général, les performances de longueur de contexte et la précision des réponses de la version bêta DeepSeek-R1 actuellement connectée à Xiaoyi sont encore dans un état relativement basique, qui peut être limité par des facteurs tels que la vitesse de publication, les compromis d'intégration, etc., et nous devons attendre les itérations suivantes.
Cependant, étant donné que les conditions de connexion actuelles du site Web officiel et des applications officielles de DeepSeek sont vraiment mauvaises et que diverses autres plates-formes cloud et déploiements locaux ont des exigences strictes en matière d'environnement et de seuil d'utilisation, face à des problèmes moins complexes, l'utilisation directe de DeepSeek connecté à Huawei Xiaoyi est un bon choix.
# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo