DeepSeek-V3-0324: Nouveau modèle IA plus rapide et précis

DeepSeek, une startup chinoise spécialisée en intelligence artificielle, a récemment dévoilé DeepSeek-V3-0324, une mise à jour significative de son modèle de langage de grande envergure. Disponible sur la plateforme Hugging Face, cette version apporte des améliorations notables en termes de raisonnement et de capacités de codage.

​Principales améliorations de DeepSeek-V3-0324:

Capacités de raisonnement renforcées : Le modèle affiche des progrès significatifs dans divers benchmarks, notamment:​

  • MMLU-Pro : passant de 75,9 à 81,2 (+5,3)​
  • GPQA : de 59,1 à 68,4 (+9,3)​
  • AIME : de 39,6 à 59,4 (+19,8)​
  • LiveCodeBench : de 39,2 à 49,2 (+10,0)​

DeepSeek-V3-0324

Développement web frontal amélioré

Le modèle génère désormais du code plus exécutable, aboutissant à des interfaces web et des frontaux de jeux plus esthétiques.​

Maîtrise accrue de l’écriture en chinois

DeepSeek-V3-0324 présente une meilleure qualité stylistique et de contenu, alignée sur le style d’écriture R1, offrant des productions plus riches en chinois.​

Amélioration des capacités de recherche en chinois

Le modèle fournit des analyses de rapports plus détaillées, répondant ainsi aux exigences complexes des utilisateurs.​

Précision accrue dans l’appel de fonctions

Les problèmes précédemment rencontrés dans les versions antérieures ont été corrigés, améliorant la précision des appels de fonctions.​

DeepSeek-V3-0324 est distribué sous licence MIT, favorisant son adoption tant pour la recherche que pour des applications commerciales. Les poids du modèle et la documentation technique sont accessibles sur Hugging Face, facilitant son intégration et son utilisation. ​

Cette mise à jour positionne DeepSeek comme un concurrent sérieux face aux leaders technologiques américains tels qu’OpenAI et Anthropic, en proposant un modèle performant et économiquement avantageux.

Retour en haut