Pourquoi tout ce buzz autour de Deepseek ?

Découvrez Deepseek, la start-up chinoise qui secoue l'IA avec son modèle R1 open source. Gratuit et ultra-performant, R1 surpasse des géants comme OpenAI en raisonnement mathématique. Après une cyberattaque, Deepseek reste un acteur clé dans l'innovation AI, avec R1 disponible sur Hugging Face.

Deepseek suspend les nouvelles inscriptions après une cyberattaque : R1, un LLM qui secoue le monde de l’IA

La start-up chinoise Deepseek fait parler d’elle avec le lancement de R1, son nouveau modèle de langage open source (LLM). Réputé pour ses performances exceptionnelles et sa gratuité, R1 représente une réelle menace pour des géants comme OpenAI, dans un contexte où les États-Unis renforcent leurs investissements en IA, notamment à travers l’initiative Stargate, prévoyant 500 milliards de dollars pour l’infrastructure dédiée à l’IA.

Des cyberattaques ciblent Deepseek

Si Deepseek attire l'attention, elle devient également une cible pour des acteurs malveillants. Le 27 janvier 2025, l'entreprise a été contrainte de suspendre les nouvelles inscriptions après avoir subi une cyberattaque à grande échelle. D’après la page de statut de Deepseek, cette attaque a affecté ses services, ce qui a conduit à une suspension temporaire des inscriptions afin de garantir la continuité du service. Les utilisateurs existants peuvent toutefois se connecter normalement. Bien que les détails de l'attaque n'aient pas été révélés, il est supposé qu’il s’agissait d’une attaque par déni de service distribué (DDoS) visant l'API et la plateforme web de chat de Deepseek.

La montée en puissance de Deepseek

Fondée en 2023, Deepseek était jusqu’ici un laboratoire de recherche en IA relativement discret. Pourtant, le lancement de son modèle a suscité un vif intérêt, notamment à Silicon Valley. En effet, Deepseek a prouvé qu’il était possible de surpasser certains des modèles les plus performants du marché, comme GPT-4 d'OpenAI, en termes de raisonnement mathématique et de résolution de problèmes. Cette performance s’explique par une réinvention de la structure des modèles IA et une utilisation plus efficace des ressources limitées, selon Wired.

Raisonnement et apprentissage par renforcement

À la fin de 2024, Deepseek a lancé Deepseek V3, un modèle de langage capable de rivaliser avec Llama 3.1 de Meta, GPT-4 d’OpenAI ou Claude 3.5 Sonnet d’Anthropic. Le modèle R1, qui est une version améliorée de V3, se distingue comme un modèle de raisonnement. À l’instar de GPT-4 d'OpenAI, R1 utilise la technique du raisonnement par chaîne de pensée (CoT). Contrairement aux modèles traditionnels qui répondent directement à une question, R1 décompose d'abord la requête en plusieurs réflexions, ce qui lui permet d'analyser et de corriger d’éventuelles erreurs ou hallucinations avant de fournir une réponse finale. Selon Georg Zoeller, Chief Strategist de C4AIL, les articles techniques de Deepseek ouvrent la voie à de nouvelles possibilités, notamment l’utilisation de l’apprentissage par renforcement et la distillation pour affiner davantage le comportement des modèles.

R1 disponible gratuitement

Deepseek R1 est accessible gratuitement sur Hugging Face et sous la licence open source MIT, très permissive. Perplexity, un moteur de recherche propulsé par l’IA, est l'un des premiers services à avoir intégré R1. Les abonnés à Perplexity Pro peuvent désormais choisir entre GPT-4 d’OpenAI et R1 pour leurs « requêtes de raisonnement ». Pour rassurer les utilisateurs qui hésiteraient à partager des données avec un LLM basé en Chine, Perplexity souligne que son modèle R1 est hébergé dans des centres de données occidentaux, en Europe et aux États-Unis.

En résumé, le lancement de R1 par Deepseek place la start-up comme un acteur de poids dans le domaine de l’IA, offrant un modèle performant et accessible gratuitement, qui attire déjà l’attention des experts et des grandes entreprises du secteur.

Source : ICTjournal

4 min de lecture

janv. 28, 2025

Par L. F.