Installer DeepSeek R1 sur Ubuntu
Guide d'installation de Deepseek R1 sur Ubuntu

Au sommaire :
- 1-Qu'est-ce que Deepseek R1?
- 2-Les réactions
- 3-Prérequis
- 4-Installation
- 5-Configuration
1-Qu'est-ce que DeepSeek R1 ?
Mis en ligne le 20/01/2025, soit le jour même du blocage de TikTok et un jour avant que Trump annonce le projet Stargate, DeepSeek R1 est une intelligence artificielle générative (GenAI) open-source sous licence MIT conçue par la société chinoise DeepSeek AI, filiale du fond d'investissement quantitatif High-Flyer fondé par Wenfend Liang.
Conçue avec infiniment moins de moyen que les IA de la tech américaine (son entrainement aurait coûté un peu moins de 6 millions de dollars avec 2048 cartes graphiques Nvidia H100), DeepSeek R1 se permet de rivaliser avec ChatGPT o1.
Je cite le site Usine Digitale : "Côté performances, DeepSeek-R1 obtient des résultats comparables voire supérieurs à la version o1-1217 et à o1-mini dans la plupart des benchmarks. Les versions distillées semblent également capables de se mesurer aux modèles d'OpenAI : par exemple, DeepSeek-R1-Distill-Qwen-32B surpasse o1-mini sur différents benchmarks, ce qui en fait une nouvelle référence en matière de modèles dits "denses". Le tout à un prix largement inférieur pour les développeurs qui souhaiteraient l'utiliser.
Quand un million de jetons coûte 0,55 dollars en entrée et 2,19 dollars en sortie pour l'API du modèle de DeepSeek, le prix est de 15 dollars en entrée et de 60 dollars en sortie pour l'API d'o-1. Plus concrètement, cela signifie que les prix d'entrée et de sortie de l'API o-1 sont respectivement 27,27 fois et 27,40 fois plus élevés que ceux de DeepSeek, ou pour le formuler autrement, le tarif de o-1 est environ 2627% et 2639% plus élevé que celui de DeepSeek. Si l'on fait une comparaison globale de l'ensemble des coûts pour 1 million de jetons, le chiffre est encore plus impressionnant : l'API de DeepSeek est 96,4% moins chère que l'API d'OpenAI.

L'historique de la société est également très intéressant à lire. Je cite Markus Kasanmascheff : "L’aventure de DeepSeek a commencé en 2021, lorsque Liang, surtout connu pour son fonds de trading quantitatif High-Flyer, a commencé à acquérir des milliers de GPU Nvidia.
À l’époque, cette décision semblait inhabituelle. Comme l’a déclaré l’un des partenaires commerciaux de Liang au Financial Times, “Lorsque nous l’avons rencontré pour la première fois, il était très geek avec une coiffure peu flatteuse et parlait de bâtir un cluster de 10 000 puces pour entraîner ses propres modèles. Nous ne le prenions pas au sérieux.”
Selon cette même source, “Il ne savait pas vraiment exprimer sa vision à part dire : je veux construire ceci, et cela va changer la donne. Nous pensions que cela n’était possible que pour des géants comme ByteDance et Alibaba.”
Malgré ce scepticisme initial, Liang s’est concentré sur la préparation face aux possibles contrôles d’exportation américains. Cette prévoyance a permis à DeepSeek de sécuriser une importante quantité de matériel Nvidia, incluant des GPU A100 et H800, avant que des restrictions généralisées ne prennent effet.
DeepSeek a fait la une des journaux en annonçant avoir entraîné son modèle R1, d’une capacité de 671 milliards de paramètres, pour un coût de seulement 5,6 millions de dollars en utilisant 2 048 GPU H800.
Bien que la performance des H800 soit délibérément limitée pour le marché chinois en raison des restrictions imposées par les États-Unis, les ingénieurs de DeepSeek ont optimisé le processus d’entraînement pour obtenir des résultats de haut niveau à un coût bien inférieur à celui habituellement associé aux modèles de langage à grande échelle.
Dans une interview publiée par le MIT Technology Review, Zihan Wang, ancien chercheur chez DeepSeek, explique comment l’équipe a réussi à réduire l’utilisation de la mémoire et le temps de calcul tout en préservant l’exactitude.
Il a mentionné que les limitations techniques les avaient poussés à explorer des stratégies d’ingénierie novatrices, leur permettant ainsi de rester compétitifs face à des laboratoires technologiques américains mieux financés."
Étant open-source, DeepSeek R1 peut-être installé en local sur votre ordinateur (macOS, Windows, Linux), sur votre serveur et même sur votre Raspberry Pi ou un smartphone.

2-Les réactions
Le moins que l'on puisse dire c'est que DeepSeek R1 fait énormément parler de lui sur les réseaux sociaux depuis sa sortie en plus d'agiter les places boursières partout à travers le monde. Voici un florilège des réactions que l'on peut trouver à son sujet.
Pour moi, l'aspect le plus fascinant de Deepseek est le fait qu'il émane d'un fonds spéculatif, quelques mois à peine après que la Chine a « sévi » sur les niveaux de rémunération dans le secteur financier.
C'est aussi, incidemment, une raison importante pour laquelle les États-Unis auront du mal à rivaliser avec la Chine.
Je m'explique.
Tout d'abord, il convient de mentionner que, comme pour la plupart des initiatives chinoises, les médias occidentaux ont présenté cette mesure comme étant terrible (deux exemples illustrés ci-dessous) - « pourquoi la Chine ferait-elle cela à de pauvres banquiers innocents » ? Comme d'habitude, ils n'ont même pas essayé de réfléchir aux raisons qui ont poussé la Chine à agir de la sorte : comme nous le savons tous, toutes les initiatives chinoises sont toujours complètement dénuées de sens et les « mesures de répression » sont juste ce que le parti communiste fait pour s'amuser...
La véritable raison de cette mesure, je crois, est que la Chine a observé l'Occident - les États-Unis en particulier - et a constaté l'importance démesurée de l'industrie financière au détriment de l'économie réelle. Elle a notamment constaté que les diplômés les plus brillants du pays, issus des meilleures écoles de l'Ivy League, allaient travailler pour l'industrie financière, de plus en plus parasitaire, au lieu de se consacrer à des activités qui font réellement avancer la société.
Bloomberg a déploré ci-dessous que la « répression » « alimente la fuite des cerveaux de l'industrie » et, oui, c'était précisément le but recherché : La Chine ne veut pas que ceux qui peuvent le plus contribuer à la société passent leur carrière à construire des produits financiers dérivés toujours plus insensés ou de nouvelles façons d'échanger des crypto-monnaies. Cela ne veut pas dire qu'elle ne veut pas d'une industrie financière, elle a sa raison d'être, mais pas d'une industrie qui devienne un tel fardeau pour la société, en particulier pour ce qui est d'attirer les meilleurs talents du pays. La Chine préférerait qu'ils travaillent sur des choses comme... l'intelligence artificielle.
Et voilà que quelques mois plus tard, des génies des fonds spéculatifs ont trouvé une nouvelle vocation dans l'intelligence artificielle. La coïncidence est trop belle pour ne pas y voir une corrélation.
C'est quelque chose qui serait sans doute très difficile à faire aux États-Unis, où le capital est très contrôlé : une industrie qui devient extrêmement riche, même si elle nuit largement à des objectifs sociétaux plus larges, devient difficile à réformer. C'est ce que nous constatons dans les secteurs de la finance, de la défense, des grandes entreprises pharmaceutiques, etc.
Cela montre également que les États-Unis et la Chine sont à des stades différents de leur développement : la financiarisation excessive est un schéma courant chez les grandes puissances en fin de développement - de la République néerlandaise à l'Empire britannique (mais aussi Venise ou l'Espagne) - et un facteur de leur déclin de type cercle vicieux. Les grandes puissances émergentes sont souvent plus réfléchies et plus agiles dans la gestion des flux de talents afin de parvenir à une primauté technologique et industrielle.
L'examen de cette question est également très intéressant dans le contexte du débat sur les visas H-1B aux États-Unis. Il semble que le débat n'aborde pas l'éléphant dans la pièce : pourquoi invoquer une pénurie de talents de haut niveau alors que les meilleurs cerveaux du pays sont dirigés vers l'industrie financière ? Il serait beaucoup plus cohérent de commencer par répartir les talents de manière réfléchie dans le pays avant de chercher à drainer les cerveaux dans le reste du monde...
Quoi qu'il en soit, voici un nouvel exemple d'une politique chinoise qui semble bizarre et incompréhensible pour l'Occident à première vue, mais qui, à long terme (et même à court terme, comme l'illustre Deepseek), aide la Chine à développer un autre avantage stratégique dans la compétition technologique. En clair, vous voulez que vos meilleurs cerveaux créent de la valeur réelle, et non qu'ils l'extraient de la société. @RnaudBertrand
La plupart des gens ne réalisent probablement pas à quel point la société chinoise Deepseek est une mauvaise nouvelle pour OpenAI.
Ils ont mis au point un modèle qui égale et même dépasse le dernier modèle o1 d'OpenAI sur différents benchmarks, et ils ne facturent que 3 % du prix.
C'est un peu comme si quelqu'un avait sorti un téléphone portable comparable à l'iPhone mais qu'il le vendait 30 dollars au lieu de 1000. C'est aussi spectaculaire que cela.
De plus, ils publient le modèle en code source libre, de sorte que vous avez même la possibilité - qu'OpenAI n'offre pas - de ne pas utiliser leur API du tout et d'exécuter le modèle « gratuitement » vous-même.
Si vous êtes client d'OpenAI aujourd'hui, vous allez évidemment commencer à vous poser des questions, comme « attendez, pourquoi devrais-je payer 30 fois plus cher ? Il s'agit d'une véritable transformation, qui remet fondamentalement en question l'économie du marché.
Elle permet également de réaliser de nombreuses applications d'IA qui étaient jusqu'à présent totalement inabordables. Supposons par exemple que vous souhaitiez créer un service qui aide les gens à résumer des livres (exemple aléatoire). Dans le langage de l'IA, un livre moyen représente environ 120 000 tokens (puisqu'un « token » représente environ 3/4 d'un mot et qu'un livre moyen représente environ 90 000 mots). Aux prix pratiqués par OpenAI, le traitement d'un seul livre coûterait près de 2 dollars, puisqu'ils facturent 15 dollars pour 1 million de jetons. L'API de Deepseek ne coûterait cependant que 0,07 $, ce qui signifie que votre service peut traiter environ 30 livres pour 2 $ contre un seul livre avec OpenAI : votre service de résumé de livres est donc économiquement viable.
Supposons que vous souhaitiez créer un service qui analyse les bases de code à la recherche de failles de sécurité. Une base de code typique d'une entreprise peut représenter 1 million de lignes de code, soit environ 4 millions de jetons. Ce service coûterait 60 dollars avec OpenAI, contre seulement 2,20 dollars avec DeepSeek. Au prix d'OpenAI, les analyses de sécurité quotidiennes coûteraient 21 900 dollars par an et par base de code ; avec DeepSeek, elles coûteraient 803 dollars.
Il semble donc que la donne ait changé. Tout cela grâce à une entreprise chinoise qui vient de démontrer comment les restrictions technologiques américaines peuvent se retourner contre elle de manière spectaculaire - en la forçant à construire des solutions plus efficaces qu'elle partage maintenant avec le monde entier à 3 % du prix d'OpenAI. Comme le dit le proverbe, la pression crée parfois des diamants. @RnaudBertrand
"Tout d'abord parce qu'ils le peuvent, je pense : ils gagnent encore de l'argent à ces prix.
Cela témoigne également d'une philosophie ou d'une vision différente de l'IA : le nom ironique « OpenAI » vise essentiellement à établir un monopole en creusant un fossé avec des quantités massives de GPU et d'argent. Deepseek mise clairement sur un avenir où l'IA devient un produit de base, largement disponible et abordable pour tous. En fixant des prix aussi agressifs et en publiant son code en code source libre, elle ne fait pas que concurrencer OpenAI, elle déclare en fait que l'IA devrait être comme l'électricité ou la connectivité internet - un service public de base qui stimule l'innovation plutôt qu'un service premium contrôlé par un petit nombre d'acteurs.
Et dans ce monde, il est nettement préférable d'être le premier à avoir contribué à sa réalisation que d'être l'acteur historique qui a tenté de l'arrêter.@RnaudBertrand
Stargate, s'il va de l'avant, est susceptible de devenir l'un des plus grands gaspillages de capitaux de l'histoire :
Il repose sur des hypothèses dépassées concernant l'importance de l'échelle de calcul dans l'IA (le dogme « plus grand calcul = meilleure IA »), dont DeepSeek vient de prouver qu'il était erroné.
Elle part du principe que l'avenir de l'IA passe par des modèles fermés et contrôlés, alors que le marché préfère clairement des solutions démocratisées et à code source ouvert.
Il s'accroche à un livre de jeu de la guerre froide, présentant la domination de l'IA comme une course aux armements matériels à somme nulle, ce qui est vraiment en contradiction avec la direction que prend l'IA (à nouveau, les logiciels libres, les communautés mondiales de développeurs et les écosystèmes collaboratifs).
Elle mise sur OpenAI, une entreprise en proie à des problèmes de gouvernance et dont le modèle économique a sérieusement remis en question l'avantage de coût de DeepSeek, multiplié par 30.
En bref, cela revient à construire une ligne Maginot numérique d'un demi-billion de dollars : un monument très coûteux à des hypothèses obsolètes et erronées. C'est OpenAI et, par extension, les États-Unis qui mènent la dernière guerre.
Dernier point, il y a également une certaine ironie dans le fait que le gouvernement américain pousse si fort en faveur d'une technologie qui risque d'être si perturbatrice et potentiellement si dommageable, en particulier pour l'emploi. Je ne connais aucun autre exemple dans l'histoire où un gouvernement s'est montré aussi enthousiaste à l'égard d'un projet visant à détruire des emplois. On pourrait penser qu'il devrait être un peu plus prudent à ce sujet. @RnaudBertrand
Que cela vous plaise ou non, l'avenir de l'IA ne sera pas constitué de génies en conserve contrôlés par un « groupe de sécurité ». L'avenir de l'IA, c'est la démocratisation. Chaque rando de l'internet fera tourner non seulement o1, mais o8, o9 sur son ordinateur portable. C'est la marée de l'histoire sur laquelle nous devrions surfer, et non pas nager contre. Autant commencer à se préparer dès maintenant.
DeepSeek vient de dépasser Chatbot Arena, mon testeur de vibrations préféré, et deux autres tests indépendants qui n'ont pas pu être piratés à l'avance (Artificial-Analysis, HLE).
L'année dernière, il a été sérieusement question de limiter les modèles OSS en fonction d'un certain seuil de calcul. Il s'est avéré que ce n'était rien d'autre que notre orgueil de la Silicon Valley. C'est une leçon d'humilité qui nous rappelle à tous que la science ouverte n'a pas de frontières. Nous devons l'adopter, d'une manière ou d'une autre.
De nombreux techniciens s'affolent de voir tout ce que DeepSeek est capable de montrer avec un budget informatique aussi réduit. Je vois les choses différemment, avec un grand sourire. Pourquoi ne sommes-nous pas heureux de voir des améliorations dans la loi de mise à l'échelle ? DeepSeek est la preuve sans équivoque que l'on peut produire un gain d'intelligence unitaire à un coût 10 fois moindre, ce qui signifie que nous obtiendrons une IA 10 fois plus puissante avec les ressources informatiques dont nous disposons aujourd'hui et que nous construirons demain. C'est simple comme bonjour ! Le calendrier de l'IA vient d'être raccourci.
Voici ma résolution du Nouvel An 2025 pour la communauté :
Fini la propagation des mythes urbains de l'AGI/ASI.
Fini les discours alarmistes.
Baisser la tête et travailler sur le code.
Ouvrez les sources, autant que vous le pouvez.
L'accélération est la seule façon d'avancer. @DrJimFan
«Les ramifications de ce projet sont énormes. Chaque jour, la Chine fait quelque chose d’incroyable, totalement différent de la stagnation de l’UE, qui parle toute la journée sans rien accomplir, ou du dernier plan diabolique qui suinte de Washington. C’est tout simplement brillant et inspirant, et cela leur vaudra plus de bienveillance». @CaptainCrusty66
«C’est le livre de recettes de la Chine pour réussir dans tous les secteurs où les oligopoles occidentaux ont dominé». @bbooker450
«L’IA fera partie de l’infrastructure quotidienne, comme l’électricité et l’eau du robinet. DeepSeek est un pas important dans cette direction, grâce à sa réduction des coûts et à sa nature open source». @MrBig2024
«Nous vivons une époque où une entreprise non américaine maintient en vie la mission originale de l’OpenAI – une recherche véritablement ouverte, à la frontière, qui permet à tous de s’émanciper». @DrJimFan
«Il s’agit de capacités de raisonnement de niveau 1 que vous pouvez exécuter localement, que vous pouvez modifier et que vous pouvez étudier… c’est un monde très différent de celui dans lequel nous étions hier». Al, ligne de commentaires
«Comparaison des prix d’o1 d’OpenAI et de DeepSeek AI R1 : R1 est nettement moins cher dans toutes les catégories (96-98% d’économies). Maintenant vous savez pourquoi les grandes organisations ne veulent pas que l’open source continue, Si l’humanité va un jour bénéficier de l’IA, ce sera grâce à l’open source». @ai_for_success
«La Chine est en train de bouleverser la théorie du développement de manière étonnante. Le PIB par habitant de la Chine n’est que de 12 000 dollars. C’est 70% de moins que la moyenne des pays à revenu élevé. Pourtant, elle dispose du plus grand réseau ferroviaire à grande vitesse du monde. Elle a développé ses propres avions commerciaux. Ils sont les leaders mondiaux en matière de technologie des énergies renouvelables et de véhicules électriques. Ils disposent d’une technologie médicale avancée, de la technologie des smartphones, de la production de puces électroniques, de l’ingénierie aérospatiale… La Chine a une espérance de vie supérieure à celle des États-Unis, avec 80 % de revenus en moins. On nous a dit que ce type de développement nécessitait des niveaux de PIB/cap très élevés. Or, au cours des dix dernières années, la Chine a démontré qu’il était possible d’y parvenir avec des niveaux de production beaucoup plus modestes. Comment s’y prend-elle ? En utilisant les finances publiques et la politique industrielle pour orienter l’investissement et la production vers des objectifs sociaux et des besoins de développement du pays. Cela lui permet de convertir la production globale en résultats de développement de manière beaucoup plus efficace que dans d’autres pays, où la capacité de production est souvent gaspillée dans des activités qui peuvent être très rentables pour le capital ou bénéfiques pour les riches, mais qui ne font pas réellement progresser le développement. Bien sûr, la Chine a encore des lacunes à combler en matière de développement. Et nous savons, grâce à d’autres pays, qu’il est possible d’atteindre des indicateurs sociaux plus élevés avec le niveau de PIB/capacité de la Chine, en se concentrant davantage sur la politique sociale. Mais les réalisations sont indéniables, et les économistes du développement font le point». @jasonhickel
3-Prérequis
Il vous faudra un PC sous Linux, Windows ou macOS (Ubuntu pour les besoins du tutoriel) avec beaucoup de mémoire vive et d'espace disque ainsi qu'un processeur puissant (tout dépend quelle version de Deepseek R1 vous allez installer).
IA oblige, une carte graphique AMD/Nvidia est vivement recommandé et évitera à votre processeur de devoir tout calculer lui-même (la parallélisation des cartes graphiques est très utilisé dans le domaine de l'intelligence artificielle, voir la vidéo ci-dessous pour en comprendre les avantages).
3-Installation
Allez sur le site de Ollama pour installer ce dernier.
Ollama vous permet d'exécuter des modèles de langage de grande taille (LLM) localement sur votre ordinateur.

Cliquez sur "Download".

Le tutoriel étant basé sur Ubuntu, copiez la commande pour installer via le CLI.

sudo apt install curl && curl -fsSL https://ollama.com/install.sh | sh
Note : Ollama indique bien que si vous avez aucune carte graphique sur votre poste, ce sera le processeur qui devra tout calculer.


Vous aurez la possibilité de choisir le nombre de paramêtres :
Le r1:1.5b contient 1,5 milliards de paramètres et pèse 1,1 gb tandis que le r1:671b contient 671 milliards de paramètres et pèse plus de 400 Gb.
Le r1:671b nécessite donc un énorme espace disque, une grande quantité de mémoire vive, un processeur puissant mais vous aurez davantage de données en mémoire.
Pour les configurations plus modestes, orientez vous vers le r1-1.5b, le 7b ou le 8b.

Pour l'exemple, le r1:8b semble être un bon compromis car le r1:14b nécessite 10,5Go de mémoire vive et le r1:32b nécessite 22 Go donc ça peut poser problème pour pas mal de PC.
Lancez la commande suivante pour l'installer.
ollama run deepseek-r1:8b
4-Configuration
Une fois deepseek-r1:8b installé, vous allez pouvoir lui poser des questions.
J'utilise un PC portable i7 10th avec 16 Go DDR4 sans carte AMD/Nvidia.

Je lui pose une question au sujet du scénario d'un jeu vidéo. Il faut prendre en compte que j'utilise le r1:8b et que DeepSeek apprend de ses erreurs et s'améliore. Voici la premi-re fois que je lui pose la question.

Ensuite je lui est posé la question en anglais et la réponse fut déjà plus riche en informations.

Et en lui reposant la question en français, il indique qu'il va traduire sa précédente réponse.

La même question mais sur la version web. La réponse est mieux structurée, l'IA est déjà suffisamment entraînée et j'obtient ma réponse plus rapidement.


On peut voir l'écart béant entre la version 8b installé en local et la version web hébergé chez DeepSeek.
En terme de performance, voici un aperçu de ma configuration. C'est pas super rapide (tout est calculé par le processeur), pas de carte graphique pour accélérer le traitement, pas assez de mémoire vive, d'espace disque et de puissance processeur pour exécuter le 671b.

Pour afficher la liste des modèles que vous avez téléchargé.
ollama list
Pour quitter DeepSeek, faites Ctrl+D et pour relancer tapez la commande suivante.
ollama run deepseek-r1:8b
Évidemment, si vous voulez de meilleures performances, vous pouvez aussi utiliser la version web proposé par DeepSeek AI :
https://chat.deepseek.com/ (n'oubliez pas d'activer DeepThink R1).
Sources


La traduction française : https://reseauinternational.net/la-bombe-chinoise-deepseek-ebranle-le-projet-gachis-dia-de-500-milliards-de-dollars-de-trump/

La traduction française : https://reseauinternational.net/deepseek-ai-lentreprise-chinoise-deplace-la-capitale-de-la-technologie-de-palo-alto-a-hangzhou/

Au passage, pour comprendre cet engouement pour l'intelligence artificielle en Chine et comment s’est développé la tech chinoise depuis les années 2000 jusqu'à nos jours, je vous conseille "I.A. La plus grande mutation de l'histoire de l'histoire" de Kai Fu Lee.
