Retour au blog
Newsletter 10 min

Claude en avril 2026 : ce qui a vraiment changé pour ton quotidien

É
Équipe brAIny

Un nouveau modèle. Un agent de bureau en disponibilité générale. Des routines cloud qui tournent pendant que ton ordinateur est éteint. Une infrastructure pour déployer des agents sans toucher au code. Une intégration Word. Un outil de design. Et un modèle jugé trop dangereux pour être distribué au public. Avril 2026 a été dense côté Anthropic. Voici ce qui mérite vraiment ton attention, avec les chiffres pour l'appuyer.


Claude Opus 4.7 : la réponse à une polémique autant qu'une vraie mise à jour

Avant de parler du nouveau modèle, il faut parler de ce qui s'est passé juste avant sa sortie.

Depuis février 2026, les plaintes s'accumulent dans la communauté dev. Stella Laurenzo, directrice senior IA chez AMD, a publié sur GitHub une analyse basée sur 6 852 sessions de Claude Code, 234 760 appels d'outils et 17 871 blocs de raisonnement entre janvier et mars 2026. Ses données montrent que la profondeur de raisonnement visible avait chuté de 73% sur cette période : en janvier, le modèle produisait environ 2 200 caractères de réflexion avant de modifier du code. En mars, c'était tombé à 600. Les appels API par tâche avaient explosé, jusqu'à 80 fois plus qu'en février. Des utilisateurs ont commencé à parler d'"AI shrinkflation" : payer le même prix pour un modèle qui réfléchit moins.

Anthropic a répondu en précisant que les changements visibles venaient d'ajustements produit délibérés : passage à un effort "adaptatif" par défaut le 9 février, puis effort réglé à "medium" (niveau 85) début mars, présenté comme le meilleur équilibre entre qualité, vitesse et coût pour la plupart des utilisateurs. VentureBeat Pas un modèle dégradé donc, mais un modèle qui pensait moins par défaut, et une communication insuffisante autour de ces changements.

Opus 4.7 arrive dans ce contexte le 16 avril, au même prix qu'Opus 4.6 (5/25/25 /25 par million de tokens). Ses performances ressemblent à ce qu'Opus 4.6 faisait avant les ajustements, en mieux sur plusieurs points. Sur SWE-bench Pro, le benchmark de référence pour les tâches d'ingénierie logicielle en conditions réelles, Opus 4.7 atteint 64,3% contre 53,4% pour Opus 4.6, soit un gain de 10,9 points en une seule version.Anthropic annonce 3 fois plus de tâches de production résolues et un gain de 13% sur un benchmark de 93 tâches de codage.

Trois choses changent concrètement. D'abord, le travail en autonomie sur des tâches longues : le modèle vérifie ses propres sorties avant de te rendre un résultat, et conserve des notes importantes d'une session à l'autre via une mémoire persistante. Anthropic formule ça directement dans son annonce : "tu peux désormais confier ton travail le plus difficile, celui qui nécessitait auparavant une surveillance étroite, avec confiance."

Ensuite, la vision haute résolution : Opus 4.7 accepte des images jusqu'à 2 576 pixels sur le bord long, soit 3,75 mégapixels contre 1,15 pour Opus 4.6. Sur les tâches de navigation visuelle sans outils, il atteint 79,5% contre 57,7% pour son prédécesseur. Analyser une capture d'écran dense, un schéma technique ou un tableau financier devient beaucoup plus fiable.

Enfin, un nouveau niveau d'effort "xhigh" entre "high" et "max" pour les tâches qui demandent plus de profondeur sans attendre deux fois plus longtemps.

Une honnêteté s'impose : la course reste serrée. GPT-5.4 garde l'avantage sur la recherche web avec un score BrowseComp de 89,3% contre 79,3% pour Opus 4.7, et sur certaines tâches de terminal. Opus 4.7 prend la tête sur les workflows de développement et les agents, GPT-5.4 reste devant sur les tâches de recherche web connectée.


Claude Cowork en disponibilité générale : l'assistant qui travaille pendant que tu dors

Disponible sur tous les plans payants depuis le 14 avril, sur Mac et Windows. Cowork opère directement sur ton ordinateur, coordonne plusieurs flux de travail en parallèle, et génère des fichiers Excel avec formules fonctionnelles et des présentations PowerPoint formatées.

La nouveauté la plus utile ce mois-ci : la commande /schedule. Tu programmes une tâche récurrente une fois, et elle s'exécute automatiquement à l'heure définie tant que l'application est ouverte. Un responsable commercial peut programmer un briefing quotidien à 7h30 : Cowork compile les nouvelles mentions des concurrents depuis la veille, les nouveaux appels d'offres pertinents, et dépose un résumé Word sur le bureau avant que la journée commence. Un DAF peut programmer une consolidation hebdomadaire le lundi matin : Cowork récupère les données des différents outils, les agrège dans un Excel, et génère le rapport de trésorerie sans intervention humaine.

Et depuis l'application mobile, tu peux assigner une tâche à ton ordinateur de bureau à distance. Tu pars en réunion, tu envoies depuis ton téléphone "prépare-moi une synthèse des 10 dernières factures reçues dans un tableau Excel". Tu rentres, c'est fait.


Claude Routines : mettre Claude Code sur pilote automatique

C'est la nouveauté la plus puissante du mois pour les équipes qui utilisent Claude Code, et elle reste encore peu connue. Disponibles sur les plans Pro, Max, Team et Enterprise, les Routines permettent de définir une tâche une fois et de la faire tourner automatiquement sur l'infrastructure d'Anthropic, que ton ordinateur soit allumé ou non.

Concrètement, une Routine c'est un prompt Claude Code, des repositories GitHub et des connecteurs MCP, packagés ensemble et déclenchés automatiquement. Trois types de déclencheurs sont disponibles.

Le déclencheur Schedule. Tu programmes une cadence : chaque soir, chaque semaine. La Routine s'exécute, crée une session cloud, fait le travail, et le résultat t'attend le lendemain matin. Exemple : chaque soir, la Routine lit les issues ouvertes dans ton tracker depuis la dernière exécution, applique des labels, assigne des responsables selon la zone de code concernée, et poste un résumé dans Slack. Ton équipe commence la journée avec une backlog organisée sans que personne n'ait rien fait.

Le déclencheur API. Chaque Routine a son propre endpoint HTTP. Tu lui envoies un POST avec un bearer token, une session se lance. Ça te permet de brancher Claude Code dans n'importe quel système : un outil de monitoring qui déclenche une Routine quand un seuil d'erreur est franchi, un pipeline de déploiement qui lance une vérification après chaque mise en prod, une alerte Sentry qui ouvre automatiquement un draft de Pull Request avec une proposition de correction. Ton équipe on-call reçoit une PR à examiner plutôt qu'un terminal vide.

Le déclencheur GitHub. La Routine se lance automatiquement quand un événement précis se produit sur un repository : ouverture d'une PR, merge, création d'une release. Tu peux filtrer précisément : seulement les PRs ciblant la branche main, seulement celles taggées avec un label spécifique. Exemple : à chaque nouvelle PR ouverte, la Routine applique ta checklist de revue de code maison, laisse des commentaires inline sur les problèmes de sécurité et de performance, et ajoute un commentaire de synthèse. Tes reviewers humains se concentrent sur l'architecture, pas sur les vérifications mécaniques.

Ce qui change vraiment : jusqu'ici, les agents IA devaient être surveillés et relancés manuellement. Les Routines font tourner ces agents de manière continue, sans intervention, sur l'infrastructure d'Anthropic. Le laptop peut être fermé. La Routine continue. Et chaque exécution crée une session que tu peux inspecter, reprendre, ou transformer en Pull Request.


Claude Managed Agents : déployer un agent sans construire l'infrastructure

Lancé le 8 avril en beta publique, Managed Agents est une suite d'APIs composables pour construire et déployer des agents hébergés dans le cloud à grande échelle.

Jusqu'ici, faire tourner un agent en production demandait des mois de travail d'infrastructure : sandboxing sécurisé, gestion de l'état entre les sessions, boucles d'exécution, reprise en cas d'erreur réseau. Tout ça était à construire soi-même avant de s'occuper de la logique métier. Managed Agents règle ces cinq problèmes d'un coup : boucle d'agent, exécution des outils, isolation en sandbox, persistance de l'état, et protocoles de streaming. En appelant trois endpoints, tu transformes Claude en un agent véritablement autonome et exécutable.

Ce que ça change dans la pratique : un agent qui surveille les emails entrants, classe les demandes, génère des réponses draft et archive au bon endroit peut tourner en production en quelques jours, pas en plusieurs mois. Un agent de veille concurrentielle qui tourne toutes les nuits et dépose un rapport chaque matin. Un agent de qualification de leads qui s'active dès qu'un formulaire est rempli, enrichit le contact avec des données publiques, et crée la fiche dans le CRM. Notion, Rakuten et Sentry sont déjà en production avec des cas d'usage mesurables. La durée d'autonomie de Claude Code a doublé en trois mois, passant de 25 à 45 minutes sur les sessions les plus longues.

La tarification : tarifs API standards plus 0,08$ par heure de session active. Pour des tâches courtes de quelques minutes, le surcoût est négligeable. Pour des agents qui tournent plusieurs heures, le coût de runtime peut dépasser le coût des tokens, un point à anticiper avant de scaler.


Claude dans Word : un relecteur qui connaît tout ton document

Lancé en beta publique le 10 avril, Claude for Word se présente comme un add-in natif pour Microsoft Word sur Mac et Windows, disponible via Microsoft AppSource pour les abonnés Team et Enterprise.

Ce qui différencie cette intégration d'un simple chatbot : Claude lit l'intégralité du fichier, y compris les notes de bas de page, les fils de commentaires, les modifications suivies, les tableaux et les signets, puis fournit des réponses avec des citations cliquables qui t'amènent directement au texte référencé. Il n'est pas dans une fenêtre séparée. Il est dans le document.

Voici exactement ce que tu peux faire selon Anthropic. Tu laisses un commentaire sur un paragraphe pour indiquer ce que tu veux changer : Claude le lit, modifie le texte en Tracked Change, et répond dans le fil de commentaires. Tu ouvres ton template et tu décris ce que tu veux : Claude rédige dans tes styles de titres et de bullets existants, avec des citations vers les documents sources uploadés. Claude scanne aussi l'intégralité du fichier pour détecter les incohérences de termes définis, les références croisées cassées et les erreurs de numérotation dans les documents longs, avec des corrections proposées en Tracked Changes pour ta validation. Et quand ton équipe a rodé un workflow, par exemple une revue de contrat type, tu le sauvegardes comme Skill. N'importe qui dans l'équipe peut ensuite l'exécuter et obtenir le même résultat.

Le contexte est partagé entre les apps Office : une conversation peut opérer simultanément sur Word, PowerPoint et Excel. Tu peux transférer des données depuis Excel dans Word, créer une présentation depuis un document, et vérifier la cohérence entre plusieurs fichiers dans une même session.

Cas d'usage concret pour une PME : tu reçois un contrat fournisseur, tu l'ouvres dans Word, tu demandes à Claude de "repérer les clauses qui s'écartent des conditions standards du marché et de les classer par niveau de risque". Il te sort une liste en Tracked Changes avec ses commentaires sur chaque clause. Tu passes ensuite à ton juriste uniquement ce qui mérite attention, pas les 40 pages entières.


Claude Design : du visuel sans ouvrir Figma

Anthropic a lancé Claude Design le 17 avril, un outil expérimental qui permet de créer des visuels comme des prototypes, des slides, des one-pagers et des maquettes UI en langage naturel. Figma a perdu 7% dans les heures qui ont suivi l'annonce. Ça situe la portée perçue de la chose.

Le différenciateur principal : Claude Design peut lire ta base de code ou tes fichiers Figma pour extraire automatiquement ton système de design, couleurs, typographie, espacements, puis appliquer ce système à tous tes nouveaux projets. Scroll Le workflow est conversationnel : tu décris ce que tu veux, Claude produit une première version en quelques secondes. L'output n'est pas une image statique, c'est du HTML live, cliquable et testable, que tu affines ensuite par des retours directs.

Deux résultats concrets publiés par Anthropic méritent d'être cités. L'équipe de Brilliant a rapporté que des pages nécessitant 20 prompts ou plus dans des outils concurrents n'en nécessitaient que 2 dans Claude Design. L'équipe produit de Datadog a décrit comment un cycle qui prenait une semaine, brief, maquette, rounds de révision, a été comprimé en une seule conversation. Build Fast with AI

Pour un dirigeant PME sans bagage design, le cas d'usage le plus immédiat : préparer une présentation commerciale ou un one-pager pour un prospect sans attendre qu'un graphiste soit disponible. Tu décris le contenu, Claude produit quelque chose de présentable, tu exportes vers Canva pour la touche finale. C'est encore en preview de recherche, les fonctionnalités vont évoluer, mais la direction est claire.


Claude Mythos : pourquoi Anthropic a sorti un modèle qu'il refuse de distribuer

C'est la news la plus importante du mois, et elle ne concerne pas la productivité. Elle concerne ce que l'IA est désormais capable de faire de manière autonome.

Le 7 avril, Anthropic a annoncé Claude Mythos, un modèle qu'il a décidé de ne pas rendre public. Sans aucune instruction de ses ingénieurs, le modèle a développé de manière autonome des capacités offensives en cybersécurité d'un niveau inédit. Il a identifié des milliers de vulnérabilités dans tous les systèmes d'exploitation et navigateurs majeurs, dont certaines vieilles de 27 ans. Dans un cas documenté, il a obtenu un accès root complet sur un serveur FreeBSD via une faille vieille de 17 ans, sans aucune intervention humaine, en enchaînant de manière autonome plusieurs exploits complexes.

Le UK AI Security Institute a évalué ces capacités : sur les tâches de niveau expert en cybersécurité, des tâches qu'aucun modèle ne pouvait accomplir avant avril 2025, Mythos y parvient 73% du temps. Aisi Sur SWE-bench Verified, il atteint 93,9%, loin devant Opus 4.6, GPT-5.4 et Gemini 3.1 Pro. Frank's World Anthropic a restreint l'accès à 40 organisations mondiales, annoncé 100 millions de dollars investis dans la recherche défensive, et lancé Project Glasswing avec plus de 50 organisations de cybersécurité pour corriger les vulnérabilités découvertes avant qu'elles soient exploitées.

Pourquoi on en parle ici ? Parce que ça dit quelque chose de clair sur la trajectoire de l'IA. Les modèles développent des capacités que leurs créateurs n'ont pas programmées. CrowdStrike rapporte dans son rapport 2026 une hausse de 89% des attaques utilisant l'IA d'une année sur l'autre. Pour une PME, ça veut dire que la surface d'attaque augmente. Les systèmes considérés comme sécurisés ne le sont plus nécessairement. Ce n'est pas un sujet à remettre à dans 18 mois.


Ce qu'on retient chez brAIny

Avril marque une double accélération. D'un côté, les outils du quotidien deviennent vraiment opérationnels : Cowork avec ses tâches programmées, les Routines qui tournent sans surveillance sur l'infrastructure d'Anthropic, Word intégré avec ses Tracked Changes, Managed Agents qui supprime des mois d'infrastructure, Claude Design qui donne accès au visuel sans compétence technique, Opus 4.7 qui répare en partie la frustration légitime des utilisateurs sur 4.6. De l'autre, Mythos pose une question que personne ne peut ignorer : à partir de quand les capacités d'un modèle dépassent-elles ce qu'une organisation peut gérer sans filet ?

Ce qui change concrètement pour toi dès maintenant, c'est que Claude peut être un collaborateur qui travaille pendant que tu dors. Ce n'était pas vrai il y a 6 mois.

Tu veux savoir comment intégrer ces outils dans ton organisation ? On en parle.

[Prendre rendez-vous →] Gratuit · Sans engagement · 30 minutes

Sujets abordés

#Apprentissage#Ecole#Business#Automatisation#IA