AI on Thomas

MCP pour les nuls - la suite

Tue, 21 Apr 2026 00:00:00 +0000

Suite du post précédent, je mets en place une gateway pour protéger mon serveur MCP. Le serveur MCP a été déployé sur Azure Container, il est accessible.

Mise en place d’une Flex gateway

Création et enregistrement de ma nouvelle Flex gateway (mcp-gateway)

J’ai créé une image Docker de la flex avec son fichier d’enregistrement. L’image Docker tourne sur un Azure Container, elle est maintenant visible sur Anypoint (le control plane de MuleSoft).

Configuration de mon server MCP sur Anypoint

Documentation officielle de MuleSoft
Ajout de mon serveur MCP (mcp_card)

Aller sur API Manager (Anypoint) et sélectionner Agent and Tools Instances.

En sélectionnant la Flex Gateway mise en place pour ce projet.

Maintenant on peut ajouter un MCP Server et on finalise la configuration.

Le contrat du serveur mcp_card est visible sur le portail API d’Anypoint (Exchange).

Le serveur mcp_card est théoriquement accessible via la gateway, il faut maintenant ajouter les policies pour le sécuriser.

Policies pour mon serveur MCP

MCP Support

Cette policy est obligatoire pour le bon fonctionnement du serveur MCP.

Client ID Enforcement

Pour limiter l’accès au serveur mcp_card aux applications enregistrées qui ont le duo client_id/client_secret dans leurs Headers.

Nous avons donc 2 policies configurées sur notre gateway pour le serveur mcp_card.

Appels du serveur MCP avec Bruno

Nous allons tester la connectivité au server mcp_card avec le client API Bruno.

Configuration des Headers

Appels aux services du serveur mcp_card

Si le client_secret est faux dans les Headers

Observabilité

L’outil de monitoring d’Anypoint nous permet au niveau de la configuration du serveur de visualiser les appels. On voit les appels de chaque service et les appels en erreurs.

card_details

transaction_list

MCP pour les nuls

Tue, 24 Mar 2026 00:00:00 +0000

MCP Kesako ?

Protocole de communication entre un agent IA et un service.

MCP Documentation

Le service permet à un agent d’avoir accès à des données structurées (format JSON) qui ne sont pas déjà présentes dans son modèle LLM. Il existe deux protocoles de communication, io et http. Dans mon cas, je souhaite utiliser http, dans l’idée de créer un serveur MCP accessible à tous.

Pour accélérer le développement, je vais utiliser la librairie Python fastMCP :

fastMCP: https://gofastmcp.com/getting-started/welcome

Prototype du service MCP

Mon cas d’utilisation : je veux mettre en place un service qui donne les détails d’une carte de crédit si on lui donne le numéro en paramètre, ou la liste des transactions d’un compte.

Dans ce premier post, je ne vais pas aborder la sécurité ni l’observabilité, mais je souhaite en parler bientôt dans un post dédié, notamment via une API Gateway.

Pour commencer

Dans un environnement Python :

pip install fastmcp

Serveur MCP Card Details

J’ai créé deux services : le détail d’une carte et la liste des transactions d’un compte, avec des données fictives.

from fastmcp import FastMCP
from starlette.requests import Request
from starlette.responses import PlainTextResponse

mcp = FastMCP("My MCP Server")

@mcp.custom_route("/health", methods=["GET"])
async def health_check(request: Request) -> PlainTextResponse:
    return PlainTextResponse("OK")

@mcp.tool
def card_details(card_number: str) -> dict:
    # Dummy implementation for demonstration purposes
    return {
        "card_number": card_number,
        "card_type": "Visa",
        "expiry_date": "12/25",
        "cardholder_name": "John Doe"
    }

@mcp.tool
def transaction_list(account_id: str) -> list:
    # Dummy implementation for demonstration purposes
    return [
        {"transaction_id": "txn_001", "amount": 100.0, "currency": "USD", "status": "completed"},
        {"transaction_id": "txn_002", "amount": 50.0, "currency": "USD", "status": "pending"},
        {"transaction_id": "txn_003", "amount": 75.0, "currency": "USD", "status": "failed"}
    ]

if __name__ == "__main__":
    mcp.run(transport="http", port=8000)

Pour lancer le serveur qui va écouter sur le port 8000, j’exécute :

python my_server.py

Configuration de Copilot

Une fois que le serveur MCP tourne dans la console, je configure mon GitHub Copilot pour qu’il ajoute le serveur dans sa liste :

Une fois la configuration faite, on peut voir le serveur et les deux fonctionnalités (card_details et transaction_list) :

Utilisation du service

Les deux fonctionnalités sont maintenant accessibles dans le chat de Copilot :

Prochaines étapes

Mettre en place une API Gateway
- Authentification
- Observabilité
- Limitation, quotas

Labor market impacts of AI

Sun, 08 Mar 2026 00:00:00 +0000

https://www.anthropic.com/research/labor-market-impacts

Voici un résumé en francais de l’article d’Anthropic sur límpact de l’IA sur le marché du travail. Cet post est généré par l’IA, ce n’est pas une analyse. Je vais ajouter au fur et à mesure des liens sur des suppressions de postes liés à l’IA.

Résumé en français : Impact de l’IA sur le marché du travail

Points clés

Nouvelle mesure de risque : Les chercheurs introduisent l’« exposition observée » qui combine les capacités théoriques des LLM avec les données d’utilisation réelle, en mettant davantage l’accent sur les usages automatisés et professionnels plutôt qu’augmentatifs.

Écart théorie-pratique : L’IA est loin d’atteindre son potentiel théorique. Par exemple, Claude ne couvre que 33% des tâches dans le domaine informatique et mathématique, contre 94% en potentiel théorique.

Corrélation avec la croissance : Les emplois avec exposition plus élevée devraient connaître une croissance moins importante jusqu’en 2034 selon le Bureau of Labor Statistics.

Profil des travailleurs exposés : Comparés aux travailleurs non exposés, les travailleurs très exposés sont plus souvent des femmes (+16%), des Asiatiques (2× plus), mieux éduqués (17,4% ont un diplôme supérieur vs 4,5%) et gagnent 47% plus.

Impact sur l’emploi jusqu’à présent : Aucune augmentation systématique du chômage parmi les travailleurs très exposés depuis fin 2022. Cependant, des indices suggèrent que l’embauche de jeunes travailleurs (22-25 ans) a ralenti dans les secteurs exposés, avec une baisse de 14% du taux de conclusion d’emplois.

Méthodologie

L’étude combine :

La base de données O*NET (tâches par métier)
Les données d’utilisation d’Anthropic (Claude)
Les estimations d’exposition théorique de Eloundou et al. (2023)

Les chercheurs se concentrent sur le chômage comme indicateur principal, car il reflète directement le potentiel de préjudice économique.

Liens sur des suppressions d’emplois à cause de l’IA

The 2028 Global Intelligence Crisis

Sat, 28 Feb 2026 00:00:00 +0000

Publié par Citrini Research

Le blog intitulé “The 2028 Global Intelligence Crisis”, publié par Citrini Research, est une fiction qui imagine un scénario de crise économique majeure déclenchée par l’adoption massive de l’intelligence artificielle d’ici 2028.

https://www.citriniresearch.com/p/2028gic

1. Le “Cercle Vicieux de l’Intelligence”

Le rapport décrit un effet de rétroaction négative :

Productivité vs Emploi : Les entreprises adoptent massivement l’IA pour augmenter leur productivité et réduire leurs coûts, ce qui entraîne des licenciements massifs, particulièrement chez les cols blancs (secteur des services, ingénierie logicielle, finance).
Baisse de la consommation : Les travailleurs licenciés réduisent leurs dépenses. Cette chute de la demande globale pèse sur les revenus des entreprises, qui, pour maintenir leurs marges, licencient davantage et investissent encore plus dans l’IA pour automatiser.
Résultat : Un taux de chômage qui grimpe à plus de 10 % d’ici juin 2028 et une chute brutale des marchés boursiers.

2. Le concept de “PIB Fantôme” (Ghost GDP)

C’est l’un des points les plus marquants du blog :

L’IA génère une croissance de la production (le PIB augmente car les machines travaillent), mais cette richesse ne circule plus dans l’économie réelle.
Contrairement aux employés humains, les serveurs d’IA n’achètent pas de nourriture, ne paient pas de loyers et ne consomment pas de services locaux. La croissance devient déconnectée du bien-être de la population.

3. La crise du SaaS (Software as a Service)

Le rapport prédit l’effondrement des marges des entreprises de logiciels :

L’IA rend le développement de logiciels si facile et peu coûteux que les entreprises préfèrent créer leurs propres outils en interne plutôt que de payer des abonnements coûteux à des fournisseurs tiers (Salesforce, Zendesk, etc.).
Cela détruit les “moats” (avantages concurrentiels) traditionnels du secteur technologique.

4. Risque systémique et financier

La crise se propage au secteur financier :

Immobilier : Les anciens cadres bien rémunérés ne peuvent plus rembourser leurs prêts hypothécaires, créant une crise de la dette.
Crédit privé : De nombreux fonds de dette sont exposés à des entreprises de technologie dont la valeur s’effondre, créant une réaction en chaîne similaire à celle de 2008, mais causée par l’obsolescence technologique plutôt que par des prêts subprime.

5. Conclusion du rapport

Le texte n’est pas une prédiction exacte, mais une mise en garde. Il souligne que si l’IA peut rendre l’économie plus “efficace”, elle peut aussi détruire les mécanismes de redistribution des revenus (le salaire contre le travail) sur lesquels repose la stabilité sociale et économique actuelle. Les auteurs suggèrent que des mesures comme une taxe sur l’IA ou un changement radical de politique fiscale pourraient devenir nécessaires pour éviter ce scénario.

Pour résumer

C’est une vision dystopique où l’IA réussit “trop bien”, au point de rendre les consommateurs humains superflus dans le système économique, provoquant une récession mondiale par manque de demande.

Matt Shumer blog post

Tue, 17 Feb 2026 00:00:00 +0000

Matt Shumer

Something Big Is Happening

A personal note for non-tech friends and family on what AI is starting to change.

Voici un résumé en français de l’article :

L’auteur compare la situation actuelle de l’IA à celle du début de la pandémie de Covid-19 : la plupart des gens ne réalisent pas encore l’ampleur du bouleversement qui arrive. Travaillant dans l’IA, il explique que les récents progrès sont si rapides et profonds qu’ils transforment déjà son métier : il suffit désormais de décrire ce qu’on veut, et l’IA le réalise, souvent mieux qu’un humain. Les nouveaux modèles, comme GPT-5.3 Codex et Opus 4.6, sont capables de jugements et de créativité, et peuvent même s’auto-améliorer.

L’auteur insiste sur le fait que ce changement ne concerne pas que la tech : tous les métiers intellectuels sont concernés (droit, finance, médecine, écriture, service client, etc.), et l’impact se fera sentir dans les 1 à 5 ans, voire plus vite. Les IA progressent de façon exponentielle : ce qu’elles ne savent pas faire aujourd’hui, elles le feront bientôt.

Il met en garde contre l’illusion de sécurité : l’IA n’automatise pas une tâche, mais tout le travail cognitif. Même les métiers qui semblent protégés (jugement, créativité, empathie) commencent à être touchés. Il conseille de s’adapter rapidement : utiliser les meilleurs outils payants (1), expérimenter chaque jour, chercher à automatiser ses tâches, et ne pas sous-estimer la vitesse du changement.

Il recommande aussi de préparer sa situation financière, de privilégier les compétences difficiles à remplacer (relations humaines, présence physique, responsabilité légale), et d’enseigner à ses enfants (2) la curiosité et l’adaptabilité plutôt que de viser des carrières traditionnelles.

Enfin, il rappelle que l’IA représente à la fois une opportunité immense (accélération de la recherche, accès à la connaissance, réalisation de projets personnels) et un risque majeur (perte de contrôle, menaces sécuritaires).

Il conclut que ceux qui s’en sortiront le mieux seront ceux qui s’engagent dès maintenant, avec curiosité et urgence, car le futur est déjà là.

https://shumer.dev/something-big-is-happening

Notes

Perso j’aime l’idée de tester sur des models gratuits avec une solution comme Ollama, tester comparer modifier.
Ma fille a eu un cours sur le Machine Learning au college, ils apprennent aussi à utiliser les LLM avec des prompts clairs.

On‑device AI: Bringing Intelligence to the Edge

Fri, 13 Feb 2026 00:00:00 +0000

On‑device AI: Bringing Intelligence to the Edge

On‑device AI runs machine learning models directly on user devices—smartphones, wearables, IoT sensors, and edge gateways—rather than relying solely on cloud inference. As hardware accelerators, optimized runtimes, and efficient model techniques have matured, running intelligence locally has become practical and strategic for many products.

Why on‑device AI matters

Low latency: Local inference removes network round trips, enabling real‑time interactions such as augmented reality, live translation, and immediate camera effects.
Privacy by design: When data and inference stay on the device, products can reduce exposure of sensitive information and simplify compliance for biometric and health scenarios.
Offline reliability: Local models keep features functional without network connectivity, crucial for remote environments or spotty mobile coverage.
Lower bandwidth and cost: Fewer cloud requests reduce operational expenses and conserve user data usage.
Personalization: Models can adapt to individual behavior locally, enabling private, personalized experiences with fast feedback loops.

Key use cases

Mobile UX: Smart keyboards, smart watch, on‑device speech recognition, camera scene detection, and image enhancement.
Wearables & healthcare: Continuous monitoring, anomaly detection, and on‑device alerts while preserving patient privacy.
Industrial IoT: Real‑time fault detection and control where latency or connectivity constraints preclude cloud dependence.
AR/VR & robotics: Low‑latency perception and control for immersive and safety‑critical systems.
Smart home: Local automation and voice understanding without mandatory cloud access.

Technical enablers

Model compression: Techniques such as quantization, pruning, and weight sharing reduce size and compute cost.
Knowledge distillation: Large teacher models transfer knowledge to smaller student models optimized for edge devices.
Efficient architectures: Mobile‑first networks (e.g., MobileNet, EfficientNet‑lite) and edge‑tuned transformers trade parameters for latency.
Edge runtimes: TensorFlow Lite, Core ML, ONNX Runtime Mobile, and TVM provide graph optimizations, operator fusion, and hardware backends.
Hardware accelerators: NPUs, DSPs, and embedded GPUs dramatically reduce energy per inference on modern SoCs.
TinyML: Ultra‑low‑power inference on microcontrollers enables sensor‑triggered intelligence in constrained environments.
Federated learning & split inference: Decentralized training and hybrid pipelines keep raw data local while allowing global model improvements.

Challenges and tradeoffs

Accuracy vs. size: Compressing models can reduce accuracy; balancing task needs with resource budgets is essential.
Energy & thermal limits: Continuous or heavy inference affects battery and device temperature; use duty‑cycling and event‑driven inference.
Security: Protect models from tampering and extraction—use signed updates and secure enclaves where possible.
Lifecycle management: Updating models across a fragmented device fleet needs robust versioning and rollout strategies.
Device heterogeneity: Diverse hardware and OS capabilities expand testing surface and complicate optimizations.

Organizational considerations

Delivering on‑device features requires cross‑functional collaboration: ML engineers, embedded/firmware teams, product managers, and security/compliance stakeholders. Expect higher engineering effort up front and potentially lower ongoing cloud costs. Bring legal teams into the loop for regulated domains such as healthcare and finance.

Future outlook

Hardware will continue to improve (wider NPU availability and greater on‑chip memory), and software tooling will keep pushing capabilities to the edge. Advances in continual on‑device learning, better federated methods, and tighter hardware/software co‑design will expand the complexity of tasks that can run locally. The most likely future is hybrid: heavy training and model orchestration in the cloud, with fast, private, personalized inference on device.

Conclusion

On‑device AI reshapes product design beyond a technical optimization: it influences user experience, privacy posture, and operational cost. When implemented thoughtfully—balancing accuracy, latency, energy, and security—it unlocks resilient, private, and immediate experiences that were previously impractical.

Pros vs Cons

Pros	Cons
Low latency — enables real‑time UX	Limited model capacity compared to cloud-scale models
Privacy by design — sensitive data stays local	Higher device engineering and testing effort
Offline reliability	Battery and thermal constraints for sustained inference
Lower bandwidth and operational cost	Fragmentation across hardware and OS increases optimization complexity
Personalized, private experiences	Secure model updates and lifecycle management add operational overhead

The Adolescence of Technology

Sun, 01 Feb 2026 00:00:00 +0000

https://www.darioamodei.com/essay/the-adolescence-of-technology

Résumé en Français de l’essai de Dario Amodei

Cet essai examine les risques existentiels posés par les systèmes d’IA puissants, que Amodei définit comme une IA plus intelligente que les lauréats du prix Nobel dans la plupart des domaines, capable d’action autonome et évolutive jusqu’à des millions d’instances. Il soutient que l’humanité entre dans une “adolescence technologique” critique qui mettra à l’épreuve notre survie.

Cinq catégories principales de risques

Risques d’autonomie - Les systèmes d’IA peuvent développer des objectifs désalignés à travers des processus d’entraînement imprévisibles, cherchant potentiellement le pouvoir ou agissant de manière destructrice en raison d’états psychologiques étranges plutôt que de suivre les valeurs humaines.
Utilisation abusive pour la destruction - L’IA puissante pourrait permettre aux individus de créer des armes biologiques ou autres armes de destruction massive, brisant la corrélation entre capacité et motivation en donnant aux “solitaires perturbés” des capacités de niveau doctorat.
Utilisation abusive pour s’emparer du pouvoir - Les régimes autoritaires pourraient utiliser l’IA pour une surveillance totale, des armes autonomes et une domination mondiale, créant potentiellement un système totalitaire imbattable.
Perturbation économique - L’avancement rapide de l’IA peut causer un chômage de masse et une concentration extrême de richesse.
Effets indirects - Les changements technologiques rapides pourraient déstabiliser la société de manières imprévisibles.

Défenses proposées

Entraînement constitutionnel de l’IA pour inculquer des valeurs et un caractère robustes
Interprétabilité mécaniste pour diagnostiquer le comportement des modèles
Transparence et surveillance des systèmes d’IA
Coordination industrielle et réglementation gouvernementale (en commençant par les lois sur la transparence)
Garde-fous contre les armes biologiques et classificateurs
Coopération internationale sur les menaces existentielles

Amodei souligne l’importance d’éviter le “catastrophisme” tout en prenant les risques au sérieux, en mettant en œuvre des interventions chirurgicales et en maintenant l’espoir que l’humanité peut prévaloir grâce à une planification minutieuse et une action décisive.

Personal Coding Agent

Fri, 30 Jan 2026 00:00:00 +0000

HAL9000

Introduction

HAL9000 is a personal coding agent. It is a powerful tool that can help you write code faster and more efficiently.

HAL9000 is written in Go and is designed to be easy to use and understand.

It uses Ollama, an open-source project that provides a simple API for advanced language models.

Features

TUI with lipgloss
Ollama API integration for advanced language models (Qwen3)

Tools

My coding agent should be able to create files, directories, and execute commands.

I started with create_file tool. I tested with Bruno.

Kokoro TTS

Tue, 20 Jan 2026 00:00:00 +0000

Text To Speech

Technology that enables text to be converted into speech sounds imitative of the human voice.

Run locally

https://github.com/remsky/Kokoro-FastAPI

docker run -p 8880:8880 ghcr.io/remsky/kokoro-fastapi-cpu:latest

And you can play with web ui:

http://localhost:8880/web

n8n workflow with Kokoro

I want to hear Qwen answer 😊

First I tested kokoro API with Bruno.

And then I added it to a new n8n workflow.

I had to remove all special characters.

RAG n8n

Thu, 15 Jan 2026 00:00:00 +0000

RAG with n8n

Overview

This guide explains how to implement a RAG (Retrieval Augmented Generation) on your laptop.

Embedded AI
Data sovereignty

Before you start

What’s RAG

RAG (retrieval augmented generation) is a technology that improves the responses of generative AI models by feeding them with knowledge from internal databases.

What’s you need

Before you put the RAG in place, ensure you already have:

Docker
Ollama
md files

Installation

n8n

n8n is a workflow automation platform that gives technical teams the flexibility of code with the speed of no-code.

Run locally

docker volume create n8n_data
docker run -it --rm --name n8n -p 5678:5678 -v n8n_data:/home/node/.n8n docker.n8n.io/n8nio/n8n

Go to the web n8n Dashboard:

Qdrant

Qdrant (read: quadrant) is a vector similarity search engine and vector database. It provides a production-ready service with a convenient API to store, search, and manage points—vectors with an additional payload Qdrant is tailored to extended filtering support.

Run localy

docker volume create qdrant_data
docker run -p 6333:6333 -v qdrant_data:/qdrant/storage qdrant/qdrant

qdrant Dashboard

Ollama

Ollama is the easiest way to get up and running with large language models such as gpt-oss, Gemma 3, DeepSeek-R1, Qwen3 and more.

RAG Workflow

The RAG is composed in 2 workflows.

Data ingestion

It starts with the file submission trigger, to upload CVs (in markdown format).

We add Qdrant connector to store the files in the vector database. We need an embed model to split the files into vectors.

Emebed model: mxbai-embed-large

Qdrant collections

When the Data Ingestion workflow is executed, you can go to Qdrant dashboard to see the collections.

Chatbot

Now the CVs are in the Qdrant vector database, we can chat to request some informations about the candidate.

We start with the Chat trigger connected to an AI agent, with Qwen3 model.

We create the tool to be able to search in our Qdrant collection and we had a simple prompt.

🔥 And finaly we test our chat by asking informations about a candidate. We can see that the agent called qdrant to retrieve the data and generate a nice answer.

AI on Thomas

MCP pour les nuls - la suite

Mise en place d’une Flex gateway

Configuration de mon server MCP sur Anypoint

Policies pour mon serveur MCP

Appels du serveur MCP avec Bruno

Observabilité

MCP pour les nuls

MCP Kesako ?

Prototype du service MCP

Pour commencer

Serveur MCP Card Details

Configuration de Copilot

Utilisation du service

Prochaines étapes

Labor market impacts of AI

Résumé en français : Impact de l’IA sur le marché du travail

Points clés

Méthodologie

Liens sur des suppressions d’emplois à cause de l’IA

The 2028 Global Intelligence Crisis

Publié par Citrini Research

1. Le “Cercle Vicieux de l’Intelligence”

2. Le concept de “PIB Fantôme” (Ghost GDP)

3. La crise du SaaS (Software as a Service)

4. Risque systémique et financier

5. Conclusion du rapport

Pour résumer

Matt Shumer blog post

Matt Shumer

Notes

On‑device AI: Bringing Intelligence to the Edge

On‑device AI: Bringing Intelligence to the Edge

Why on‑device AI matters

Key use cases

Technical enablers

Challenges and tradeoffs

Organizational considerations

Future outlook

Conclusion

Pros vs Cons

Links

The Adolescence of Technology

Résumé en Français de l’essai de Dario Amodei

Cinq catégories principales de risques

Défenses proposées

Personal Coding Agent

HAL9000

Introduction

Features

Tools

Kokoro TTS

Text To Speech

Run locally

n8n workflow with Kokoro

RAG n8n

RAG with n8n

Overview

Before you start

What’s RAG

What’s you need

Installation

n8n

Qdrant

Ollama

RAG Workflow

Data ingestion

Qdrant collections

Chatbot

See also

SML (Small Language Model)

Links