Aller au contenu principal
Kammi

Lexique Intelligence Artificielle

Comprendre le vocabulaire de l'IA : LLM, RAG, agents, embeddings et autres termes techniques de l'intelligence artificielle appliquée aux RH et aux entreprises.

50 définitions

A

Agent IA

Programme d'intelligence artificielle capable d'agir de manière autonome pour accomplir des tâches complexes. Contrairement à un simple chatbot, un agent peut planifier, utiliser des outils externes, naviguer sur le web et prendre des décisions en plusieurs étapes.

Agentic AI

Approche de l'IA où les modèles de langage sont dotés de capacités d'action autonome : recherche d'information, exécution de code, appels d'API. L'IA devient un agent capable d'accomplir des workflows complets plutôt que de simplement répondre à des questions.

API (dans le contexte IA)

Interface permettant d'accéder aux capacités d'un modèle d'IA depuis une application. Les fournisseurs comme OpenAI, Anthropic ou Mistral proposent des API pour intégrer leurs modèles dans des produits tiers.

Voir aussi :LLMToken

Apprentissage automatique

Branche de l'intelligence artificielle où les algorithmes apprennent à partir de données sans être explicitement programmés. Inclut l'apprentissage supervisé, non supervisé et par renforcement.

B

Biais algorithmique

Distorsion systématique dans les résultats d'un algorithme d'IA, souvent due à des données d'entraînement non représentatives. En RH, peut conduire à des discriminations dans le recrutement ou l'évaluation.

C

Chain of Thought (CoT)

Technique de prompting incitant le modèle à détailler son raisonnement étape par étape avant de donner sa réponse finale. Améliore significativement les performances sur les tâches de logique et de calcul.

Voir aussi :PromptPrompting

Chatbot

Agent conversationnel automatisé capable de dialoguer avec des utilisateurs en langage naturel. Les chatbots modernes basés sur les LLM peuvent comprendre le contexte et générer des réponses pertinentes.

Voir aussi :LLMAgent IA

Claude

Famille de modèles de langage développés par Anthropic, connus pour leur approche centrée sur la sécurité et l'utilité. Utilisé pour l'assistance, l'analyse de documents et la génération de contenu.

Complétion

Processus par lequel un LLM génère du texte pour compléter une entrée (prompt). Le modèle prédit les tokens les plus probables pour poursuivre le texte de manière cohérente.

Context window

Quantité maximale de texte (en tokens) qu'un modèle peut traiter en une seule requête. Les modèles récents ont des fenêtres de contexte allant de 8K à plus de 200K tokens, permettant d'analyser de longs documents.

Voir aussi :TokenRAG
D

Deep learning

Sous-domaine du machine learning utilisant des réseaux de neurones artificiels à plusieurs couches. Technologie à la base des avancées récentes en reconnaissance d'image, traduction et génération de texte.

E

Embedding

Représentation numérique d'un texte sous forme de vecteur de nombres. Les embeddings capturent le sens sémantique et permettent de calculer la similarité entre textes, essentiel pour la recherche sémantique et le RAG.

F

Few-shot learning

Technique où l'on fournit quelques exemples dans le prompt pour guider le modèle sur le format ou le style de réponse attendu. Permet d'adapter le comportement du LLM sans réentraînement.

Fine-tuning

Processus d'adaptation d'un modèle pré-entraîné à une tâche spécifique en le réentraînant sur un jeu de données ciblé. Permet de spécialiser un LLM pour un domaine métier particulier.

G

GPT

Generative Pre-trained Transformer. Architecture de modèle de langage développée par OpenAI, à la base de ChatGPT. Le terme désigne aussi la famille de modèles (GPT-3.5, GPT-4, GPT-4o).

Grounding

Technique visant à ancrer les réponses de l'IA dans des sources fiables et vérifiables. Le RAG est une forme de grounding qui connecte le LLM à une base de connaissances.

Voir aussi :RAGHallucination
H

Hallucination

Génération par l'IA d'informations fausses ou inventées présentées avec assurance. Les LLM peuvent produire des faits inexacts, des citations fictives ou des références inexistantes. Le RAG aide à réduire ce phénomène.

I

IA conversationnelle

Systèmes d'intelligence artificielle capables de dialoguer naturellement avec les humains. Utilisée pour les assistants virtuels, le support client automatisé et les chatbots RH.

Voir aussi :ChatbotLLMNLP

IA générative

Branche de l'IA capable de créer du contenu original : texte, images, code, musique. Les LLM comme GPT et Claude sont des IA génératives textuelles.

Voir aussi :LLMComplétion

IA responsable

Approche du développement et déploiement de l'IA intégrant des considérations éthiques : transparence, équité, respect de la vie privée, contrôle humain et minimisation des biais.

Inférence

Phase d'utilisation d'un modèle d'IA entraîné pour faire des prédictions ou générer des réponses. Contrairement à l'entraînement, l'inférence utilise le modèle sans le modifier.

Voir aussi :LLMTokenLatence
L

Latence

Temps de réponse d'un système d'IA entre la réception d'une requête et la génération de la réponse. Un facteur critique pour l'expérience utilisateur des applications conversationnelles.

LLM (Large Language Model)

Grand modèle de langage, réseau de neurones entraîné sur d'immenses corpus de texte pour comprendre et générer du langage naturel. Exemples : GPT-4, Claude, Mistral, Llama.

LLM local

Modèle de langage exécuté localement sur son propre serveur ou ordinateur, sans appel à une API externe. Permet de garder les données en interne et de réduire les coûts. Exemples : Llama, Mistral via Ollama.

M

MCP (Model Context Protocol)

Protocole standardisé permettant aux applications d'IA de se connecter à des sources de données externes de manière sécurisée. Facilite l'intégration des LLM avec les systèmes d'information existants.

Mistral

Entreprise française d'IA et ses modèles de langage open source. Mistral propose des modèles performants et efficaces, souvent utilisés pour des déploiements locaux ou européens.

Modèle de fondation

Grand modèle d'IA pré-entraîné sur des données massives, servant de base pour de nombreuses applications. Les LLM comme GPT-4 ou Claude sont des modèles de fondation pour le traitement du langage.

Multimodal

Capacité d'un modèle d'IA à traiter plusieurs types de données : texte, images, audio, vidéo. Les modèles multimodaux peuvent analyser des documents scannés, décrire des images ou transcrire de l'audio.

N

NLP (Natural Language Processing)

Traitement automatique du langage naturel. Domaine de l'IA permettant aux machines de comprendre, interpréter et générer du langage humain. Inclut la traduction, l'analyse de sentiment, l'extraction d'entités.

O

Ollama

Outil open source permettant d'exécuter facilement des LLM en local sur son ordinateur ou serveur. Supporte de nombreux modèles (Llama, Mistral, etc.) et simplifie leur déploiement.

Open source (IA)

Modèles d'IA dont les poids et parfois le code d'entraînement sont publiquement disponibles. Permet aux entreprises de les déployer en interne. Exemples : Llama (Meta), Mistral, Falcon.

Voir aussi :LLM localOllama

OpenAI

Entreprise américaine créatrice de ChatGPT et des modèles GPT. Pionnière de l'IA générative grand public et principale force motrice de la démocratisation des LLM.

Voir aussi :GPTLLMSite OpenAI

Orchestration

Coordination de plusieurs composants IA (LLM, outils, bases de données) pour accomplir des tâches complexes. Les frameworks comme LangChain ou les agents IA utilisent l'orchestration pour enchaîner les actions.

P

Prompt

Instruction ou question envoyée à un modèle d'IA pour obtenir une réponse. La qualité du prompt influence directement la pertinence de la réponse générée.

Prompting

Art et technique de formuler des instructions efficaces pour les LLM. Inclut le zero-shot, few-shot, chain of thought et d'autres méthodes pour optimiser les réponses.

R

RAG (Retrieval-Augmented Generation)

Architecture combinant recherche documentaire et génération de texte. Le système recherche d'abord les informations pertinentes dans une base de connaissances, puis les fournit au LLM pour générer une réponse contextualisée et sourcée.

Recherche sémantique

Recherche basée sur le sens plutôt que sur les mots-clés exacts. Utilise les embeddings pour trouver des documents conceptuellement similaires à la requête, même sans correspondance lexicale.

Réseau de neurones

Architecture informatique inspirée du cerveau humain, composée de couches de neurones artificiels interconnectés. Base technique du deep learning et des LLM modernes.

S

SLM (Small Language Model)

Modèle de langage de taille réduite, optimisé pour des tâches spécifiques ou des déploiements sur des ressources limitées. Plus rapide et économique que les grands LLM pour certains cas d'usage.

Voir aussi :LLMLLM local

Streaming

Technique d'affichage progressif des réponses de l'IA, token par token, au fur et à mesure de leur génération. Améliore l'expérience utilisateur en réduisant le temps d'attente perçu.

Voir aussi :TokenLatence

System prompt

Instructions initiales définissant le comportement, le ton et les contraintes d'un assistant IA. Le system prompt configure le contexte et les règles que le modèle doit suivre dans ses réponses.

Voir aussi :PromptPrompting
T

Température

Paramètre contrôlant le caractère aléatoire des réponses d'un LLM. Une température basse (0) produit des réponses déterministes et factuelles, une température élevée génère des réponses plus créatives et variées.

Voir aussi :LLMInférence

Token

Unité de base du traitement de texte par les LLM. Un token représente généralement un mot ou une partie de mot (3-4 caractères en moyenne). La tarification des API et les limites de contexte sont exprimées en tokens.

Voir aussi :Context windowLLM

Tool use

Capacité d'un LLM à appeler des outils externes (calculatrice, recherche web, API, base de données) pour accomplir des tâches qu'il ne peut pas réaliser seul. Fondement des agents IA.

Transformer

Architecture de réseau de neurones introduite en 2017, à la base de tous les LLM modernes. Utilise le mécanisme d'attention pour traiter efficacement les séquences de texte.

V

Vectorisation

Processus de conversion de données (texte, images) en vecteurs numériques. Étape essentielle pour stocker et rechercher des documents dans une base vectorielle utilisée par le RAG.

Vision par ordinateur

Domaine de l'IA permettant aux machines d'interpréter et analyser des images et vidéos. Les modèles multimodaux intègrent cette capacité pour l'analyse de documents, OCR et description d'images.

W

Workflow IA

Séquence automatisée d'actions impliquant un ou plusieurs modèles d'IA. Peut inclure la classification de documents, l'extraction d'informations, la génération de réponses et l'exécution d'actions.

Wrapper

Couche logicielle qui encapsule un LLM pour y ajouter des fonctionnalités : gestion du contexte, intégration d'outils, interface utilisateur, logging. Beaucoup d'applications IA sont des wrappers autour de modèles existants.

Z

Zero-shot

Capacité d'un modèle à accomplir une tâche sans exemple préalable, uniquement à partir des instructions. Les LLM modernes excellent en zero-shot grâce à leur vaste entraînement.

Découvrez aussi nos autres lexiques

L'IA au service de vos RH

Découvrez comment Kammi intègre l'intelligence artificielle pour simplifier votre gestion RH.

Demander une démo