Découverte de certains principes de l’intelligence artificielle au travers d’un système RAG (Retrieval-Augmented Generation)
Public concerné 
- BTS Services Informatiques aux Organisations
Matière 
- Bloc 1 – Support et mise à disposition de services informatique
Présentation 
L’objectif de cette production est d’aborder certains concepts de l’intelligence artificielle à travers un système IA RAG (Retrieval-Augmented Generation), un modèle hybride combinant un mécanisme de recherche d’information et une génération de texte.
Une première IA analysera une base de documents (ici le texte du RGPD) afin de la vectoriser. Une deuxième IA sera chargée de formuler une réponse à partir des vecteurs trouvés par le SGBD vectoriel Chroma.
Une initiation aux bases de données vectorielles est également proposée.
Contenu :
- Fiche de présentation des éléments théoriques nécessaires à la réalisation des activités
- Activité 1 : découverte d’une base de données vectorielle à travers un script Python
- Activité 2 : découverte d’un système RAG complet à partir d’un code source Python rédigé par Yves Rougy
Pré-requis 
- Commandes de base d’administration d’un système Linux Debian
- Bases Python
Savoirs 
- Système RAG
- Modèles de représentation vectorielle (embedding)
- Bases de données vectorielles
- Modèles de langage
Compétences 
- Bloc 1 / compétence 6 : « Organiser son développement professionnel »
- Veille technologique
- Transversalité CEJMA (RGPD)
Outils 
- Linux Debian 13
- Python3
- Modèle d’embedding BGE-M3
- Modèle de langage Llama
Téléchargements 
Mots-clés ﹟
Intelligence artificielle, base de données vectorielle, LLM, RAG, modèle d’embedding, modèle de langage
Durée 
Entre 2 et 3 heures
Version 
v1.0
Date de publication 
Mai 2026
Auteur.e(s) 
Pacôme MASSOL avec les tests et la relecture d’Apollonie Raffalli
