Quelques bases pour débuter avec les outils d’intelligence artificielle

Les outils d’intelligence artificielle générative, tels que les agents conversationnels comme ChatGPT, ont un impact croissant sur le milieu universitaire et suscitent des réflexions sur leur place dans l’enseignement universitaire. Dans la foulée de ces réflexions, cette page et les suivantes souhaitent offrir des repères au personnel enseignant de l’UQAM, pour favoriser la prise en charge et l’encadrement éclairé de ces outils puissants et en évolution rapide. 

Ces repères prennent appui sur les pratiques adoptées dans plusieurs départements de l’UQAM. Les équipes du Carrefour et du Service des bibliothèques suivent de près les développements concernant l’usage de ces technologies afin de soutenir  les personnes enseignantes dans leurs besoins. Nous vous invitons à suivre les avancées pédagogiques dans le domaine, qui sont régulièrement mises à jour par nos équipes. 

Définitions

L’intelligence artificielle repose sur un ensemble de théories et de techniques dont l’intention est de permettre à des machines de simuler l’intelligence humaine (Larousse ; Educause, 2017). Le terme est introduit pour la première fois en 1956, par John McCarthy, à la Conférence de Dartmouth.

L’IA se construit sur deux procédés informatiques : l’apprentissage automatique et l’apprentissage en profondeur. Le premier s’appuie sur les algorithmes et permet à la machine d’apprendre à l’aide des données qui lui sont accessibles ou fournies. Le second permet à la machine d’apprendre de ces apprentissages, par un réseau complexe qui se nourrit de métadonnées, elles-mêmes générées par la machine (Le Digitalab).

Quant à l’IA générative, elle repose sur les grands modèles de langage. Un modèle de langage est un modèle statistique qui distribue les symboles distincts (lettres, phonèmes, mots) d’une langue déterminée afin de prédire le mot suivant dans une séquence de mots (Y. Bengio, 2008). Les grands modèles de langage se sont entraînés sur des quantités astronomiques de données. Si au départ, la génération de contenus de manière “nouvelle” était plutôt textuelle, elle est vite devenue images, musique, vidéos, sons, etc.

Nous vous invitons à consulter la section 1.1 (p. 30 du PDF).du Rapport sur l’intelligence artificielle générative en enseignement supérieur : enjeux pédagogiques et éthiques (CSE-CEST, 2024, p. 8) pour approfondir ces notions.

Développer sa littératie

Le développement de notre littératie à l’égard de l’IA est important. La connaissance et la maîtrise de base de l’objet d’échange entre vous et la machine favoriseront une utilisation plus juste, des choix pédagogiques plus adéquats et une meilleure adaptation des outils. En ce sens, l’UQAM est consciente de son rôle d’accompagnement dans la familiarisation avec les outils. Pour cela, divers services et organismes internes, dont le Carrefour et les bibliothèques, offrent du soutien et des formations pour développer les compétences et la littératie numérique. Vous retrouverez, tout au long de cette page, des ressources non exhaustives (guides, formations, pages internet, etc.) pour vous nourrir.

Quelques notions de base à considérer

Mésinformation et baratin : Les systèmes d’IA génératifs peuvent répondre avec assurance, sans se préoccuper de la vérité, en fournissant des réponses qui peuvent vous sembler plausibles. Adoptez une approche sceptique et critique face aux contenus.

Hallucinations des systèmes d’IA : Les systèmes d’IA n’indiquent pas nécessairement qu’ils ne peuvent pas toujours répondre à la question, et certaines réponses générées ne sont pas directement basées sur les données d’entraînement de systèmes d’IA génératifs. Vérifiez la réponse avec une source fiable.

Biais algorithmiques : Le corpus de données utilisé pour entraîner les systèmes d’IA génératifs peuvent contenir des biais, qu’ils soient implicites ou explicites. Veillez à prendre en compte la diversité des opinions lors de votre exploration d’un sujet.

Biais d’automatisation : Propension à surévaluer et à accepter sans réserve les réponses et informations par les systèmes d’IA génératifs.

Confidentialité des données : Les données sensibles ou confidentielles entrées dans les systèmes d’IA génératifs pourraient potentiellement servir à l’entraînement de versions ultérieures. Veuillez respecter la confidentialité, la propriété intellectuelle et les droits d’auteur des informations partagées.

Anthropomorphisme : Tendance à attribuer des caractéristiques, émotions, ou comportements humains aux sytèmes d’IA génératifs parce que ses réponses sont bien rédigées entre autres. (Effet ELIZA)

Impact environnemental : L’entraînement de systèmes d’IA engendre une consommation élevée d’énergie et une importante empreinte carbone.

Prompt, invite ou requête : Instruction envoyée en langage naturel à un outil système d’IA pour générer du contenu (texte, images, vidéo, son, code).

Lexique

Toutes les définitions du glossaire sont tirées du Rapport de recherche Un an après l’arrivée de ChatGPT : réflexions de l’Obvia sur les enjeux et pistes d’action possibles face à l’IA générative (Obvia, 2024), ou traduite du glossaire d’une publication du Ada Lovelace Institute (Jones, 2023), à l’exception des termes « apprentissage automatique », « Apprentissage profond » et « Apprentissage supervisé » qui proviennent du Stanford Institute for Human-Centered AI (Manning, 2022), ainsi qu’« Intelligence artificielle » qui correspond à la nouvelle définition de l’OCDE (2023).

IA

Intelligence artificielle (IA)/système d’intelligence artificielle (SIA)

« Un système d’intelligence artificielle (ou système d’IA) est un système automatisé qui, pour des objectifs explicites ou implicites, déduit, à partir d’entrées reçues, comment générer des résultats en sortie tels que des prévisions, des contenus, des recommandations ou des décisions qui peuvent influer sur des environnements physiques ou virtuels. Différents systèmes d’IA présentent des degrés variables d’autonomie et d’adaptabilité après déploiement. » (OCDE, 2023).

IA à usage général/general purpose AI (GPAI) 

Le parlement européen définit un système d’IA à usage général comme étant « un système d’IA qui peut être utilisé et adapté à un large éventail d’applications pour lesquelles il n’a pas été intentionnellement et spécifiquement conçu » (2023). Ce terme est souvent utilisé de manière interchangeable avec « modèles de fondation ».

Intelligence artificielle générale/artificial general intelligence (AGI) 

Systèmes qui démontrent de vastes capacités d’intelligence (égales ou supérieures au niveau humain), incluant le raisonnement, la planification et la capacité à apprendre par l’expérience. À noter que ce terme fait référence à une forme d’IA qui n’existe pas actuellement, bien que plusieurs entreprises poursuivent l’objectif de développer de tels systèmes.

IA générative 

IA générative : Type de système d’IA pouvant créer une grande variété de données et de documents, telles que des images, des vidéos, du son, du texte et des modèles 3D.


Apprentissage

Apprentissage automatique/machine learning 

Branche de l’IA étudiant la manière dont les systèmes informatiques peuvent améliorer leur perception, leurs connaissances, leurs décisions ou leurs actions sur la base de l’expérience ou des données.

Apprentissage profond/deep learning 

Forme avancée d’apprentissage automatique (Machine Learning) utilisant de grands réseaux neuronaux (artificiels) multicouches qui calculent avec des représentations continues (nombres réels), de manière semblable aux neurones organisés hiérarchiquement dans le cerveau humain.

Apprentissage supervisé/supervised learning:

Forme d’apprentissage automatique où l’ordinateur apprend à faire des prédictions à partir de données préalablement étiquetées, c’est-à-dire catégorisées, par l’être humain.


Modèles

Modèles multimodaux/IA générative multimodale 

Modèles en mesure de produire des résultats dans plusieurs modalités (texte, image, audio, etc.) ET de recevoir des requêtes (prompts) provenant de ces différentes modalités.

Modèles Transformers

Type d’architecture de réseau neuronal pouvant suivre les relations dans les données séquentielles et étant à la base de la plupart des modèles de fondation actuels.

Grands modèles de langage/Large language models (LLMs) 

Type de système d’IA entraîné sur de vastes quantités de données textuelles et capable de générer des réponses en langage naturel à un large éventail d’entrées.

Modèles de fondation/foundation models

Type de réseau neuronal d’IA entraîné sur de vastes données à grande échelle et pouvant être adapté à un large éventail de tâches et servant de base pour une multitude d’applications d’IA, y compris l’IA générative. Ce terme est souvent utilisé de manière interchangeable avec « IA à usage général (GPAI) ».


Sources

  • Marchildon, A., Boine, C., Sabourin Laflamme, A., Anctil, D., Boudreau LeBlanc, A., Auclair, S., Balagué, C., Morin-Bertrand, F.-A., Castets-Renard, C., Jackson, P., & Langlois, L. (2024). Un an après l’arrivée de ChatGPT : réflexions de l’Obvia sur les enjeux et pistes d’action possibles face à l’IA générative. Obvia. https://doi.org/10.61737/ZKWZ3721