Glossaire
Multimodal
Une IA multimodale comprend et produit plus que du texte : elle analyse des photos, lit des documents, écoute, parle et génère souvent des images. Les grands assistants (ChatGPT, Claude, Gemini, Le Chat) sont tous multimodaux aujourd'hui.
« Modal » est simplement le terme académique pour « type d’entrée » : texte, images, audio, vidéo. Un modèle multimodal en gère plusieurs à la fois, ce qui a transformé l’usage quotidien de l’IA : le clavier n’est plus la seule porte d’entrée.
Concrètement : photographiez l’écran d’erreur de votre chaudière et demandez « que signifie E04 et puis-je le régler moi-même ? ». Prenez en photo une recette manuscrite de votre grand-mère et faites-la retranscrire et adapter pour deux personnes. Pointez l’appareil photo vers un formulaire en langue étrangère. Chargez un contrat de 30 pages et demandez où se trouve la clause de résiliation. Chacune de ces actions, c’est la multimodalité qui vous épargne une saisie que vous n’auriez jamais faite.
Une mise en garde utile : la vision est performante, pas infaillible. Les modèles se trompent plus souvent sur les petits caractères, l’écriture manuscrite et les tableaux complexes que sur du texte propre. Pour les chiffres importants, vérifiez toujours sur l’original.
Où vous allez le rencontrer
L’icône trombone/photo dans ChatGPT, Claude et Gemini ; la caméra dans leurs applications mobiles ; le mode vocal et la génération d’images sont également des formes de multimodalité. Les capacités varient d’une application à l’autre, et notre outil de choix d’IA les met en regard de ce dont vous avez réellement besoin.
Dans le contexte européen, il vaut la peine de noter que Mistral AI, entreprise française, propose Le Chat, un assistant multimodal soumis au droit français et au RGPD, supervisé par la CNIL. Pour les organisations qui traitent des données sensibles, cela peut peser dans le choix de l’outil. Le règlement européen sur l’IA (AI Act) impose par ailleurs des obligations de transparence aux systèmes multimodaux à usage général classés à haut risque.