Apprendre les TCC

Découvrir les Thérapies Comportementales, Cognitives et Emotionnelles

L'Intelligence Artificielle pour la supervision thérapeutique

Il y a mille et une façons d'envisager la manière dont l'intelligence artificielle (I.A.) peut contribuer à accompagner les psys dans leurs suivis thérapeutiques et les aider à faire face à leurs difficultés.
Il va sans dire que cela pose des myriades de questions éthiques, juridiques, pratiques et qu'il est impératif que tout le monde se saississe des enjeux. Quoi de mieux pour peser justement les enjeux concrets que de tester (sur des données fictives) ?

Les enregistrements de séance : une mine d'or

Depuis la crise du COVID-19, de très nombreux psys pratiquent les séances en distanciel, ce qui facilite notamment l'enregistrement des séances à des fins thérapeutiques (c'est très éclairant pour les patients de revoir la vidéo avant la séance suivante). Ces enregistrements sont des mines d'or d'informations dont une grande partie nous échappe de part notre capacité d'attention limitée et par manque de temps pour revoir nous-même les séances.

Choisir un modèle d'I.A. avec les bonnes capacités

La première difficulté consiste à trouver un modèle d'I.A. qui dispose des capacités requises pour nous aider.

La taille de la fenêtre de contexte

En premier lieu ce modèle doit disposer d'une "fenêtre de contexte" (context window) suffisamment longue pour garder en mémoire l'intégralité du texte retranscrit ainsi que les questions que nous allons lui poser, ainsi que les réponses qu'il va formuler au cours de la conversation. Si cette taille est trop petite, l'I.A. va oublier les informations les plus anciennes de la conversation.

La "fenêtre de contexte" d'une IA désigne la quantité de données (texte, images, audio, vidéos ou autres données) que l'IA peut considérer à un moment donné lorsqu'elle traite ou génère du langage. (l'équivalent d'une mémoire immédiate).

Plus cette fenêtre est grande, plus l'IA peut prendre en compte d'informations passées pour comprendre le sens du contenu actuel et prédire ce qui vient ensuite. Cela lui permet de créer des réponses plus cohérentes et contextuellement appropriées.

Le texte d'une séance typique de TCC varie entre 10000 et 15000 "tokens".

Les "tokens" (ou jetons) sont des unités de texte plus petites qu'un mot (un peu comme des syllabes) sur lesquelles les I.A. raisonnent.

Au début de 2024, il y a encore de nombreux modèles d'I.A., notamment les version gratuites qui ont une taille de contexte de moins de 10000 tokens, trop petit donc pour faire analyser une séance de façon simple.
Chaque I.A. dispose également d'une taille maximale de réponse à une question donnée, c'est aussi un paramètre à prendre en compte selon le type de réponse et traitement que l'on souhaite effectuer.

Les capacités multimodales

A la base, les I.A. connues comme Chat GPT ou Claude sont des

"Large Language Models (LLM)", c'est-à-dire des I.A. de plusieurs dizaines de milliards de neurones artificiels entraînées sur de vastes quantités de texte.

A présent de plus en plus d'I.A. sont également entraînées sur des images, de l'audio, des vidéos en plus du texte et offrent ainsi des capacités multimodales. Cela peut être très précieux dans le cadre d'une thérapie pour analyser le non verbal et voir les concordances ou discordances entre ce que la personne dit et ce que son corps dit.

La taille de la fenêtre de contexte d'une I.A. devient encore plus cruciale dès qu'elle doit traiter des données telles que de l'audio ou de la vidéos, modalités très gourmandes en données.

La qualité des inférences (raisonnement)

Evidemment, il nous faut également une I.A. en mesure d'effectuer des raisonnements de qualité (le terme informatique est inférence). De nombreux facteurs influent sur la capacité de raisonnement d'une I.A. : d'une part sa structure interne (la constitution du réseau de neurones artificiels) et d'autre part le temps alloué au processus de réflexion, souvent limité pour des questions d'économies de ressources (la quantité de calculs informatique se chiffrant en dizaines de miliards d'opérations à chaque requête). Concrètement, une I.A. qu'on laisse "réfléchir" (calculer) pendant une minute donnera de meilleurs résultat que la même I.A. forcée à répondre en 30 secondes (comme pour les psys...).

L'accès à la température...

La température est un paramètre technique qui influe sur la manière dont une I.A. générative va opérer son choix parmi les tokens qui lui semblent les plus probables pour une réponse adéquate.

Elle peut soit toujours sélectionner le token le plus probable si on lui donne une température basse, soit sélectionner d'autres moins probables et donc donner une réponse plus créative si la température est haute. Un température haute est pertinente pour des réponses créatives comme pour faire un brainstorming ou écrire un poème. Une température basse est préférable pour des approches plus scientifiques. La plupart des interfaces grand public ne donnent pas accès à ce paramètre.

Le coût...

D'une I.A. à l'autre les coûts ne sont pas calculés de la même façon et l'analyse d'une séance peut avoir un coût variant de 0 (c'est le cas ici) à quelques dizaines d'euros selon le modèle d'I.A. choisi et le modèle économique de la société éditrice de l'I.A. Certaines facturent un abonnement et limitent le nombre de questions par heure, d'autres facturent au Token de texte soumis et au Token de texte généré par l'I.A.. Par ailleurs le coût peut varier selon que l'on passe par l'interface grand public ou bien via une "API" destinée à interagir avec des logiciels tiers.

Il y a de plus en plus de modèles d'I.A. Open Source qui peuvent fonctionner directement sur nos équipements individuels (ordinateur, smartphone) et cette tendance va s'acccentuer. Le coût devrait donc devenir marginal à terme.

I.A. généraliste ou I.A. spécialisée ?

Bien qu'on en soit encore aux balbutiements, il existe déjà des modèles d'I.A. spécialisées dans le champ médical (comme Med-Gemini) et celles-ci offrent déjà des résultats supérieurs à la plupart des professionnels de santé sur certaines tâches. Ces modèles ne sont toutefois pas accessible au tout venant et sont en phase de test intensif auprès de professionnels choisis.
Les I.A. généralistes, pour peu que l'on sache les utiliser correctement en leur donnant le bon contexte et les bons "Prompts" (questions), sont néanmoins déjà très performantes comme nous allons le voir ici.

Démonstration sur une séance retranscrite intégralement

L'entretien avec Julie DupontPour illustrer une façon possible d'utiliser l'IA, avons choisi de partir d'un exemple concret : la première séance de psychothérapie avec la patiente fictive "Julie Dupont". Bien que des capacités d'analyse de vidéo soient déjà en partie disponibles, nous allons pour l'instant partir de la retranscription textuelle de la séance pour soumettre à l'I.A. différentes questions. La retranscription de l'entretien à partir de la vidéo a été réalisée par le modèle d'I.A. "Whisper" d'OpenAI en décembre 2023. La diarisation (le rattachement de chaque propos à un interlocuteur) a ensuite été faite à l'aide de Chat GPT 4 et relu/corrigé à la main, ce qui reste fastidieux mais ne sera plus nécessaire dans un avenir proche.

Le texte diarisé de la séance (juste le début) :

Le texte diarisé de la séance de psychothérapie
Vous pouvez télécharger la retranscription pour faire vos propres analyses.
Télécharger le fichier texte ou Télécharger le fichier PDF

Avant de passer aux exemples de questions posées à l'I.A. dans une optique de supervision et d'aide dans notre prise en charge, je vous invite à prendre le temps de réfléchir et mettre par écrit toutes les questions que vous aimeriez pouvoir poser concernant l'analyse d'une séance avec vos propres patients.

Passons à présent à l'analyse de la séance de psychothérapie de Julie par l'Intelligence Artificielle.

Vos suggestions pour améliorer cette page

Merci d'être constructif, ce site est un projet perso d'étudiant, fait avec passion mais peu de moyens !

Pour vous informer de la suite donnée à votre suggestion, promis votre e-mail restera confidentiel !

origin

Anti-spam :

* champs obligatoires

En application de la loi n° 78-17 du 06 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art. 26i), d'accès (art. 34 à 38) et de rectification (art. 36) des données vous concernant. Pour cela, contactez-nous

Haut de page