Les détecteurs d'IA ont récemment fait sourciller en affirmant que la Constitution américaine a été écrite par une intelligence artificielle en 1787.

Les détecteurs d'IA ont récemment fait sourciller en affirmant que la Constitution américaine a été
écrite par une intelligence artificielle en 1787. Bien que cette affirmation soit clairement fausse, elle met en évidence
un problème préoccupant: la fiabilité des détecteurs d'IA pour identifier correctement le contenu généré par l'IA laisse
beaucoup à désirer.

Le cœur du problème réside dans les méthodes utilisées par ces détecteurs. Ils utilisent
de grands modèles de langage comme ChatGPT, entraînés sur de vastes quantités de textes écrits par des humains et générés par l'IA,
pour déterminer la probabilité qu'un texte ait été rédigé par un humain ou par une
IA. Deux mesures clés sont utilisées: la « perplexité » et la « burstiness ».

Langage formel = contenu IA ?
La perplexité mesure dans quelle mesure un texte correspond à ce que le modèle d'IA a appris pendant l'
entraînement. Elle peut identifier avec précision le contenu généré par l'IA qui ressemble étroitement aux
données d'entraînement.

Bien que tout cela soit bel et bon, cela pose problème lorsqu'il s'agit de langage formel,
comme la Constitution américaine.

La burstiness, en revanche, évalue la variabilité de la longueur et de la structure des phrases.
Le contenu généré par l'IA présente souvent plus d'uniformité — une déviation par rapport à l'écriture humaine
qui tend à varier en longueur.

Cependant, ces mesures ont leurs limites. Les rédacteurs humains compétents peuvent produire
du contenu à faible perplexité, imitant le style généré par l'IA. De même, les modèles d'IA
deviennent de plus en plus semblables à l'écriture humaine, rendant la burstiness un discriminateur peu fiable.

Faux positifs trop élevés
Des études ont montré que les détecteurs d'écriture IA sont loin d'être infaillibles et ne fonctionnent que
légèrement mieux que des classificateurs aléatoires. Ils retournent fréquemment des faux positifs, entraînant
des jugements erronés et des accusations injustes contre les étudiants et les rédacteurs.
De plus, ces détecteurs peuvent être facilement contournés par des attaques de paraphrase, ce qui compromet davantage
leur précision.

Face à ces préoccupations, certains éducateurs adoptent des outils d'IA comme ChatGPT pour soutenir
l'apprentissage, reconnaissant que les détecteurs existants sont inadéquats pour détecter
précisément le contenu généré par l'IA.

Inverser la détection
En réponse, un créateur de détecteur d'IA prévoit de se détourner de la détection de l'IA
pour plutôt mettre en avant la touche humaine dans la création de contenu. Leur objectif est d'aider
les enseignants et les étudiants à naviguer dans le paysage évolutif du rôle de l'IA dans l'éducation.
Le défi de la détection d'écriture IA est également compliqué par des biais potentiels contre les
locuteurs non natifs de l'anglais, ce qui entraîne des taux de faux positifs plus élevés dans leur travail.
À mesure que l'IA progresse, la nécessité de solides garde-fous contre la désinformation et
la reconnaissance appropriée de l'implication de l'IA dans la création de contenu devient
de plus en plus évidente.
Les lacunes des détecteurs d'IA existants soulignent l'urgence de développer des
systèmes de détection plus précis et fiables. En attendant que de tels systèmes soient en place, il est crucial
d'aborder la détection de contenu généré par l'IA avec prudence, en tenant compte du coût personnel des
fausses accusations.