Détection IA : les détecteurs sont-ils fiables ?

9 décembre 2024

En moins de 2 ans, la génération de texte à l’aide d’une intelligence artificielle à modifié la façon de travailler de beaucoup de personnes : marketeurs de contenu, copywriter, enseignants, étudiants…

Pour différentes raisons (principalement académique ou business) nous souhaitons parfois savoir connaître l’auteur d’un texte : un humain ou une intelligence artificielle. Pour résoudre ce problème, de nombreux outils de détection IA ont vu le jour.
Sont-ils fiables ? Peut-on leur faire confiance ?
Pour répondre à ces questions, nous devons d’abord comprendre comment fonctionnent les IA génératives de textes. Nous verrons ensuite leur fiabilité avec des tests avancés avec 85 échantillons de texte et nous répondrons à la question : en tant que marketeur, doit-on réellement s’en soucier ?

Si vous cherchez un bon détecteur de chat gpt ou de n’importe quelle IA vous pouvez directement aller voir le classement.

Sommaire

Comment fonctionne l’intelligence artificielle et les outils de détection IA ?

Le fonctionnement basique d’une IA textuelle

En essayant de ne pas être trop technique, essayons de comprendre le fonctionnement des IA génératives.

Les intelligences artificielles génératives de texte comme celle de, par exemple chat GPT, prédisent un mot ou un groupe de mots les plus probables à venir, en fonction d’un contexte.

C’est le principe de la prédiction conditionnelle. Les modèles analysent le token précédent pour prédire le token qui va suivre. Le token suivant est choisi en fonction d’une probabilité, la probabilité la plus élevée selon son entraînement, selon le mécanisme d’attention et les paramètres.

Exemple : Si le texte est “Les chats”, le modèle calcule la probabilité des tokens qui pourraient suivre. Le token suivant peut donc être “dorment”, “mangent”, ou “sont”.

Le mécanisme d’attention, lié à l’architecture “transformer”, permet d’évaluer la pertinence d’un token par rapport au contexte. Ces modèles sont entraînés sur de grandes quantités de texte afin de maximiser sa capacité à prédire les mots qui vont suivre.

Cette probabilité peut être modifiée avec des paramètres comme par exemple la température.

Exemple avec température faible (0.5) sur chat GPT :

Pour décorer votre salon, commencez par choisir une palette de couleurs harmonieuses qui reflètent votre style personnel. Ajoutez des meubles fonctionnels et confortables, en jouant avec les textures et les matériaux pour créer de la profondeur.

Exemple avec température élevée (1.7) :

Choisis une palette de couleurs qui reflète ton style personnel, par exemple des tons neutres pour une ambiance chic ou des couleurs vives pour un intérieur énergique. Intègre différents types de textiles, comme des coussins, des rideaux et des tapis en matières variées, pour créer une atmosphère chaleureuse et accueillante.

On voit bien que le texte avec la température élevée est plus original et imprévisible.

Les caractéristiques d’un texte IA

Points faibles des textes générés par IA
Point faible	Explication
🔁 Répétitions de mots ou d'idées	Les IA ont tendance à réutiliser les mêmes mots ou idées pour structurer leur texte, ce qui peut rendre le contenu monotone.
🎨 Manque de créativité et d'exemple	Les textes générés manquent souvent d'originalité et ne proposent pas d'exemples concrets pour appuyer leurs idées.
🤖 Ton générique et impersonnel	Les IA adoptent généralement un ton neutre et formel, sans personnalité ni adaptation à un style distinctif.
🌊 Manque de profondeur	Les textes IA présentent souvent des arguments superficiels, sans exploration approfondie des idées.
♻️ Utilisation excessive de phrases prévisibles	Les IA utilisent fréquemment des formulations standards ou stéréotypées, rendant le texte moins engageant.
📐 Construction de phrases rigides	Les textes générés manquent souvent de fluidité ou de variations dans la structure des phrases.
💔 Difficulté à exprimer des émotions ou des nuances	Les IA peinent à transmettre des sentiments ou à saisir les nuances émotionnelles du sujet.
⚠️ Erreurs dans les références culturelles ou historiques	Les textes IA peuvent inclure des erreurs ou des approximations lorsqu'il s'agit de références spécifiques.
🎯 Incapacité à détecter les attentes spécifiques d'un public	Les textes générés ne prennent pas toujours en compte les attentes ou sensibilités particulières de l’audience.
🕒 Méconnaissance des événements récents	Les IA peuvent être limitées dans leur capacité à intégrer des informations actualisées ou spécifiques.

Un texte IA est donc monotone, peu créatif, sans opinion, très prévisible et il ne va pas au bout des choses. Il utilise une structure et un vocabulaire redondant.

Comment fonctionnent les outils de détection d’IA ?

Les outils de détections IA n’expliquent pas réellement leur fonctionnement. Cependant, il y a différentes façons de détecter si un texte est généré par une IA. Les détecteurs peuvent utiliser une ou plusieurs de ces “solutions”.

A. Utiliser des “variables”

Cela consiste à étudier les caractéristiques des textes et déduire des variables pertinentes comme :

Calcul de la perpléxité : on peut calculer la prévisibilité d’un texte. Contient-il des mots rares ? Y-a-t-il de la variabilité syntaxique ?
Calcul de la burstiness : on calcule la variabilité dans la structure du texte (phrase et paragraphe)
Signature stylistiques des modèles : on a tous des TIC de langages et des phrases ou des tournures de phrases que l’on aime utiliser et abuser. C’est pareil pour les IA génératives. Mention spéciale à chat GPT avec ses “En résumé”, “dans cet article”, …
Cohérence globale du texte : pour un texte court la cohérence est généralement respectée. Mais pour un long texte, la cohérence entre le début et la fin peut-être limitée. Cela entraîne des répétitions dans les idées.
Originalité des idées et erreurs subtiles : les IA sont généralement peu originales dans leur contenu et donnent peu d’exemples et de données en dehors de leur entraînement. Elles ne font jamais de fautes de frappe ou d’orthographe.

B. Utiliser un modèle de classification

Cela consiste à utiliser un dataset (des données avec texte humain et texte IA) pour entraîner une IA de classification capable de déterminer si un texte est humain ou généré par une IA. En somme, un processus typique d’apprentissage automatique. C’est par exemple le processus utilisé par l’outil Binoculars sur Huggingface.

Cette méthode est plus simple et rapide à mettre en place, pour peu que l’on ait les bonnes données à porté de main. Mais cela demande plus de maintenance et de coûts, à la fois pour l’entraînement mais aussi pour classifier chaque texte.
Aussi, on ne sait pas trop ce que fait le modèle de classification. On ne connaît pas les critères qu’il prend en compte pour faire cette classification.

Limites intrinsèques de ces outils

De par leur fonctionnement, ces outils sont limités. Nous le verrons plus bas lors de nos nombreux tests.

Les détecteurs d’IA peuvent donner des faux positifs. Un texte humain peut être considéré comme étant généré par de l’IA alors que cela n’est pas le cas. C’est certainement le cas pour des contenus formels comme ceux que l’on peut trouver sur wikipédia, les articles scientifiques ou sur les sites d’information du gouvernement. Ces textes “trop parfaits” peuvent être injustement considérés comme ceux d’une IA. Cela peut aussi être le cas des poèmes ou des paroles d’une chanson qui suivent une structure précise.

Ces outils peuvent également donner des faux négatifs : des textes détectés comme humains, alors qu’ils sont issus d’une IA générative. Les modèles les plus avancés (comme notre modèle Cicéron) peuvent générer des textes subtils et imprévisibles et sont généralement perçus comme humains.

On peut également parler des textes hybrides, générés par une IA et modifiés par l’homme. Ils peuvent être complexes à détecter. Et même si beaucoup de modèles de détections donnent un pourcentage (par exemple 41% IA et 59 % humain), à partir de quel niveau considère-t-on un texte humain ?

Enfin, la langue du texte doit être prise en considération. Le détecteur, tout comme l’IA générative, ont-ils été entraînés suffisamment pour cette langue ?

Pour le moment, même s’il était possible de détecter l’origine d’un texte, cela sera-t-il le cas dans l’avenir ? Les modèles d’IA évoluent rapidement et ont pour objectifs de reproduire un langage et une écriture humaine. S’ils ne sont pas infaillibles pour le moment, quant sera-t-il dans quelques mois ou quelques années ?

Test des outils de détection IA : sont-ils fiables ?

Présentation des tests et de la méthodologie

Faute de temps et de moyen, nous avons pour le moment testé uniquement les outils gratuits ou les payants qui permettent une utilisation gratuite limitée. C’est pour cela que certains outils n’ont pas de note de fiabilité dans le tableau comparatif.
C’est donc 6 outils passés au crible ! (on ne compte pas writer et detecting IA qui ont 0/10).

Pour la méthodologie, nous avons généralement utilisé des textes courts, en moyenne 250/300 mots, sauf pour les textes générés par notre modèle IA Cicéron (textes supérieurs à 700 mots).
Comme certains outils ne donnent pas une réponse binaire, humain ou IA, utiliser des textes courts permet d’avoir davantage de texte proche du 100% humain ou 100% IA. Aussi, certains outils limitent la longueur du texte que l’on peut soumettre, c’est également une autre raison de ce choix de textes courts.

Si un modèle donne un pourcentage plutôt qu’une réponse binaire, nous considérons que le texte est humain si celui-ci est supérieur ou égale à 74 % humain.

L’objectif de l’étude est de connaître le nombre d’erreurs pour chaque outil en fonction du type de texte. Et de savoir si l’on peut faire passer un texte considéré comme IA en texte humain avec des prompt plus compliqués.

Nous avons utilisé plusieurs datasets :

Articles humains : 30 extraits d’articles rédigé par des humains et publiés en ligne (issu de sites réputés)

Textes formels humains : 15 extraits de texte rédigé par des humains issu de wikipedia, de sites gouvernementaux et de publications scientifiques ou universitaires (5 pour chaque)
Textes IA basiques : 15 textes basiques générés par IA : 5 textes issu de gpt4o-mini, 5 issu de gpt4o, 5 de Claude Sonnet 3.5. Nous n’utilisons ni Bard, ni les autres IA open source.
Textes IA basiques avec prompt “complexes” : 5 textes IA avec des prompts complexes
Textes Cicéron : 20 textes générés par l’IA Cicéron, une IA entraînée pour écrire comme les humains et spécialement en français. 10 textes issus de “Cicéron rapide” et 10 issus de “Cicéron Premium”. Vous pouvez l’essayer gratuitement en vous inscrivant.

Donc cela fait un dataset de 85 entrées dont plus de la moitié (45) est rédigée par des humains.

Il est nécessaire de vous donner quelques informations sur les prompts complexes. Les prompts basiques utilisés sont de cet ordre :
“Rédige moi 2 paragraphes qui explique pourquoi …”

Pour les prompts complexes, on a essayé de générer des textes avec un style, un vocabulaire et une structure plus originale. Exemple :
“Ecris moi 3 paragraphes avec des conseils pour dresser un chien. Alterne phrase courte et longue. Utilise un vocabulaire très varié. Essaies d’intégrer des noms de chien réel ou fictifs célèbre dans le texte. Utilise un style d’écriture humain. Utilise le tutoiement.”

Résultats des outils de détection IA : % de déduction correcte

Dataset	Copyleaks	Binoculars	ZeroGPT	Scribbr	Isgen	Smodin	Neuralwriter
Articles humains	90 %	100 %	50 %	96 %	100 %	100 %	40 %
Textes formels humains	53 %	100 %	0 %	93 %	93 %	93 %	47 %
Textes IA basiques	100 %	93 %	87 %	73 %	87 %	93 %	53 %
Textes IA basiques complexes	80 %	40 %	80 %	20 %	80 %	60 %	0 %
Textes IA Cicéron Premium	30 %	20 %	90 %	30 %	60 %	40 %	50 %
Textes IA Cicéron Rapide	10 %	90 %	100 %	0 %	30 %	20 %	80 %

Le pourcentage correspond à la proportion de réponses correctes. Les détecteurs d’IA ont plus de difficulté à déduire l’origine d’un texte IA qui a été généré avec un prompt complexe.

Liste des différents outils de détection IA

Nous avons essayé de tester le plus de détecteur d’IA possible. Vous trouverez dans le tableau plus bas des informations pour chaque outil, ainsi qu’une note déduite de notre étude. Nous donnons dans cette note plus d’importance aux outils qui ne se trompent pas en considérant un texte humain comme une IA.

Tableau comparatif

Outil	Présentation (résumé promotionnel)	Fait pour le français ?	Version gratuite	Limitations de la version gratuite	Comment fonctionne le détecteur ?	Abonnement mensuel le moins cher	Contenu de l'abonnement mensuel le moins cher	Prix pour 1000 mots	Fiabilité
Binoculars	Un détecteur de texte généré par LLM utilisant une méthode zero-shot basée sur le contraste de deux modèles pré-entraînés. Atteint une précision élevée sans nécessiter de données d'entraînement spécifiques.	Non spécifié	Oui	Plusieurs dizaines de requêtes par jour possible sans inscriptions.	Compare les textes générés par deux LLM pré-entraînés pour identifier le contenu généré par IA.	Gratuit	Accès complet sans frais.	0	7/10
Isgen	Isgen détecte avec précision le contenu généré par l'IA dans plus de 80 langues. Il offre des analyses détaillées et des outils intuitifs pour garantir l'intégrité du texte.	Oui	Oui	Gratuit avec 12 000 mots par mois, 50 appels par jour.	Analyse le texte en profondeur à l'aide de modèles avancés formés sur des données multilingues pour identifier les caractéristiques spécifiques des contenus générés par l'IA.	7 €	150 000 mots par mois. 200 appels par jour.	0.05 €	8/10
Smodin	Outil avancé de détection d'IA capable de distinguer entre textes humains et générés par IA comme ChatGPT ou Gemini. Utilisé par des professionnels, étudiants et éducateurs pour assurer l'authenticité des contenus.	Oui	Oui, mais très limité	5 000 caractères par texte, utilisation limitée par jour.	Analyse le texte pour déterminer son origine et identifier les signatures spécifiques des modèles d'IA.	15 $/mois	Jusqu'à 15 000 caractères par texte, utilisations illimitées, outils supplémentaires : vérificateur de plagiat, traducteur multilingue, réécriture (presque tout illimité).	Illimité	8/10
Scribbr	Outil avancé de détection d'IA et de plagiat utilisé par des millions d'utilisateurs chaque mois. Permet de distinguer entre contenu entièrement généré par IA, affiné par IA ou écrit par des humains.	Oui	Oui	Détections illimitées jusqu'à 1 200 mots par soumission, pas de besoin de s'inscrire.	Utilise des algorithmes avancés pour détecter les modèles d'écriture IA et différencier les types de contenu.	La détection IA est gratuite mais le site propose des abonnements pour d'autres fonctionnalités.	Détection IA gratuite.	0	6/10
Copyleaks	Le détecteur de contenu IA et le vérificateur ChatGPT le plus précis, approuvé par les grandes organisations mondiales. Offre une détection en plus de 30 langues avec une précision de plus de 99%.	Oui	Oui	Quelques vérifications par jour sans inscription.	Utilise un moteur d'IA formé depuis 2015 pour reconnaître les modèles d'écriture humaine et détecter les écarts indiquant du contenu généré par IA.	16,99 $/mois	100 crédits (1 crédit = 250 mots), détection en plus de 30 langues, détection de plagiarism, deux utilisateurs inclus.	0.68 $	5/10
Neural Writer	Gratuit et multilingue, cet outil est utile pour vérifier l'authenticité de contenus dans divers contextes, tels que l'éducation, le web, ou les entreprises.	Oui	Oui	Détections illimitées jusqu'à 10 000 caractères par soumission, pas de besoin de s'inscrire.	Le détecteur IA compare les caractéristiques du texte, comme le style et la complexité, à celles des écrits humains et générés par IA pour évaluer sa provenance.	La détection IA est gratuite.	Détection IA gratuite.	0	3/10
ZeroGPT	Outil de détection d'IA avec une précision de 98%, capable d'identifier le contenu généré par divers modèles d'IA. Génère des rapports détaillés avec des pourcentages et des indicateurs visuels.	Non spécifié	Oui	Limite de caractères par détection, fonctionnalités de base seulement. Une dizaine par jour sans inscription.	Utilise la technologie DeepAnalyse™ pour analyser et déterminer l'origine du texte.	9,99 $/mois	100 000 caractères par détection IA, + d'autres outils IA.	Illimité ?? (pas de limites précisées)	4/10
Writer.com	Outil gratuit de détection d'IA permettant de vérifier jusqu'à 5 000 mots sans inscription. Offre une API payante pour intégration dans des applications.	Non spécifié	Oui	Limite de 5 000 mots par vérification. Fonctionnalités complètes disponibles uniquement via API payante.	Évalue le texte et calcule la probabilité qu'il ait été généré par IA.	Gratuit	La détection IA est gratuite mais le site propose des abonnements pour d'autres fonctionnalités.	0	0/10
Detecting-AI.com	Vérificateur d'IA avec une précision élevée et une interface utilisateur intuitive. Offre des analyses détaillées et des rapports PDF générés automatiquement.	Non spécifié	Oui	Limite de 5 000 caractères, 100 détections par jour sans inscription.	Utilise des algorithmes avancés pour identifier le contenu généré par divers modèles d'IA.	10 $/mois	Détections illimitées, jusqu'à 160 000 caractères, support premium, fonctionnalités avancées comme la vérification de plagiat.	Illimité	0/10
GPTZero	Outil leader pour détecter les textes générés par des modèles d'IA comme ChatGPT. Utilisé par plus de 2,5 millions d'utilisateurs et diverses organisations.	Non spécifié	Oui, mais très limité	10 000 mots par mois, 5 scans avancés gratuits. Inscription requise pour les plans payants.	Analyse le texte à différents niveaux (phrase, paragraphe, document) pour identifier les signatures de l'IA.	14,99 $/mois	150 000 mots, vérification de vocabulaire IA, extension Chrome, multi-upload de fichiers.	0.099 $	-/10
Gowinston.ai	Outil de détection d'IA avec une précision exceptionnelle de 99,98%, capable d'identifier les contenus générés par les principaux modèles d'IA. Offre également des fonctionnalités de détection d'images et de deepfakes.	Oui	Oui, mais très limité	2 000 crédits tous les 14 jours, fonctionnalités limitées.	Utilise un modèle de détection avancé formé sur un large jeu de données pour identifier les contenus générés par IA.	18 $/mois	80 000 crédits par mois, 1 crédit par mot, détection de contenu IA et images, feedback d'écriture, support par email et chat.	0.225 $	-/10
Originality.ai	Outil de détection d'IA hautement précis offrant également des fonctionnalités de vérification des faits et de lisibilité. Conçu pour assurer la qualité et l'authenticité du contenu.	Oui	Oui (limité sans inscription)	Peu de vérifications gratuites sans inscription, pas de version totalement gratuite.	Utilise des techniques avancées de traitement du langage naturel pour détecter et analyser le contenu généré par IA.	14,95 $/mois	2 000 crédits par mois, 1 crédit = 100 mots, détection IA et plagiat, analyse de lisibilité, gestion d'équipe.	0.075 $	-/10
Lucide.ai	Outil de détection d'IA spécialisé pour le marché francophone, offrant une analyse approfondie et des interprétations spécifiques des résultats. Permet également la détection de plagiat.	Oui	Non	Aucun accès gratuit.	Analyse le texte via des algorithmes spécialisés pour identifier et interpréter les contenus générés par IA et le plagiat.	9 €/mois	100 crédits, détection IA et plagiat, scraping d'URL, accès API, analyse de documents.	0.9 €	-/10

Top 3 des détecteurs d’IA

Suite à notre test, nous avons établi ce podium.

Les 2 détecteurs les plus fiables sont Isgen et Smodin avec des résultats quasi-identiques et une fiabilité de 90%. Ensuite, nous avons l’outil totalement gratuit Binoculars qui est un peu moins précis mais pour lesquels vous ne serez pas limité pour vos requêtes.

En version gratuite, Isgen permet une dizaine de vérification par jour, ce qui est largement suffisant pour beaucoup. Par contre, Smodin limite à 5 demande gratuite par semaine, ce qui peut être limitant et lui fait perdre une place sur notre podium.

Mon avis sur les différents outils de détection testés

Isgen

8/10

Isgen est sans aucun doute l’outil le plus fiable de notre étude avec Smodin. Même s’il n’est pas parfait, il se trompe rarement, sauf pour les textes issus de notre IA Cicéron.
Il est largement meilleur que Binoculars sur les textes IA avec prompts complexes.

Smodin

8/10

Smodin est lui aussi très fiable. Il se trompe rarementmais peut parfois considérer un texte Ia comme humain.
Il est lui aussi largement meilleur que les autres détecteurs sur les textes IA avec prompts complexes.

binoculars: zero-shot llm-text detector

7/10

Ce détecteur d’ia gratuit est un outil issu d’un papier scientifique présent en accès libre sur huggingface et qui ne paie pas de mine. Mais, il s’est avéré particulièrement exact ne sont trompant qu’une seule fois pour les textes issus de LLM (prompt simples). Nous avons utilisé le mode « High Accuracy ».
Pour les textes humains, il les a tous considéré comme humain, même les textes formels de wikipedia ou du gouvernement.
Il faut noter que les datasets utilisés sont composés principalement de textes entre 200 et 300 mots, ce que demande exactement ce modèle de détection pour exceller.

Pour les textes issus de notre modèle LLM Cicéron, il les a considérés comme humain à 90% pour notre modèle premium (article assisté premium), beaucoup moins pour sa version rapide (15 % considérés comme humain).

Une des 2 meilleures options donc, et gratuit en plus. En vous inscrivant sur le site, vous pourrez bénéficier de plus de requêtes.

scribbr.com

6/10

Scribbr propose un logiciel gratuit en ligne pour détecter l’origine des textes. quillbot.com propose un outil exactement identique (les résultats sont les mêmes) mais payant.

Il se trompe parfois en considérant un texte IA comme humain (notamment avec notre IA Cicéron où 81% des textes étaient humains) mais se trompe rarement pour dire qu’un texte humain est celui d’une IA. Il s’est trompé 2 fois en considérant un texte humain comme celui d’une IA.

C’est donc l’un des outils les plus fiables testé pour ne pas avoir de faux positif et accuser à tort quelqu’un d’avoir utilisé l’IA alors que cela n’est pas le cas.

copyleaks.com

5/10

La plateforme Copyleaks ne se trompe que sur les textes humains “formel” et réalise assez bien la détection de l’IA même avec des prompts complexes. Il détecte généralement les articles de notre IA Cicéron comme humain.
Cependant, le seul à avoir 100% pour les textes IA basiques. Une bonne option !

Neuralwriter

3/10

Beaucoup trop d’erreurs dans nos tests pour l’outil gratuit proposé par NeuralWriter. Il se trompe plus d’une fois sur 2.

zerogpt.com

4/10

Il reconnaît généralement bien les textes issus des LLM avec des prompt simples (“Textes IA basiques”) mais a fait plus d’erreurs que binocular.

Pour les textes issus des datasets “humains” (articles, wikipedia, site gouv.fr…), il se trompe beaucoup trop souvent avec plus de 50% d’erreurs. Il a tendance à tout considérer comme de l’IA !

En conclusion, malheureusement, beaucoup de textes humains sont considérés comme de l’IA. Pas le moins fiable, mais pas du tout le plus fiable.

detecting-ai.com et writer.com

0/10

Quel est le point commun de ces 2 outils ? Ils brillent … par leur humanité. 100 % des textes testés sont considérés comme humains. Ils ne sont donc pas fiables, en tout cas pour les textes en français.
Si writer.com précise que l’outil est optimisé seulement pour l’anglais, pour detecting-ai.com je n’ai trouvé aucune information sur les langues acceptées sur l’outil. Pourtant, le site à une version française.

A éviter donc, sauf si vous souhaitez prouver à votre moitié que votre poème en son honneur n’a pas été généré par une IA.

Quel outil choisir ?

Aucun outil n’est parfait. Si vous souhaitez faire quelques détections par jour, manuellement (sans API), il y a quelques outils gratuits de qualité.

Si vous souhaitez savoir si un texte que l’on vous a fourni est humain, en ayant le moins de faux négatifs (c’est-à dire un texte humain considéré comme IA), vous pouvez utiliser une combinaison de Isgen, Binoculars et de Scribbr. Ils se trompent rarement en notant un texte humain comme IA, même s’il est formel. Par contre, ils pourront parfois vous dire qu’ un texte IA est humain.
Comme les 3 sont gratuits (limité pour Isgen), vous pourrez lancer facilement une requête sur les 3.

Si vous souhaitez intégrer cette détection dans une application, 3 outils que nous avons testé proposent l’accès à une API.
zerogpt.com, peu fiable, semble proposer l’accès à l’API sans minimum d’achat ou très peu. Copyleaks, largement plus fiable, donne accès à son API uniquement pour les comptes entreprise, les plus onéreux.
La meilleure option API sera bien sûr Isgen (le mieux noté), mais cela se fait sur devis et demande par email uniquement.

Au niveau des options payantes, les écarts de prix sont très importants et nous n’avons malheureusement pas pu les tester pour des raisons de temps et de coûts.

L’outil le plus cher est le seul spécialisé dans le français (lucide.ai) avec un coût de 0.9 cents d’euro pour 1000 mots. Le moins cher en non illimité est Isgen avec un coût de seulement 0.05 € pour 1000 mots. Smodin et Detecting-AI.com sont illimités avec l’abonnement de base.

Il y a également de nombreux outils gratuits qui satisferont les utilisateurs ponctuels qui ont besoin de temps en temps de vérifier l’origine d’un texte. Vous pouvez vous reporter à la note de fiabilité pour chaque outil. Nous avons essayé de la calculer de la manière la plus scientifique durant notre test.

Conclusion de cette étude

La conclusion est simple : aucun outil testé est fiable à 100%. Le risque serait que les utilisateurs prennent les réponses de ces outils pour argent comptant; sachant que beaucoup d’outils se considèrent fiables à 99%, ce qui n’est, bien entendu, pas le cas.

Dans l’avenir, ces détecteurs vont évoluer, certes, mais moins vite que les LLM. Ils auront toujours un train de retard et gageons que la fiabilité n’atteindra jamais les 99% et sera toujours bien loin.

Nous recommandons donc l’utilisation d’outils comme Isgen, binoculars ou scribbr qui, même s’ils considèrent parfois des textes IA comme humains, se trompent rarement pour l’inverse. Mieux vaut laisser le bénéfice du doute à chaque texte.

Plutôt que se demander si un texte est humain, ne doit-on pas plutôt se poser la question : ce texte vaut-il la peine d’être lu ? Va-t-il me divertir ou m’instruire ?

Et surtout, mon texte généré en partie (ou entièrement) par une intelligence artificielle, va-t-il être pénalisé par les moteurs de recherche ?

Les textes IA sont-ils pénalisés par Google ?

La majorité des contenus web étant, en partie ou totalement généré par une IA, de nombreuses questions se posent quant à l’impact potentiel sur le référencement. Google pénalise-t-il réellement les textes générés par IA ?

La position officielle de Google

Google a communiqué le 8 février 2023 de manière transparente sur sa vision du contenu généré par l’IA.

Le moteur de recherche n’entend pas pénaliser spécifiquement les textes rédigés par des outils d’IA, du moment qu’ils répondent à ses critères de qualité : EEAT : Expérience, Expertise, Authoritativeness (légitimité) et Trustworthiness (fiabilité).

L’objectif de Google reste inchangé quelque soit l’origine du texte : récompenser les contenus utiles, originaux, fiables et centrés sur l’utilisateur. L’automatisation, y compris via l’IA, n’est pas interdite. Ce qui est sanctionné, c’est l’utilisation abusive de ces outils dans le but de manipuler le classement, en produisant du contenu superficiel, dupliqué ou non pertinent.

Google insiste donc sur la nécessité de créer un contenu avant tout pour les utilisateurs, et non pour les moteurs de recherche. Ainsi, un texte IA qui n’apporte aucune valeur ou qui est trop générique court le risque d’être considéré comme du “spam”.

Maintenant que l’on connait la version “officielle de google, qu’en est-il dans la réalité ?

La réalité : l’étude de SemRush

Pour aller plus loin, voyons ensemble l’étude réalisée par SemRush via ContentShake IA.

Dans cette étude, 20 000 articles positionnés dans les 20 premiers résultats de Google ont été analysés. Aussi, l’étude s’est renseigné auprès de plus de 700 spécialistes du marketing. L’objectif ? Déterminer si le contenu IA peut se classer aussi bien que du contenu rédigé par des humains.

Cette étude, réalisée fin 2024, nous donne de nombreux enseignements :

Performances similaires : Dans les 20 000 URL examinées, le contenu généré par IA s’est aussi bien classé que le contenu humain. Par exemple, 57 % des textes IA et 58 % des textes humains atteignent le top 10.
Retour positif des professionnels : 39 % des marketers interrogés ont constaté une hausse du trafic organique après avoir publié du contenu IA. 33 % déclarent même que leur contenu IA a mieux performé que leurs textes purement humains.
Combiner IA et expertise humaine : 73 % des marketeurs utilisent une combinaison d’IA et de rédaction humaine. Cette approche hybride apparaît comme la plus efficace.

Les résultats confirment la position de Google : ce n’est pas la nature automatique ou non du texte qui compte, mais sa valeur intrinsèque. Le contenu IA peut très bien se classer s’il est pertinent, bien optimisé et utile pour l’internaute.

Soulignons néanmoins les limitations de cette étude. Elle n’a été faite que sur des contenus en anglais et un détecteur d’IA a été utilisé pour savoir si un contenu était humain ou non.

Comment améliorer un contenu IA ?

Se soumettre aux demandes de google

Pour optimiser la qualité d’un contenu IA, la première étape consiste à s’aligner sur les critères E-E-A-T de google. Cela implique d’offrir une réelle valeur ajoutée pour votre lecteur :

Expérience et expertise : Injectez vos connaissances professionnelles, vos données exclusives (comme ici les données de notre étude), vos retours terrain et vos analyses pointues. L’IA peut générer un premier jet, mais c’est votre vision experte qui fera la différence. C’est exactement le processus que nous avons utilisé pour cet article.
Autorité et fiabilité : Citez des sources crédibles, ajoutez des références, des liens de confiance, des témoignages d’experts ou des données issues de recherches internes.

Humaniser le texte généré par IA

L’IA tend à produire un contenu générique et prévisible. Pour éviter cela, vous pouvez utiliser des IA spécialisées comme le modèle Cicéron d’Articlum.

Sinon, vous pouvez améliorer le résultat avec :

Une réécriture humaine : Relisez et ajustez le texte produit par l’IA. Apportez une touche de style, de fluidité, variez le vocabulaire, insérez des anecdotes, et adaptez le ton de l’article à votre public. C’est le minimum à faire si vous tenez à vos lecteurs. Mais ces changements ne garantissent pas que vous aurez une meilleure note avec les outils de détection.
Une personnalisation : Créez une ligne éditoriale claire et communiquez-la à l’IA (ton, style, champ lexical) dans votre prompt. Cette cohérence éditoriale évitera en partie l’effet “texte standardisé et monotone”.
Une adaptation au contexte : Assurez-vous de répondre aux intentions de recherche spécifiques des utilisateurs. Par exemple, si un internaute cherche un avis pratique, ajoutez des retours d’expérience, des comparaisons, des arguments concrets et spécifiques.

Améliorer la pertinence et la structure SEO

Optimisation sémantique : Sélectionnez des mots-clés pertinents et intégrez-les naturellement. L’IA peut aider à générer une première liste de mots-clés. Cependant il est plus rapide et qualitatif d’utiliser un outil d’optimisation sémantique comme notre Assistant d’écriture.
Hiérarchisation de l’information : Utilisez des sous-titres, des listes à puces, des images illustratives (avec attributs alt), et des données chiffrées pour améliorer la lisibilité et donner du relief au texte.

Détection IA : les détecteurs d’IA sont-ils fiables ?