Détection IA : les outils sont-ils fiables ?
9 décembre 2024
9 décembre 2024
En moins de 2 ans, la génération de texte à l’aide d’une intelligence artificielle à modifié la façon de travailler de beaucoup de personnes : marketeurs de contenu, copywriter, enseignants, étudiants…
Pour différentes raisons (principalement académique ou business) nous souhaitons parfois savoir connaître l’auteur d’un texte : un humain ou une intelligence artificielle. Pour résoudre ce problème, de nombreux outils de détection ont vu le jour.
Sont-ils fiables ? Peut-on leur faire confiance ?
Pour répondre à ces questions, nous devons d’abord comprendre comment fonctionnent les IA génératives de textes. Nous verrons ensuite leur fiabilité avec des tests avancés avec 85 échantillons de texte et nous répondrons à la question : en tant que marketeur, doit-on réellement s’en soucier ?
Sommaire
ToggleEn essayant de ne pas être trop technique, essayons de comprendre le fonctionnement des IA génératives.
Les intelligences artificielles génératives de texte comme celle de, par exemple chat GPT, prédisent un mot ou un groupe de mots les plus probables à venir, en fonction d’un contexte.
C’est le principe de la prédiction conditionnelle. Les modèles analysent le token précédent pour prédire le token qui va suivre. Le token suivant est choisi en fonction d’une probabilité, la probabilité la plus élevée selon son entraînement, selon le mécanisme d’attention et les paramètres.
Exemple : Si le texte est « Les chats », le modèle calcule la probabilité des tokens qui pourraient suivre. Le token suivant peut donc être « dorment », « mangent », ou « sont ».
Le mécanisme d’attention, lié à l’architecture “transformer”, permet d’évaluer la pertinence d’un token par rapport au contexte. Ces modèles sont entraînés sur de grandes quantités de texte afin de maximiser sa capacité à prédire les mots qui vont suivre.
Cette probabilité peut être modifiée avec des paramètres comme par exemple la température.
Exemple avec température faible (0.5) sur chat GPT :
Pour décorer votre salon, commencez par choisir une palette de couleurs harmonieuses qui reflètent votre style personnel. Ajoutez des meubles fonctionnels et confortables, en jouant avec les textures et les matériaux pour créer de la profondeur.
Exemple avec température élevée (1.7) :
Choisis une palette de couleurs qui reflète ton style personnel, par exemple des tons neutres pour une ambiance chic ou des couleurs vives pour un intérieur énergique. Intègre différents types de textiles, comme des coussins, des rideaux et des tapis en matières variées, pour créer une atmosphère chaleureuse et accueillante.
On voit bien que le texte avec la température élevée est plus original et imprévisible.
Point faible | Explication |
---|---|
🔁 Répétitions de mots ou d'idées | Les IA ont tendance à réutiliser les mêmes mots ou idées pour structurer leur texte, ce qui peut rendre le contenu monotone. |
🎨 Manque de créativité et d'exemple | Les textes générés manquent souvent d'originalité et ne proposent pas d'exemples concrets pour appuyer leurs idées. |
🤖 Ton générique et impersonnel | Les IA adoptent généralement un ton neutre et formel, sans personnalité ni adaptation à un style distinctif. |
🌊 Manque de profondeur | Les textes IA présentent souvent des arguments superficiels, sans exploration approfondie des idées. |
♻️ Utilisation excessive de phrases prévisibles | Les IA utilisent fréquemment des formulations standards ou stéréotypées, rendant le texte moins engageant. |
📐 Construction de phrases rigides | Les textes générés manquent souvent de fluidité ou de variations dans la structure des phrases. |
💔 Difficulté à exprimer des émotions ou des nuances | Les IA peinent à transmettre des sentiments ou à saisir les nuances émotionnelles du sujet. |
⚠️ Erreurs dans les références culturelles ou historiques | Les textes IA peuvent inclure des erreurs ou des approximations lorsqu'il s'agit de références spécifiques. |
🎯 Incapacité à détecter les attentes spécifiques d'un public | Les textes générés ne prennent pas toujours en compte les attentes ou sensibilités particulières de l’audience. |
🕒 Méconnaissance des événements récents | Les IA peuvent être limitées dans leur capacité à intégrer des informations actualisées ou spécifiques. |
Un texte IA est donc monotone, peu créatif, sans opinion, très prévisible et il ne va pas au bout des choses. Il utilise une structure et un vocabulaire redondant.
Les outils de détections IA n’expliquent pas réellement leur fonctionnement. Cependant, il y a différentes façons de détecter si un texte est généré par une IA. Les détecteurs peuvent utiliser une ou plusieurs de ces “solutions”.
Cela consiste à étudier les caractéristiques des textes et déduire des variables pertinentes comme :
Cela consiste à utiliser un dataset (des données avec texte humain et texte IA) pour entraîner une IA de classification capable de déterminer si un texte est humain ou généré par une IA. En somme, un processus typique d’apprentissage automatique. C’est par exemple le processus utilisé par l’outil Binoculars sur Huggingface.
Cette méthode est plus simple et rapide à mettre en place, pour peu que l’on ait les bonnes données à porté de main. Mais cela demande plus de maintenance et de coûts, à la fois pour l’entraînement mais aussi pour classifier chaque texte.
Aussi, on ne sait pas trop ce que fait le modèle de classification. On ne connaît pas les critères qu’il prend en compte pour faire cette classification.
De par leur fonctionnement, ces outils sont limités. Nous le verrons plus bas lors de nos nombreux tests.
Les détecteurs d’IA peuvent donner des faux positifs. Un texte humain peut être considéré comme étant généré par de l’IA alors que cela n’est pas le cas. C’est certainement le cas pour des contenus formels comme ceux que l’on peut trouver sur wikipédia, les articles scientifiques ou sur les sites d’information du gouvernement. Ces textes “trop parfaits” peuvent être injustement considérés comme ceux d’une IA. Cela peut aussi être le cas des poèmes ou des paroles d’une chanson qui suivent une structure précise.
Ces outils peuvent également donner des faux négatifs : des textes détectés comme humains, alors qu’ils sont issus d’une IA générative. Les modèles les plus avancés (comme notre modèle Cicéron) peuvent générer des textes subtils et imprévisibles et sont généralement perçus comme humains.
On peut également parler des textes hybrides, générés par une IA et modifiés par l’homme. Ils peuvent être complexes à détecter. Et même si beaucoup de modèles de détections donnent un pourcentage (par exemple 41% IA et 59 % humain), à partir de quel niveau considère-t-on un texte humain ?
Enfin, la langue du texte doit être prise en considération. Le détecteur, tout comme l’IA générative, ont-ils été entraînés suffisamment pour cette langue ?
Pour le moment, même s’il était possible de détecter l’origine d’un texte, cela sera-t-il le cas dans l’avenir ? Les modèles d’IA évoluent rapidement et ont pour objectifs de reproduire un langage et une écriture humaine. S’ils ne sont pas infaillibles pour le moment, quant sera-t-il dans quelques mois ou quelques années ?
Faute de temps et de moyen, nous avons pour le moment testé uniquement les outils gratuits ou les payants qui permettent une utilisation gratuite limitée. C’est pour cela que certains outils n’ont pas de note de fiabilité dans le tableau comparatif.
C’est donc 6 outils passés au crible ! (on ne compte pas writer et detecting IA qui ont 0/10).
Pour la méthodologie, nous avons généralement utilisé des textes courts, en moyenne 250/300 mots, sauf pour les textes générés par notre modèle IA Cicéron (textes supérieurs à 700 mots).
Comme certains outils ne donnent pas une réponse binaire, humain ou IA, utiliser des textes courts permet d’avoir davantage de texte proche du 100% humain ou 100% IA. Aussi, certains outils limitent la longueur du texte que l’on peut soumettre, c’est également une autre raison de ce choix de textes courts.
Si un modèle donne un pourcentage plutôt qu’une réponse binaire, nous considérons que le texte est humain si celui-ci est supérieur ou égale à 74 % humain.
L’objectif de l’étude est de connaître le nombre d’erreurs pour chaque outil en fonction du type de texte. Et de savoir si l’on peut faire passer un texte considéré comme IA en texte humain avec des prompt plus compliqués.
Nous avons utilisé plusieurs datasets :
Donc cela fait un dataset de 85 entrées dont plus de la moitié (45) est rédigée par des humains.
Il est nécessaire de vous donner quelques informations sur les prompts complexes. Les prompts basiques utilisés sont de cet ordre :
« Rédige moi 2 paragraphes qui explique pourquoi … »
Pour les prompts complexes, on a essayé de générer des textes avec un style, un vocabulaire et une structure plus originale. Exemple :
« Ecris moi 3 paragraphes avec des conseils pour dresser un chien. Alterne phrase courte et longue. Utilise un vocabulaire très varié. Essaies d’intégrer des noms de chien réel ou fictifs célèbre dans le texte. Utilise un style d’écriture humain. Utilise le tutoiement. »
Dataset | Copyleaks | Binoculars | ZeroGPT | Scribbr | Isgen | Smodin | Neuralwriter |
---|---|---|---|---|---|---|---|
Articles humains | 90 % | 100 % | 50 % | 96 % | 100 % | 100 % | 40 % |
Textes formels humains | 53 % | 100 % | 0 % | 93 % | 93 % | 93 % | 47 % |
Textes IA basiques | 100 % | 93 % | 87 % | 73 % | 87 % | 93 % | 53 % |
Textes IA basiques complexes | 80 % | 40 % | 80 % | 20 % | 80 % | 60 % | 0 % |
Textes IA Cicéron Premium | 30 % | 20 % | 90 % | 30 % | 60 % | 40 % | 50 % |
Textes IA Cicéron Rapide | 10 % | 90 % | 100 % | 0 % | 30 % | 20 % | 80 % |
Le pourcentage correspond à la proportion de réponses correctes. Les détecteurs d’IA ont plus de difficulté à déduire l’origine d’un texte IA qui a été généré avec un prompt complexe.
Nous avons essayé de tester le plus de détecteur d’IA possible. Vous trouverez dans le tableau plus bas des informations pour chaque outil, ainsi qu’une note déduite de notre étude. Nous donnons dans cette note plus d’importance aux outils qui ne se trompent pas en considérant un texte humain comme une IA.
Outil | Présentation (résumé promotionnel) | Fait pour le français ? | Version gratuite | Limitations de la version gratuite | Comment fonctionne le détecteur ? | Abonnement mensuel le moins cher | Contenu de l'abonnement mensuel le moins cher | Prix pour 1000 mots | Fiabilité |
---|---|---|---|---|---|---|---|---|---|
Binoculars | Un détecteur de texte généré par LLM utilisant une méthode zero-shot basée sur le contraste de deux modèles pré-entraînés. Atteint une précision élevée sans nécessiter de données d'entraînement spécifiques. | Non spécifié | Oui | Plusieurs dizaines de requêtes par jour possible sans inscriptions. | Compare les textes générés par deux LLM pré-entraînés pour identifier le contenu généré par IA. | Gratuit | Accès complet sans frais. | 0 |
7/10
|
Isgen | Isgen détecte avec précision le contenu généré par l'IA dans plus de 80 langues. Il offre des analyses détaillées et des outils intuitifs pour garantir l'intégrité du texte. | Oui | Oui | Gratuit avec 12 000 mots par mois, 50 appels par jour. | Analyse le texte en profondeur à l'aide de modèles avancés formés sur des données multilingues pour identifier les caractéristiques spécifiques des contenus générés par l'IA. | 7 € | 150 000 mots par mois. 200 appels par jour. | 0.05 € |
8/10
|
Smodin | Outil avancé de détection d'IA capable de distinguer entre textes humains et générés par IA comme ChatGPT ou Gemini. Utilisé par des professionnels, étudiants et éducateurs pour assurer l'authenticité des contenus. | Oui | Oui, mais très limité | 5 000 caractères par texte, utilisation limitée par jour. | Analyse le texte pour déterminer son origine et identifier les signatures spécifiques des modèles d'IA. | 15 $/mois | Jusqu'à 15 000 caractères par texte, utilisations illimitées, outils supplémentaires : vérificateur de plagiat, traducteur multilingue, réécriture (presque tout illimité). | Illimité |
8/10
|
Scribbr | Outil avancé de détection d'IA et de plagiat utilisé par des millions d'utilisateurs chaque mois. Permet de distinguer entre contenu entièrement généré par IA, affiné par IA ou écrit par des humains. | Oui | Oui | Détections illimitées jusqu'à 1 200 mots par soumission, pas de besoin de s'inscrire. | Utilise des algorithmes avancés pour détecter les modèles d'écriture IA et différencier les types de contenu. | La détection IA est gratuite mais le site propose des abonnements pour d'autres fonctionnalités. | Détection IA gratuite. | 0 |
6/10
|
Copyleaks | Le détecteur de contenu IA et le vérificateur ChatGPT le plus précis, approuvé par les grandes organisations mondiales. Offre une détection en plus de 30 langues avec une précision de plus de 99%. | Oui | Oui | Quelques vérifications par jour sans inscription. | Utilise un moteur d'IA formé depuis 2015 pour reconnaître les modèles d'écriture humaine et détecter les écarts indiquant du contenu généré par IA. | 16,99 $/mois | 100 crédits (1 crédit = 250 mots), détection en plus de 30 langues, détection de plagiarism, deux utilisateurs inclus. | 0.68 $ |
5/10
|
Neural Writer | Gratuit et multilingue, cet outil est utile pour vérifier l'authenticité de contenus dans divers contextes, tels que l'éducation, le web, ou les entreprises. | Oui | Oui | Détections illimitées jusqu'à 10 000 caractères par soumission, pas de besoin de s'inscrire. | Le détecteur IA compare les caractéristiques du texte, comme le style et la complexité, à celles des écrits humains et générés par IA pour évaluer sa provenance. | La détection IA est gratuite. | Détection IA gratuite. | 0 |
3/10
|
ZeroGPT | Outil de détection d'IA avec une précision de 98%, capable d'identifier le contenu généré par divers modèles d'IA. Génère des rapports détaillés avec des pourcentages et des indicateurs visuels. | Non spécifié | Oui | Limite de caractères par détection, fonctionnalités de base seulement. Une dizaine par jour sans inscription. | Utilise la technologie DeepAnalyse™ pour analyser et déterminer l'origine du texte. | 9,99 $/mois | 100 000 caractères par détection IA, + d'autres outils IA. | Illimité ?? (pas de limites précisées) |
4/10
|
Writer.com | Outil gratuit de détection d'IA permettant de vérifier jusqu'à 5 000 mots sans inscription. Offre une API payante pour intégration dans des applications. | Non spécifié | Oui | Limite de 5 000 mots par vérification. Fonctionnalités complètes disponibles uniquement via API payante. | Évalue le texte et calcule la probabilité qu'il ait été généré par IA. | Gratuit | La détection IA est gratuite mais le site propose des abonnements pour d'autres fonctionnalités. | 0 |
0/10
|
Detecting-AI.com | Vérificateur d'IA avec une précision élevée et une interface utilisateur intuitive. Offre des analyses détaillées et des rapports PDF générés automatiquement. | Non spécifié | Oui | Limite de 5 000 caractères, 100 détections par jour sans inscription. | Utilise des algorithmes avancés pour identifier le contenu généré par divers modèles d'IA. | 10 $/mois | Détections illimitées, jusqu'à 160 000 caractères, support premium, fonctionnalités avancées comme la vérification de plagiat. | Illimité |
0/10
|
GPTZero | Outil leader pour détecter les textes générés par des modèles d'IA comme ChatGPT. Utilisé par plus de 2,5 millions d'utilisateurs et diverses organisations. | Non spécifié | Oui, mais très limité | 10 000 mots par mois, 5 scans avancés gratuits. Inscription requise pour les plans payants. | Analyse le texte à différents niveaux (phrase, paragraphe, document) pour identifier les signatures de l'IA. | 14,99 $/mois | 150 000 mots, vérification de vocabulaire IA, extension Chrome, multi-upload de fichiers. | 0.099 $ |
-/10
|
Gowinston.ai | Outil de détection d'IA avec une précision exceptionnelle de 99,98%, capable d'identifier les contenus générés par les principaux modèles d'IA. Offre également des fonctionnalités de détection d'images et de deepfakes. | Oui | Oui, mais très limité | 2 000 crédits tous les 14 jours, fonctionnalités limitées. | Utilise un modèle de détection avancé formé sur un large jeu de données pour identifier les contenus générés par IA. | 18 $/mois | 80 000 crédits par mois, 1 crédit par mot, détection de contenu IA et images, feedback d'écriture, support par email et chat. | 0.225 $ |
-/10
|
Originality.ai | Outil de détection d'IA hautement précis offrant également des fonctionnalités de vérification des faits et de lisibilité. Conçu pour assurer la qualité et l'authenticité du contenu. | Oui | Oui (limité sans inscription) | Peu de vérifications gratuites sans inscription, pas de version totalement gratuite. | Utilise des techniques avancées de traitement du langage naturel pour détecter et analyser le contenu généré par IA. | 14,95 $/mois | 2 000 crédits par mois, 1 crédit = 100 mots, détection IA et plagiat, analyse de lisibilité, gestion d'équipe. | 0.075 $ |
-/10
|
Lucide.ai | Outil de détection d'IA spécialisé pour le marché francophone, offrant une analyse approfondie et des interprétations spécifiques des résultats. Permet également la détection de plagiat. | Oui | Non | Aucun accès gratuit. | Analyse le texte via des algorithmes spécialisés pour identifier et interpréter les contenus générés par IA et le plagiat. | 9 €/mois | 100 crédits, détection IA et plagiat, scraping d'URL, accès API, analyse de documents. | 0.9 € |
-/10
|
Suite à notre test, nous avons établi ce podium.
Les 2 détecteurs les plus fiables sont Isgen et Smodin avec des résultats quasi-identiques et une fiabilité de 90%. Ensuite, nous avons l’outil totalement gratuit Binoculars qui est un peu moins précis mais pour lesquels vous ne serez pas limité pour vos requêtes.
En version gratuite, Isgen permet une dizaine de vérification par jour, ce qui est largement suffisant pour beaucoup. Par contre, Smodin limite à 5 demande gratuite par semaine, ce qui peut être limitant et lui fait perdre une place sur notre podium.
Isgen est sans aucun doute l’outil le plus fiable de notre étude avec Smodin. Même s’il n’est pas parfait, il se trompe rarement, sauf pour les textes issus de notre IA Cicéron.
Il est largement meilleur que Binoculars sur les textes IA avec prompts complexes.
Smodin est lui aussi très fiable. Il se trompe rarementmais peut parfois considérer un texte Ia comme humain.
Il est lui aussi largement meilleur que les autres détecteurs sur les textes IA avec prompts complexes.
Ce détecteur d’ia gratuit est un outil issu d’un papier scientifique présent en accès libre sur huggingface et qui ne paie pas de mine. Mais, il s’est avéré particulièrement exact ne sont trompant qu’une seule fois pour les textes issus de LLM (prompt simples). Nous avons utilisé le mode « High Accuracy ».
Pour les textes humains, il les a tous considéré comme humain, même les textes formels de wikipedia ou du gouvernement.
Il faut noter que les datasets utilisés sont composés principalement de textes entre 200 et 300 mots, ce que demande exactement ce modèle de détection pour exceller.
Pour les textes issus de notre modèle LLM Cicéron, il les a considérés comme humain à 90% pour notre modèle premium (article assisté premium), beaucoup moins pour sa version rapide (15 % considérés comme humain).
Une des 2 meilleures options donc, et gratuit en plus. En vous inscrivant sur le site, vous pourrez bénéficier de plus de requêtes.
Scribbr propose un logiciel gratuit en ligne pour détecter l’origine des textes. quillbot.com propose un outil exactement identique (les résultats sont les mêmes) mais payant.
Il se trompe parfois en considérant un texte IA comme humain (notamment avec notre IA Cicéron où 81% des textes étaient humains) mais se trompe rarement pour dire qu’un texte humain est celui d’une IA. Il s’est trompé 2 fois en considérant un texte humain comme celui d’une IA.
C’est donc l’un des outils les plus fiables testé pour ne pas avoir de faux positif et accuser à tort quelqu’un d’avoir utilisé l’IA alors que cela n’est pas le cas.
La plateforme Copyleaks ne se trompe que sur les textes humains “formel” et réalise assez bien la détection de l’IA même avec des prompts complexes. Il détecte généralement les articles de notre IA Cicéron comme humain.
Cependant, le seul à avoir 100% pour les textes IA basiques. Une bonne option !
Beaucoup trop d’erreurs dans nos tests pour l’outil gratuit proposé par NeuralWriter. Il se trompe plus d’une fois sur 2.
Il reconnaît généralement bien les textes issus des LLM avec des prompt simples (“Textes IA basiques”) mais a fait plus d’erreurs que binocular.
Pour les textes issus des datasets “humains” (articles, wikipedia, site gouv.fr…), il se trompe beaucoup trop souvent avec plus de 50% d’erreurs. Il a tendance à tout considérer comme de l’IA !
En conclusion, malheureusement, beaucoup de textes humains sont considérés comme de l’IA. Pas le moins fiable, mais pas du tout le plus fiable.
Quel est le point commun de ces 2 outils ? Ils brillent … par leur humanité. 100 % des textes testés sont considérés comme humains. Ils ne sont donc pas fiables, en tout cas pour les textes en français.
Si writer.com précise que l’outil est optimisé seulement pour l’anglais, pour detecting-ai.com je n’ai trouvé aucune information sur les langues acceptées sur l’outil. Pourtant, le site à une version française.
A éviter donc, sauf si vous souhaitez prouver à votre moitié que votre poème en son honneur n’a pas été généré par une IA.
Aucun outil n’est parfait. Si vous souhaitez faire quelques détections par jour, manuellement (sans API), il y a quelques outils gratuits de qualité.
Si vous souhaitez savoir si un texte que l’on vous a fourni est humain, en ayant le moins de faux négatifs (c’est-à dire un texte humain considéré comme IA), vous pouvez utiliser une combinaison de Isgen, Binoculars et de Scribbr. Ils se trompent rarement en notant un texte humain comme IA, même s’il est formel. Par contre, ils pourront parfois vous dire qu’ un texte IA est humain.
Comme les 3 sont gratuits (limité pour Isgen), vous pourrez lancer facilement une requête sur les 3.
Si vous souhaitez intégrer cette détection dans une application, 3 outils que nous avons testé proposent l’accès à une API.
zerogpt.com, peu fiable, semble proposer l’accès à l’API sans minimum d’achat ou très peu. Copyleaks, largement plus fiable, donne accès à son API uniquement pour les comptes entreprise, les plus onéreux.
La meilleure option API sera bien sûr Isgen (le mieux noté), mais cela se fait sur devis et demande par email uniquement.
Au niveau des options payantes, les écarts de prix sont très importants et nous n’avons malheureusement pas pu les tester pour des raisons de temps et de coûts.
L’outil le plus cher est le seul spécialisé dans le français (lucide.ai) avec un coût de 0.9 cents d’euro pour 1000 mots. Le moins cher en non illimité est Isgen avec un coût de seulement 0.05 € pour 1000 mots. Smodin et Detecting-AI.com sont illimités avec l’abonnement de base.
Il y a également de nombreux outils gratuits qui satisferont les utilisateurs ponctuels qui ont besoin de temps en temps de vérifier l’origine d’un texte. Vous pouvez vous reporter à la note de fiabilité pour chaque outil. Nous avons essayé de la calculer de la manière la plus scientifique durant notre test.
La conclusion est simple : aucun outil testé est fiable à 100%. Le risque serait que les utilisateurs prennent les réponses de ces outils pour argent comptant; sachant que beaucoup d’outils se considèrent fiables à 99%, ce qui n’est, bien entendu, pas le cas.
Dans l’avenir, ces détecteurs vont évoluer, certes, mais moins vite que les LLM. Ils auront toujours un train de retard et gageons que la fiabilité n’atteindra jamais les 99% et sera toujours bien loin.
Nous recommandons donc l’utilisation d’outils comme Isgen, binoculars ou scribbr qui, même s’ils considèrent parfois des textes IA comme humains, se trompent rarement pour l’inverse. Mieux vaut laisser le bénéfice du doute à chaque texte.
Plutôt que se demander si un texte est humain, ne doit-on pas plutôt se poser la question : ce texte vaut-il la peine d’être lu ? Va-t-il me divertir ou m’instruire ?
Et surtout, mon texte généré en partie (ou entièrement) par une intelligence artificielle, va-t-il être pénalisé par les moteurs de recherche ?
La majorité des contenus web étant, en partie ou totalement généré par une IA, de nombreuses questions se posent quant à l’impact potentiel sur le référencement. Google pénalise-t-il réellement les textes générés par IA ?
Google a communiqué le 8 février 2023 de manière transparente sur sa vision du contenu généré par l’IA.
Le moteur de recherche n’entend pas pénaliser spécifiquement les textes rédigés par des outils d’IA, du moment qu’ils répondent à ses critères de qualité : EEAT : Expérience, Expertise, Authoritativeness (légitimité) et Trustworthiness (fiabilité).
L’objectif de Google reste inchangé quelque soit l’origine du texte : récompenser les contenus utiles, originaux, fiables et centrés sur l’utilisateur. L’automatisation, y compris via l’IA, n’est pas interdite. Ce qui est sanctionné, c’est l’utilisation abusive de ces outils dans le but de manipuler le classement, en produisant du contenu superficiel, dupliqué ou non pertinent.
Google insiste donc sur la nécessité de créer un contenu avant tout pour les utilisateurs, et non pour les moteurs de recherche. Ainsi, un texte IA qui n’apporte aucune valeur ou qui est trop générique court le risque d’être considéré comme du “spam”.
Maintenant que l’on connait la version « officielle de google, qu’en est-il dans la réalité ?
Pour aller plus loin, voyons ensemble l’étude réalisée par SemRush via ContentShake IA.
Dans cette étude, 20 000 articles positionnés dans les 20 premiers résultats de Google ont été analysés. Aussi, l’étude s’est renseigné auprès de plus de 700 spécialistes du marketing. L’objectif ? Déterminer si le contenu IA peut se classer aussi bien que du contenu rédigé par des humains.
Cette étude, réalisée fin 2024, nous donne de nombreux enseignements :
Les résultats confirment la position de Google : ce n’est pas la nature automatique ou non du texte qui compte, mais sa valeur intrinsèque. Le contenu IA peut très bien se classer s’il est pertinent, bien optimisé et utile pour l’internaute.
Soulignons néanmoins les limitations de cette étude. Elle n’a été faite que sur des contenus en anglais et un détecteur d’IA a été utilisé pour savoir si un contenu était humain ou non.
Pour optimiser la qualité d’un contenu IA, la première étape consiste à s’aligner sur les critères E-E-A-T de google. Cela implique d’offrir une réelle valeur ajoutée pour votre lecteur :
L’IA tend à produire un contenu générique et prévisible. Pour éviter cela, vous pouvez utiliser des IA spécialisées comme le modèle Cicéron d’Articlum.
Sinon, vous pouvez améliorer le résultat avec :