Comment m'assurer qu'un texte littéraire n'a pas été écrit par une IA ?
Question d'origine :
L'IA fait peur... Demain, si je lis un roman d'un tout nouveau crack de la littérature française, comment puis-je être certain que c'est bien lui qui l'a écrit (et pas une IA ou des ghostwriters) ? Admettons qu'il soit crédible durant les interviews, qu'il s'exprime bien (etc.) car ce serait un type malin !....
Comment puis-je en être absolument certain ? Est-ce seulement possible ?
Merci d'avance et meilleures salutations,
Road66
Réponse du Guichet
Il n'est pas aisé de détecter un roman écrit par l'intelligence artificielle. Diverses solutions ont été développées ou sont en train de l'être pour différencier ce qui découle de l'humain et de l'IA.
La solution reste tout de même la prudence et la lecture attentive pour détecter les formules types produites par l'IA.
Bonjour,
L’IA suscite de nombreuses questions et pose la problématique de la production écrite.
Ainsi, le journaldugeek.com consacre un article à l’iA, "comment repérer un livre écrit par chat Gpt" dont nous vous présentons des extraits :
Les livres écrits grâce à l’intelligence artificielle polluent les librairies en ligne. Voici comment les repérer d’un simple coup d’œil.
Vérifiez les critiques
Si le livre est le fruit d’un travail humain, sa fiche produit devrait arborer quelques critiques de lecteurs et de lectrices. Dans le cas d’un roman rédigé par ChatGPT ou Bard, il y a des chances pour que les commentaires avant vous aient déjà soulevé la possibilité d’une intelligence artificielle. À moins que les critiques aient elles-mêmes été rédigées par une IA. Un détail qui n’est généralement pas très dur à repérer : toutes les phrases sont construites de manière similaire.
(..)
Observez le style d’écriture
C’est sans doute la manière la plus simple de reconnaître une intelligence artificielle dans un roman de fiction. Les chatbots ont beau être de plus en plus cohérents et efficaces dans leur rédaction, ils ne parviennent pas encore à imiter l’humain sur la durée. Il faudra donc s’armer de patience et de concentration pour repérer les tournures de phrases étranges, les formulations approximatives et les constructions identiques. Attention toutefois, ces défauts d’écriture ne sont pas des preuves irréfutables, mais de simples pistes susceptibles de vous mettre la puce à l’oreille.Libération explique comment détecter qu’un texte a été écrit par l’intelligence artificielle et relate notamment le cas d’étudiants ayant rédigé leur dissertation grace à l’Ia :
https://www.liberation.fr/checknews/chatgpt-comment-detecter-quun-texte-a-ete-ecrit-par-lintelligence-artificielle-20230114_FEFOSL2JCJAWBIDGDJEQOPGUSE/
Dans l’affaire lyonnaise, c’est toutefois l’homogénéité dans la structure des textes qui a mis la puce à l’oreille de l’enseignant. De fait, quand bien même elle proposerait 100 nuances de réponses à une même question, la machine suit toujours plus ou moins la même recette, inspirée de milliers modèles disponibles en ligne.
(…)
La caractéristique principale des modèles de langage utilisés par les IA reste «l’illusion d’exactitude», comme l’observait mi-décembre Melissa Heikkilä, journaliste à la MIT Technology Review, spécialisée dans les questions d’IA. «Les phrases qu’elles produisent semblent correctes – elles utilisent les bons types de mots dans le bon ordre. Mais l’IA ne sait pas ce que cela signifie. Ces modèles […] n’ont pas la moindre idée de ce qui est correct ou faux, et ils présentent avec assurance des informations comme vraies, même si elles ne le sont pas…»
(…)
Dans une étude parue en 2020, une équipe de chercheurs rattachés à l’Université de Pennsylvanie et au laboratoire Google Brain dédiée au «deep learning» observe que ces textes abusent de mots impersonnels, et n’utilisent que peu de mots «rares» (argot, langage soutenu…). Les textes produits par des IA sont également écrits… sans fautes de frappe.
Des logiciels de détection de plagiat sont déjà employés par les universités pour identifier les «emprunts» à des textes présents en ligne dans des productions d’étudiants. Des dispositifs analogues sont en cours de développement pour reconnaître le «style» si particulier des IA
(…)
En somme, on demande aux IA de dépister des IA. Parmi ces outils, on peut citer le GPT-2 Output Detector, d’utilisation très intuitive, créé en 2019 dans le cadre d’un projet «pour une diffusion responsable, par étapes, de GPT-2» porté par OpenAI. Mais aussi l’extension de navigateur Chrome GPTrue or False, le Giant Language Model Test Room (GLTR), développé par une équipe de Harvard en partenariat avec IBM, ou encore le CTRL-detector, développé par l’éditeur de logiciels Salesforce. Des outils essentiellement développés et évalués sur des corpus anglophones, et dont certains sont particulièrement performants
En outre, Fabrice Colin et Léonard Desbrières écrivaient dans "La littérature à l’épreuve de l ’intelligence artificielle", Lire Magazine, 1er juin 2023.
la qualité d’un roman écrit par ChatGPT pourrait ne pas être aussi élevée ou originale que celle d’un roman écrit par un auteur humain expérimenté et créatif.» UNE NOUVELLE FAÇON D'ÉCRIRE DE MAUVAIS TEXTES Si l’emploi du conditionnel laisse songeur, il appelle aussi à redéfinir l’essence même de la littérature :non pas un simple artisanat, résultant d’un apprentissage zélé ou d’une méthode applicable par tout un chacun, mais bel et bien un art, habité par le génie de l’homme. À cet égard, les limites de ChatGPT sont criantes. «Une intelligence artificielle générique qui surpasserait ou même juste imiterait toutes les capacités d’un être humain ne peut être développée en utilisant les techniques mathématiques et statistiques que nous avons utilisées ces soixante dernières années», explique le ••• spécialiste Luc Julia, qui lui préfère le terme d’«intelligence augmentée». Bâtir une histoire avec des instructions précises ? Oui. Accoucher d’un chef-d’œuvre crédible ? Plus compliqué.
Quand on demande à ChatGPT de fournir un texte «dans l’esprit»des Chants de Maldoror de Lautréamont, le résultat n’évoque rien de plus qu’une copie de lycéen médiocrement inspiré:«Je suis l’ombre qui marche dans la nuit/Le vent qui souffle sans répit/Je suis la douleur qui ne s’apaise pas/Le cri qui déchire le silence de la voix/Je suis le rêveur qui erre sans but/Lefou qui danse sous la lune/Je suis l’amour qui brûle et consume/La passion qui dévore tout.»La poésie, cette «salve contre l’habitude»comme l’écrivait Henri Pichette, est affaire de fulgurances, de lâcher-prise, de trébuchements, de cruauté, de grâce et de visions-toutes choses dont une IA (et même s’il semble malaisé, à ce jour, de prédire à quel point cet outil, qui ne cesse de s’améliorer et d’apprendre de ses «erreurs», pourra progresser dans l’art du mimétisme) ne peut avoir idée.
Dans l’édition du 13 mars 2023, Le Figaro publie l’article "ChatGPT est-il écrivain ?" dans lequel Alice Develey s’intéresse à la création et à la commercialisation d’un ouvrage jeunesse conçu via l’intelligence artificielle.
En contradiction avec les articles cités ci-dessus abordant l’intervention de l’iA dans le processus d’écriture, elle montre qu’il n’est pas aussi aisé de repérer qui fait quoi :
Il est très difficile à l'heure actuelle de reconnaître un texte produit par ChatGPT, y compris par des spécialistes. Des personnes travaillant elles-mêmes sur ChatGPT ont tenté de déceler des textes écrits par l'IA. Résultat ? Elles ont cru détecter plus de textes écrits par la machine que par l'humain, or, dans les faits, ils étaient bien moins nombreux. Néanmoins, l'aspect « encyclopédique, souvent peu contextualisé » de certains textes, précise Laurence Devillers, peut être une signature de la machine. Si l'on demande à ChatGPT d'écrire une fiction, le texte sera « souvent sans nuance et sans originalité ». Et c'est le deuxième problème posé par la machine.
Les mots de ChatGPT suivent des schémas de pensée, des équations, réduisant la langue à une somme d'opérations mathématiques. Or, comme le notait Barthes, « le langage est une peau : (on) frotte son langage contre l'autre ». En clair, nous parlons et nous sommes influencés par nos expériences, nos émotions. «Si les modèles de langage peuvent donner l'impression de converser via du langage humain, analyse Giada Pistilli, chercheuse en éthique de l'IA à la Sorbonne, il serait faux de dire qu'ils disposent de toutes ses caractéristiques. » Le danger réside dans la tentation d'anthropomorphiser ChatGPT, de lui prêter des caractéristiques humaines alors même qu'il s'agit d'un programme informatique. L'écriture n'est pas qu'une suite de données. C'est pourquoi mettre sur le même plan l'IA et l'écrivain pose un problème non seulement éthique, mais aussi artistique.
« Le robot imite, l'écrivain crée »
La machine peut-elle véritablement créer ? Ammaar Reshi répond oui. « Je n'ai rien écrit, ChatGPT si. Je me vois plutôt comme un éditeur, un directeur artistique. » Faut-il donc parler de « conception » d'un texte par l'IA dans ce cas ? Ou de « génération » , comme le propose Giada Pistilli, puisque l'appareil « génère du texte à partir d'autres textes et que cela n'a rien de créatif » ? On ressent un certain flottement sémantique chez les spécialistes, et les avis divergent. Cette question de vocabulaire est pourtant importante parce qu'elle suppose alors des droits d'auteur à la machine.
Pour l'heure, l'IA ne peut prétendre à aucun droit d'auteur. Pour cela, « on doit être en présence d'une « oeuvre » d'une part, celle-ci devant être « originale » d'autre part » , lit-on dans un article de Christophe Geiger, président de l'Association internationale pour l'avancement de l'enseignement et de la recherche en propriété intellectuelle, dans la revue Propriété intellectuelle. « Comme aux États-Unis, la notion d'oeuvre n'est pas définie par le législateur français, européen ou international ; il est cependant communément admis qu'une intervention humaine est nécessaire pour que l'on soit en présence d'une oeuvre à protéger, au sens du droit d'auteur. » Cela veut-il dire qu'il faille protéger les créations de l'IA ? « Que resterait-il alors comme espace pour créer à l'écrivain ? » , s'interroge pour sa part Michel Vivant. La question reste ouverte. Mais, en tout état de cause, la création est le propre de l'homme. Ce que l'écrivain Bernard Werber défend en une phrase : « Le robot imite, l'écrivain crée. » En 2015, l'auteur a sorti Depuis l'au-delà, dans lequel un écrivain mort continue de publier des livres grâce à un système d'IA qui a pu récupérer toute sa production écrite. Aujourd'hui, la réalité a rattrapé la fiction. De quoi s'en effrayer ? « J'ai testé l'outil, il a fait un texte dans lequel il parle de fourmis. Il me copie, donc, mais il ne sait pas ce que je vais écrire. » En somme, l'écrivain a toujours un pas d'avance, grâce à son imagination ou à ses intuitions. « ChatGPT peut remplacer les écrivains remplaçables, la littérature de type Harlequin, avec des mécanismes déjà établis. Tout ce qui obéit en vérité à des bibles préfabriquées. »
Le facteur humain
Moins qu'une menace, Bernard Werber voit un certain bénéfice à l'IA. « À cette époque où beaucoup de livres se ressemblent, ChatGPT va nous obliger à nous démarquer, à faire preuve d'innovation et d'originalité. » L'auteur de thrillers Bernard Minier est plus réservé. « Les écrivains ne partent pas de la pure imagination, qui n'existe pas, mais de la réalité, qu'ils transcendent. Franck Thilliez a demandé à ChatGPT d'écrire une histoire à ma manière avec le mot ardoise ; en quelques secondes, il avait composé quatre pages de synopsis, assez médiocres, mais qui parlaient d'un tueur nommé Ardoise. Ce qui veut dire qu'il a lu mes livres. » Et d'ajouter : « Jorge Luis Borges a dit que l'imagination est un mélange de mémoire et d'oubli. Or, si l'IA a lu 1 million de fois plus que les écrivains... »
Repérer l’intervention de l’IA n’est donc pas évident et le fait que Rie Rudan ait reçu en 2024 le prix Akutagawa au Japon le démontre. Celle-ci a en effet expliqué qu’environ 5% de son roman avait été écrit par l’intelligence artificielle (voir à ce sujet , "Au Japon, la lauréate d’un prix littéraire reconnaît que ChatGPT a écrit une partie de son roman", Télérama, jeudi 18 janvier 2024)
La question de la différenciation entre IA et humain a été abordée sur les sites suivants:
numerama.com
futura-sciences.com
lemonde.fr
Enfin, à partir d’Europresse, vous pourrez parcourir de nombreux articles à ce sujet dont :
Cohen, Claudia, "Le fléau des livres écrits par l'IA fait trembler les auteurs", Le Figaro, no. 24607, mardi 3 octobre 2023
Chantal Guy, "ChatGPT, auteur primé ?" La Presse. Arts, samedi 27 janvier 2024.