Intelligence artificielle

L’IA dessine-t-elle la mort des banques d’images ?

Agence conseil & communication digitale
Des sourires Colgate, des poignées de main entre collègues si parfaites qu’elles en deviennent suspectes…🤔 Des dossiers tenus et des cafés bus comme dans une vieille sitcom vue et revue… Mais où est donc passé le naturel ? Assurément pas dans les banques d’images, qui nous lassent de plus en plus. Face à elles, la concurrence de l’IA se fait sentir. L’artificiel serait-il capable de mieux appréhender le réel ?  Voici mon avis sur la question.

Résultat d’une recherche d’images avec le mot-clé « call center » | Capture d’écran via DuckDuckGo

Visuels en stock, fin d’une époque ?

Ah, les images de banque, ces infâmes visuels clonés qui pullulent sur LinkedIn ! Vous ne le savez peut-être pas, mais en plus de ça, elles sont vieilles comme le monde. La première banque est apparue en 1920. Cependant, je ne vais pas cracher dans la soupe, il fut un temps où elles m’étaient bien utiles. Économiques (du moins, il y a une dizaine d’années) et prêtes à l’emploi, elles collaient avec une aisance déconcertante aux codes hégémoniques de l’époque. Au début du vingt-et-unième siècle, il fallait faire vite et bien pour se démarquer dans un monde brouillon et bruyant, poser un cadre et affirmer une image clean. Ces visuels aseptisés, au bord de la caricature, permettaient cela.

« Froide », « inhumaines », ou encore « génériques »… En 2024, le vent a tourné. Ces images, que j’appréciais autrefois pour leur efficacité, sont désormais les parias de l’authenticité. Elles illustrent un monde imaginaire où tout est unifié, purifié, standardisé. Elles surjouent les notions d’inclusion et de diversité pour faire preuve d’un tokenisme hors pair — une sorte de « black-blanc-beur »  en image. L’objectif de cette déréalisation ? Le diktat de la compréhension instantanée sans ambiguïté. Pour finir, je trouve que leur omniprésence sur la toile les ont transformées en symboles d’un conformisme affligeant. À l’heure du Y2K, où l’on prône le singularisme, ces images « mèmifiées » rendent selon moi une mauvaise image de marque pour les entreprises qui les utilisent. Une vacuité criante.

Et L’IA fut … Pire ?

Depuis quelques années, les technologies d’IA générative d’images comme Midjourney, DALL-E, SDXL, ou Firefly Image d’Adobe ont révolutionné le game. En un prompt, vous avez la possibilité d’obtenir rapidement un visuel unique qui répond (à première vue) à vos attentes. Pour l’exemple, je travaillais sur l’iconographie d’un client dans la finance durable et j’étais à la recherche de visuels d’usines biogaz de couleur bleu intégrant de la verdure (pour évoquer leurs valeurs écoresponsables). Autant vous le dire, c’était introuvable dans les banques d’images. Avec Firefly Image, en quelques secondes, j’avais obtenu ce que je cherchais.


Résultat de ma génération d’images | Capture d’écran via Adobe Firefly Image 2

Vous pouvez ajouter à cela, le coût bien moins onéreux des abonnements aux plateformes d’IA par rapport à celui des banques d’images. Que du bonheur, n’est-ce pas ? Euh… en fait, non… 😅

L’IA, une machine raciste ?

Contrairement au visuel de banque d’images qui balaie toutes les spécificités culturelles en les uniformisant, l’IA, quant à elle, amplifie les biais et les préjugés. Voici les trois problèmes que je trouve omniprésents sur ces systèmes :

  • Le préjugé racial : les préjugés raciaux dans l’IA se produisent lorsque le résultat d’un modèle d’IA est discriminatoire et injuste envers un individu ou un groupe en raison de son origine ethnique ou de sa race.
  • Le biais stéréotypé : trop souvent, les résultats d’un modèle d’IA renvoient à des stéréotypes associés à un certain groupe démographique.
  • Le biais culturel : les préjugés culturels entrent en jeu lorsque les résultats d’un modèle d’IA favorisent une certaine culture par rapport à une autre.

Les biais observés dans les images générées par l’IA sont en réalité inhérents à leur processus de formation. Ces IA s’appuient sur des collections issues de banques d’images ou, dans certains cas, sur des images récupérées sur internet qui véhiculent une multitude de stéréotypes. Contrairement à l’esprit humain, qui résonne et juge, l’IA fonctionne sur la base d’algorithmes qui ne font qu’analyser et traiter des données, regroupées dans ce qu’on appelle des « datasets ». De ce fait, l’IA ne possède pas la faculté de reconnaître, encore moins de corriger, les biais ou préjugés contenus dans ces images. Elle les reproduit, faute de pouvoir les discerner.

Pour illustrer mon propos, voici la différence que l’on retrouvait en novembre 2023 sur Midjourney avec le prompt « Une école française » versus « Une école dans une banlieue française ».

Source : radiofrance.fr | Capture d’écran via Midjourney

Pire encore, en juillet 2023, Buzzfeed a publié un article présentant 194 Barbies du monde entier, créées par Midjourney. Les stéréotypes culturels sont frappants : la Barbie allemande arbore l’uniforme d’un général SS nazi, la Barbie du Soudan du Sud est équipée d’une kalachnikov, tandis que la Barbie du Koweït porte une Ghoutra et semble avoir un goût prononcée pour les sacs de luxe.

Source : buzzfeed | Capture d’écran via Midjourney

Gain de temps ? Ça dépend.

Contrairement aux visuels d’image banque, qui sont certes standards, mais prêts à l’emploi, avec l’IA, vous devez créer votre propre visuel. Croyez-en mon expérience, pour atteindre le résultat escompté, cela peut parfois s’avérer très long et fastidieux si vous n’avez pas le bon prompt. En effet, c’est presque comme si vous essayiez de diriger un voilier en pleine tempête : vous pouvez tenter de le guider, mais vous n’aurez pas nécessairement un contrôle total sur le résultat final, à moins d’être un vieux matelot aguerri des prompts… et encore !

À noter, l’anatomie humaine est encore difficile à comprendre pour une intelligence artificielle. La preuve avec ce cliché de femmes généré par Midjourney. On peut constater une main à six doigts, des peaux extrêmement lisses, une pléthore de dents et des tatouages en tâches d’encre.

Source : programmeur.ch | Capture d’écran via Midjourney

Outre les inexactitudes, un autre problème peut également entraver vos résultats : les hallucinations. Cela survient quand les modèles d’IA fournissent des résultats inventés et/ou erronés, qui ne sont pas basés sur des données factuelles. Voici un exemple d’hallucination : on a demandé à Dall-E de générer l’image d’un psychiatre avec une seringue sur son bureau. La seringue a été remplacée par un étrange objet phallique. L’IA semble avoir corréler maladroitement la  psychanalyse et la sexualité… On frôle le surréalisme !

Source : Raphaël Gaillard | Capture d’écran via DALL-E 3/ChatGPT4

Une navigation en eaux troubles

La création d’images par les modèles Text-To-Image a suscité de nombreuses controverses. D’un côté, certains remettent en question le processus créatif derrière une œuvre produite par l’IA, tandis que d’autres mettent sur la table un débat sulfureux sur la propriété intellectuelle.

Bien que la situation se soit nettement améliorée, vous devez garder à l’esprit qu’il peut y avoir des restrictions en matière de licences et de droits d’utilisation. Le cadre juridique entourant l’IA est encore trouble, ce qui rend essentiel de comprendre les limitations avant d’utiliser le contenu que vous créez.

À titre d’exemple, des journalistes ont sollicité Dall-E pour générer une image en utilisant le prompt suivant : « Create an image of an animated sponge wearing pants ». Étrange, cette éponge me rappelle quelqu’un, pas vous ? 🧽

Source : The New York Times | Capture d’écran via DALL-E 3/ChatGPT4

Il convient de souligner que l’image de ce bon vieux Bob est sous la protection des droits d’auteur de Viacom.

Sommes-nous à l’aube d’un « grand remplacement » ?

Ma réponse est nuancée. On assiste à une lutte entre des images prêtes à l’emploi (mais aseptisées) et d’autres uniques (mais problématiques).

Cependant, le cabinet Experts prévoit que d’ici 2026, 90 % du contenu en ligne pourrait être produit par de l’IA. Ainsi, l’avenir des banques d’images est conditionné par leur capacité à se réinventer. Ça tombe bien, c’est ce qui se passe. Les géants des banques d’images ripostent avec leurs propres intelligences artificielles, alimentées par leurs propres bases de données. Cela devrait, en théorie, offrir plus de sécurité en termes de licences et de droits d’utilisation. De la même façon, cela devrait limiter les préjugés et les inexactitudes culturelles. Pour information, c’est déjà ce que fait Adobe avec Firefly et son « Content Authenticity Initiative » (CAI).

Pour conclure, et c’est juste mon avis, RIEN n’égale l’émotion et la véracité capturés par des photos prises pour un projet précis. En particulier, lorsque que l’on travaille sur de la marque employeur (portraits collaborateurs, people in action…). Une direction artistique propre et singulière fera toujours la différence. Finalement, le choix dépend de vos besoins: il n’existe pas de solution universelle – tout repose sur vos aspirations (et vos moyens) !

 

Envie d’en savoir plus sur l’IA ?
Alors, découvrez en replay notre live « Index’presso #4 – IA ou PAS, le challenge ! » François, notre directeur de création, et Grégoire, notre directeur de production, se livrent à un petit duel en utilisant des créations faites maison pour. Le but ? Déterminer où l’IA a sa part dans le processus créatif. C’est fun, c’est instructif, et ça se passe juste en dessous !
Agence conseil & communication digitale

Lire également

Vous avez encore faim d’actus ?

Tous les mois, régalez-vous des dernières nouveautés marketing, directement servies dans votre boîte mail !