Mobilité

DALL-E 2 : dicter un texte, l’IA s’occupe d’en faire une

DALL-E 2 : dicter un texte, l’IA s’occupe d’en faire une image


OpenAI est une entreprise reconnue dans le monde de l’intelligence
artificielle dont les travaux sont souvent synonymes de révolution. Elle a
été créée en décembre 2015 en tant qu’association à but non lucratif par
des personnalités comme Elon Musk, Peter Thiel ou Sam Altman avant de
devenir une entreprise à « but lucratif plafonné ».


Elle est particulièrement célèbre pour son intelligence artificielle GPT-2
capable de générer tout ce qui touche à la linguistique avec une précision
étonnante, que ce soit du code informatique, un article de presse ou une
œuvre de fiction et de s’adapter au style souhaité. Une puissance telle que
de nombreux chercheurs estiment que son potentiel de nuisance dans les
mains de personnes mal intentionnées serait bien trop grand.


En juillet 2020, la société a lancé la bêta du GPT-3, encore plus puissante
et capable de traiter 10 fois plus de paramètres que n’importe quel
programme comparable jusqu’à présent. En a découlé le passage du texte à
l’image avec DALL-E capable de réaliser des illustrations à partir d’un
texte.


DALL-E 2 : des possibilités infinies


Le moteur DALL-E n’est pas spécialement mis à disposition du grand public,
mais des applications comme WomboDream fonctionnent sur un principe
similaire. Bien plus puissant que son prédécesseur, DALL-E 2 est capable :


  • D’analyser une description humaine pour reproduire une image (l’inverse du
    système CLIP)
  • Composer une image à partir de zéro
  • Ajouter des éléments à une image existante (en respectant le style, la
    lumière, les ombres…)
  • Générer des variantes stylistiques du résultat
  • Fusionner deux images pour faire apparaître des éléments distinctifs de
    chacune d’entre elles


Le résultat est tout simplement renversant et digne d’artistes humains.
L’image finale peut être générée en 1024 x 1024 pixels soit une résolution
quatre fois supérieure à la première version.

dall e original
images originales servant de bases. © OpenAI

dall e corgi
ajoute un corgi dans le tableau de (droite / gauche). © OpenAI

dall e canape
ajoute un canapé au (fond / premier plan). © OpenAI

dall e perle
redessine la “Jeune Fille à la Perle” (en haut à gauche) dans différents styles. © OpenAI


Des limites nécessaires


De par les quelques exemples précédents, il est évident que des sécurités
doivent être mises en place pour éviter les abus. C’est pourquoi OpenAI se
montrera extrêmement sélectif sur les partenaires qui auront accès à ce
projet.


En plus de cela, DALL-E 2 ne pourra pas traiter les images suivantes :


  • Tout ce qui est basé sur un nom de personne réelle
  • les images destinées à
    un public adulte
  • tout ce qui touche de près ou de loin aux
    « conspirations »
  • en rapport avec des événements géopolitiques en cours.


Le but est d’éviter de générer des deep-fakes ou de la désinformation
(comme des images fausses du conflit entre la Russie et l’Ukraine). Toutes
ces sécurités ont été mises en place, car OpenAI est parfaitement conscient
du potentiel de nuisance de son intelligence artificielle.

A lire aussi :


Source : OpenAI


Source link

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page