- DALL-E 3 est un outil incroyable pour le brainstorming visuel et la génération de concepts pour les designers.
- DALL-E 3 est utilisé via ChatGPT, il est plus important que jamais de comprendre comment vos mots aident ces outils à générer des résultats.
- L'utilisation de DALL-E 3 (ainsi que de toute IA générative) s'accompagne de plusieurs préoccupations éthiques car les capacités de la plupart sont construites sur le dos d'artistes travailleurs qui n'ont jamais autorisé l'utilisation de leur travail à des fins de formation.
Le monde de l'intelligence artificielle (IA) est en effervescence avec les progrès des modèles génératifs, en particulier dans le domaine de la génération d'images. L'un des développements les plus significatifs dans ce domaine est l'émergence de DALL-E 3, un générateur d'images piloté par l'IA qui redéfinit notre façon de percevoir et de créer du contenu visuel. Dans cet article de blog, nous allons plonger dans les subtilités de DALL-E 3, ses capacités et l'impact profond qu'il a sur les mondes de l'art, du design et au-delà.
Le phénomène DALL-E 3
DALL-E 3, développé par OpenAI, est le successeur du modèle DALL-E original, qui s'inspirait de l'artiste surréaliste Salvador Dalí et du personnage de Pixar WALL-E. Contrairement à son prédécesseur, DALL-E 3 a porté le concept d'IA générative à de nouveaux sommets, offrant un niveau de détail et de contrôle sans précédent sur les images générées.
À lire aussi: Demis Hassabis: le cofondateur de DeepMind était un prodige des échecs, puis un pionnier de l'IA
Capacités et fonctionnalités
Génération d'images haute résolution: DALL-E 3 est capable de produire des images à une résolution qui rivalise avec les œuvres d'art créées par l'homme. Ce saut qualitatif ouvre de nouvelles possibilités pour les artistes et designers numériques.
Synthèse texte-image: Les utilisateurs peuvent décrire une scène, un objet ou un concept en texte, et DALL-E 3 générera une image qui encapsule cette description. Cette fonctionnalité a des implications profondes pour l'accessibilité dans l'art et le design.
Contrôle des attributs: DALL-E 3 permet aux utilisateurs de spécifier certains attributs des images générées, comme le style, l'ambiance ou même les conditions d'éclairage. Ce niveau de contrôle change la donne pour la création de contenu personnalisé.
Modifications et itérations: Le modèle peut prendre une image existante et appliquer des modifications ou des variations en fonction des entrées de l'utilisateur. Ce processus itératif peut conduire à la création de contenu visuel unique et raffiné.
Sorties multimodales: DALL-E 3 peut générer des images qui combinent différents concepts, styles et éléments, créant une sortie multimodale auparavant inimaginable.
Comment utiliser le générateur d'images DALL-E 3 ?
S'inscrire et payer
Commencez par un compte pour le ChatGPT standard. Si vous n'en avez pas, utilisez un compte Apple, Google ou Microsoft, ou créez un identifiant avec une adresse e-mail et un mot de passe fort. Il n'y a pas d'option d'authentification multifacteur à ce stade.
Une fois connecté, vous verrez « Upgrade Plan » en bas à gauche, ou le menu en haut indiquant ChatGPT 3.5, qui propose de passer à GPT-4/Upgrade to Plus. L'un ou l'autre affichera cet écran, avec l'option Upgrade to Plus.
Préparer la discussion
Contrairement à DALL-E 2 qui avait sa propre interface, DALL-E 3 n'est qu'un autre aspect de ChatGPT 4, où vous envoyez un « message » et le chatbot répond. Heureusement, avec GPT-4, vous pouvez avoir une conversation continue pour modifier/adapter/améliorer ce qu'il génère pour vous. Cela inclut les images. Sur ChatGPT Plus premium, les invites sont limitées à 4 000 caractères, soit environ 500 mots.
Le prompt parfait
Les prompts de conception comportent à la fois des termes de contenu (ce que vous voulez voir) et des modificateurs de style (à quoi cela devrait ressembler). Par exemple: « Un robot dessinant une peinture sur un chevalet » est du contenu, mais « vue par-dessus l'épaule, coloré, peinture à l'huile, dans le style de Van Gogh » sont tous des modificateurs. Vous pouvez également utiliser plusieurs autres modificateurs pour améliorer la qualité, concentrer DALL-E sur des éléments particuliers ou simplement ajouter un peu de créativité.
Utilisez des mots émotionnels pour obtenir une image plus positive ou négative et définir l'ambiance ou l'esthétique.
À lire aussi: Qu'est-ce que Perplexity AI ?
Modifier les tailles et conserver les styles
Avec DALL-E 3, vous n'obtenez qu'une seule image par prompt par défaut. Cependant, vous pouvez spécifier qu'il en génère jusqu'à 10 à partir d'un seul prompt. Ou vous pouvez entrer plusieurs prompts uniques dans la discussion pour recevoir plusieurs images, chacune exclusive à son prompt, pas toutes des variations sur la même formulation.
Les images de DALL-E arrivent par défaut dans un carré de 1024×1024 pixels. Cependant, vous pouvez spécifier qu'elle soit plus haute (1792×1024) ou plus large (1024×1792) en utilisant ces nombres dans le prompt ou en disant « orientation portrait » ou « orientation paysage ».
Que faire si vous voulez une version à plus grande échelle de la même image ? Dites simplement quelque chose comme « Upscale this image 2x using a code interpreter ».
Si vous souhaitez reproduire le style d'une image plus tard avec un contenu différent, demandez à ChatGPT les « gen_ids » (abréviation de Generation ID) de l'image la plus récente.
DALL-E 3 représente un bond en avant significatif dans le domaine de l'IA et de la génération d'images. Alors que nous sommes à l'aube d'une nouvelle ère de créativité, il est impératif d'embrasser le potentiel de cette technologie tout en étant conscients des considérations éthiques qu'elle présente. L'avenir de l'art et du design s'écrit sous nos yeux, et DALL-E 3 joue un rôle central dans la construction de ce récit.
À mesure que la technologie continue d'évoluer, il sera fascinant de voir comment DALL-E 3 et d'autres modèles d'IA générative transformeront notre façon de créer, de percevoir et d'interagir avec le contenu visuel. Les possibilités sont aussi vastes que l'imagination humaine, et le voyage ne fait que commencer.

