Générer des images
L'IA qui crée des images
Depuis 2022, des outils permettent de créer des images à partir d'une simple description. Tu écris ce que tu veux voir. L'IA le crée en quelques secondes. Paysages, portraits, logos, illustrations, photos réalistes — tout est possible.
Ces outils fonctionnent différemment des IA de texte. Ils utilisent des modèles de diffusion. Imagine une image très floue que l'on affine petit à petit jusqu'à ce qu'elle corresponde à la description. Le résultat est souvent bluffant.
Les principaux outils
Midjourney
Le plus artistique. Rendu très esthétique, style "illustration premium". Fonctionne via Discord. Payant (~10€/mois). Référence pour la qualité artistique.
midjourney.comDALL-E (ChatGPT)
D'OpenAI, intégré à ChatGPT. Très simple à utiliser. Rendu plus "illustratif". Crédits gratuits limités, puis payant.
chatgpt.comStable Diffusion
Open-source. Peut s'installer sur son ordinateur (gratuit) ou s'utiliser en ligne via DreamStudio. Très flexible, un peu plus technique.
stability.aiAdobe Firefly
D'Adobe. Utile si tu utilises déjà Photoshop ou Illustrator. Entraîné sur des images libres de droits — plus sûr pour un usage commercial.
firefly.adobe.comImagen (Gemini)
De Google, intégré directement dans Gemini. Gratuit. Tu décris ton image dans la conversation, Gemini la génère. Très accessible — pas besoin de compte spécial.
gemini.google.comIdeogram
Spécialisé dans les images avec du texte intégré — logos, affiches, typographie. Là où les autres outils ratent souvent les lettres, Ideogram les gère proprement. Gratuit avec crédits quotidiens.
ideogram.aiPour commencer : Le plus simple est Imagen via Gemini — gratuit, pas d'inscription supplémentaire, tu génères dans la conversation. Pour la qualité artistique, Midjourney reste la référence. Pour un logo ou une affiche avec du texte, utilise Ideogram.
Comment écrire un bon prompt image
Le prompt pour les images fonctionne différemment du prompt texte. Pour Midjourney et Stable Diffusion, c'est une liste de descripteurs séparés par des virgules — pas une phrase complète. Pour DALL-E, une description naturelle fonctionne mieux.
Structure d'un prompt image efficace
Structure[Sujet principal] [action/pose] [contexte/lieu],
[style artistique], [ambiance/lumière],
[palette de couleurs], [qualité technique]
Exemple portraitA young French woman sitting in a Parisian café,
reading a book, soft natural light from the window,
warm golden tones, impressionist painting style,
fine brushstrokes, high detail
Exemple paysageMisty mountain forest at dawn, pine trees,
rays of sunlight through fog, cinematic photography,
f/1.8 bokeh, blue and gold color palette,
hyper realistic, 8k resolution
Exemple illustrationMinimalist vector logo for a bakery,
croissant and coffee cup, pastel colors,
clean lines, modern design, white background
Les mots-clés de style qui changent tout
Certains mots-clés ont un impact énorme sur le rendu. Voici les plus utiles :
Style photographique
cinematic photography, portrait photography, product photo, bokeh, f/1.8 aperture, golden hour lighting, studio lighting
Style artistique
oil painting, watercolor, impressionist, digital art, concept art, anime style, 3D render, pixel art
Qualité technique
high detail, 8k resolution, hyperrealistic, sharp focus, professional, award-winning
Ambiance / lumière
soft light, dramatic lighting, neon lights, candlelight, sunset, moody, bright and airy
Cas d'usage pratiques
- Post réseaux sociaux : illustration pour un article, visuel pour Instagram
- Présentation professionnelle : images d'ambiance pour illustrer des slides
- Logo / identité visuelle : point de départ (à peaufiner avec un graphiste)
- Mockups : visualiser un produit ou un concept avant de le créer
- Avatars / profils : photo de profil stylisée ou illustrée
- Fond d'écran : images personnalisées et uniques
Les limites importantes
Les mains et les textes : les IA ont encore du mal avec les mains (trop de doigts, doigts tordus) et les textes dans les images (lettres déformées). C'est en cours d'amélioration mais ça reste un problème courant.
La cohérence : générer plusieurs images d'un même personnage avec le même look est difficile. Chaque génération repart de zéro.
Le droit d'auteur : ces outils ont été entraînés sur des œuvres existantes, ce qui pose des questions légales non encore résolues. Pour un usage commercial, préfère Adobe Firefly, entraîné sur des images libres de droits.
Ne génère jamais de photos réalistes de vraies personnes sans leur accord. C'est une violation de la vie privée et potentiellement illégal (usurpation d'identité, deepfakes).
Modifier et améliorer une image existante
Les outils modernes ne créent pas seulement de zéro — ils peuvent aussi modifier des images existantes :
- Inpainting : effacer une partie de l'image et la remplacer par autre chose
- Outpainting : étendre une image au-delà de ses bords d'origine
- Style transfer : appliquer le style d'une image à une autre
- Upscaling : augmenter la résolution d'une image floue ou petite
Adobe Photoshop intègre maintenant ces fonctions directement via Firefly.
- Principaux outils : Imagen/Gemini (gratuit), DALL-E (ChatGPT), Midjourney (artistique), Firefly (Adobe), Stable Diffusion (open-source)
- Prompt image = liste de descripteurs : sujet, style, ambiance, qualité
- Mots-clés puissants : "cinematic", "oil painting", "hyperrealistic", "golden hour"
- Faiblesses : mains, textes dans l'image, cohérence de personnage
- Usage commercial → préférer Adobe Firefly (images libres de droits)
- Jamais de photos réalistes de vraies personnes sans accord