Leçon 4 / 8
Leçon 04 · Partie 2 — IA pratique

Générer des images

L'IA qui crée des images

Depuis 2022, des outils permettent de créer des images à partir d'une simple description. Tu écris ce que tu veux voir. L'IA le crée en quelques secondes. Paysages, portraits, logos, illustrations, photos réalistes — tout est possible.

Ces outils fonctionnent différemment des IA de texte. Ils utilisent des modèles de diffusion. Imagine une image très floue que l'on affine petit à petit jusqu'à ce qu'elle corresponde à la description. Le résultat est souvent bluffant.

Les principaux outils

🎨

Midjourney

Le plus artistique. Rendu très esthétique, style "illustration premium". Fonctionne via Discord. Payant (~10€/mois). Référence pour la qualité artistique.

midjourney.com
🖼️

DALL-E (ChatGPT)

D'OpenAI, intégré à ChatGPT. Très simple à utiliser. Rendu plus "illustratif". Crédits gratuits limités, puis payant.

chatgpt.com

Stable Diffusion

Open-source. Peut s'installer sur son ordinateur (gratuit) ou s'utiliser en ligne via DreamStudio. Très flexible, un peu plus technique.

stability.ai

Adobe Firefly

D'Adobe. Utile si tu utilises déjà Photoshop ou Illustrator. Entraîné sur des images libres de droits — plus sûr pour un usage commercial.

firefly.adobe.com
🔵

Imagen (Gemini)

De Google, intégré directement dans Gemini. Gratuit. Tu décris ton image dans la conversation, Gemini la génère. Très accessible — pas besoin de compte spécial.

gemini.google.com
🔤

Ideogram

Spécialisé dans les images avec du texte intégré — logos, affiches, typographie. Là où les autres outils ratent souvent les lettres, Ideogram les gère proprement. Gratuit avec crédits quotidiens.

ideogram.ai

Pour commencer : Le plus simple est Imagen via Gemini — gratuit, pas d'inscription supplémentaire, tu génères dans la conversation. Pour la qualité artistique, Midjourney reste la référence. Pour un logo ou une affiche avec du texte, utilise Ideogram.

Comment écrire un bon prompt image

Le prompt pour les images fonctionne différemment du prompt texte. Pour Midjourney et Stable Diffusion, c'est une liste de descripteurs séparés par des virgules — pas une phrase complète. Pour DALL-E, une description naturelle fonctionne mieux.

Structure d'un prompt image efficace

Structure type (Midjourney / Stable Diffusion)
Structure[Sujet principal] [action/pose] [contexte/lieu],
[style artistique], [ambiance/lumière],
[palette de couleurs], [qualité technique]

Exemple portraitA young French woman sitting in a Parisian café,
reading a book, soft natural light from the window,
warm golden tones, impressionist painting style,
fine brushstrokes, high detail

Exemple paysageMisty mountain forest at dawn, pine trees,
rays of sunlight through fog, cinematic photography,
f/1.8 bokeh, blue and gold color palette,
hyper realistic, 8k resolution

Exemple illustrationMinimalist vector logo for a bakery,
croissant and coffee cup, pastel colors,
clean lines, modern design, white background

Les mots-clés de style qui changent tout

Certains mots-clés ont un impact énorme sur le rendu. Voici les plus utiles :

📸

Style photographique

cinematic photography, portrait photography, product photo, bokeh, f/1.8 aperture, golden hour lighting, studio lighting

🎨

Style artistique

oil painting, watercolor, impressionist, digital art, concept art, anime style, 3D render, pixel art

🏗️

Qualité technique

high detail, 8k resolution, hyperrealistic, sharp focus, professional, award-winning

💡

Ambiance / lumière

soft light, dramatic lighting, neon lights, candlelight, sunset, moody, bright and airy

Cas d'usage pratiques

  • Post réseaux sociaux : illustration pour un article, visuel pour Instagram
  • Présentation professionnelle : images d'ambiance pour illustrer des slides
  • Logo / identité visuelle : point de départ (à peaufiner avec un graphiste)
  • Mockups : visualiser un produit ou un concept avant de le créer
  • Avatars / profils : photo de profil stylisée ou illustrée
  • Fond d'écran : images personnalisées et uniques

Les limites importantes

Les mains et les textes : les IA ont encore du mal avec les mains (trop de doigts, doigts tordus) et les textes dans les images (lettres déformées). C'est en cours d'amélioration mais ça reste un problème courant.

La cohérence : générer plusieurs images d'un même personnage avec le même look est difficile. Chaque génération repart de zéro.

Le droit d'auteur : ces outils ont été entraînés sur des œuvres existantes, ce qui pose des questions légales non encore résolues. Pour un usage commercial, préfère Adobe Firefly, entraîné sur des images libres de droits.

⚠️

Ne génère jamais de photos réalistes de vraies personnes sans leur accord. C'est une violation de la vie privée et potentiellement illégal (usurpation d'identité, deepfakes).

Modifier et améliorer une image existante

Les outils modernes ne créent pas seulement de zéro — ils peuvent aussi modifier des images existantes :

  • Inpainting : effacer une partie de l'image et la remplacer par autre chose
  • Outpainting : étendre une image au-delà de ses bords d'origine
  • Style transfer : appliquer le style d'une image à une autre
  • Upscaling : augmenter la résolution d'une image floue ou petite

Adobe Photoshop intègre maintenant ces fonctions directement via Firefly.

// À retenir
  • Principaux outils : Imagen/Gemini (gratuit), DALL-E (ChatGPT), Midjourney (artistique), Firefly (Adobe), Stable Diffusion (open-source)
  • Prompt image = liste de descripteurs : sujet, style, ambiance, qualité
  • Mots-clés puissants : "cinematic", "oil painting", "hyperrealistic", "golden hour"
  • Faiblesses : mains, textes dans l'image, cohérence de personnage
  • Usage commercial → préférer Adobe Firefly (images libres de droits)
  • Jamais de photos réalistes de vraies personnes sans accord