Du willst KI-Bilder erstellen, ohne dafür zu bezahlen? Dann ist Google Gemini dein neuer bester Freund. Mit einem simplen Google-Account kannst du direkt im Browser loslegen – komplett kostenlos und sogar mit deutschen Prompts.
Ich selbst nutze Gemini mittlerweile regelmäßig für Blog-Header, Social-Media-Grafiken und schnelle Mockups. Der große Vorteil: Du brauchst keine komplizierte Software, keine Discord-Server wie bei Midjourney, und kein teures Abo. Einfach einloggen und lostippen.
In diesem Tutorial zeige ich dir Schritt für Schritt, wie du mit Google Gemini Bilder erstellst, bearbeitest und das Maximum aus dem kostenlosen KI-Bildgenerator herausholst. Außerdem erfährst du, was hinter den Kulissen passiert (Stichwort: Imagen 3), wann sich die Alternative ImageFX lohnt und wie Gemini im Vergleich zu ChatGPT und Midjourney abschneidet.
1. Öffne gemini.google.com und melde dich mit deinem Google-Account an.
2. Tippe deinen Prompt ins Chat-Feld – z.B.: „Erstelle ein fotorealistisches Bild von einem Café in Berlin bei Sonnenuntergang.“
3. Warte 5-10 Sekunden, wähle dein Lieblingsbild und klicke auf das Download-Symbol.
Das war’s schon! Klingt zu einfach? Ist es auch. Aber wenn du mehr rausholen willst – bessere Qualität, konsistente Charaktere, gezielte Bearbeitung – dann lies weiter.

Was ist Google Imagen? (Gemini vs. ImageFX erklärt)
Bevor wir richtig loslegen, lass mich kurz die Verwirrung um die ganzen Google-Begriffe auflösen. Denn Gemini, Imagen und ImageFX werden oft durcheinandergeworfen – dabei meinen sie völlig unterschiedliche Dinge.
Imagen ist das eigentliche KI-Modell, das die Bilder erzeugt. Es wurde von Google DeepMind entwickelt und liegt aktuell in Version 3 vor. Stell dir Imagen als den Motor vor, der unter der Haube arbeitet. Dieses Modell ist ein sogenanntes Diffusionsmodell – es lernt, aus purem Pixelrauschen schrittweise ein scharfes Bild zu „destillieren“. Das Ergebnis: fotorealistische Bilder mit erstaunlich guter Textdarstellung.
Gemini ist die Chat-Oberfläche, über die du mit dieser KI sprichst. Wenn du einen Prompt eingibst wie „Ein süßer Hund im Astronautenanzug“, analysiert Gemini deine Anfrage, reichert sie intern mit zusätzlichen Details an und schickt sie dann an Imagen weiter. Gemini ist also der Vermittler – und der Grund, warum deutsche Prompts so gut funktionieren.
ImageFX ist Googles dediziertes Bildgenerator-Tool unter labs.google/fx. Es nutzt ebenfalls Imagen 3, bietet aber mehr Kontrolle über Stile und Varianten. Der Haken: ImageFX ist in Deutschland nicht offiziell verfügbar – dazu später mehr.
Imagen ist der Motor, ImageFX das Sportauto nur für Bildgenerierung, und Gemini der Allround-SUV, der neben Bildern auch Texte, Code und Recherche kann.
Das Phänomen „Nano Banana
Falls du auf Reddit oder X (ehemals Twitter) über den Begriff „Nano Banana“ stolperst: Das ist der interne Codename für Geminis schnelles Bildmodell. Der Name wurde während blinder Tests auf der Plattform LM Arena verwendet – und ging viral, bevor überhaupt klar war, dass er von Google stammt.
Offiziell heißt das Modell Gemini 2.5 Flash Image. Es ist auf Geschwindigkeit optimiert und generiert Bilder quasi in Echtzeit. Besonders cool: Es kann Charaktere über mehrere Generierungen hinweg konsistent darstellen – ein Problem, an dem viele Konkurrenten scheitern. Laut Googles Entwickler-Blog wurde das Modell speziell für diese Konsistenz trainiert.

Anleitung: Bilder mit Gemini erstellen (Schritt für Schritt)
Jetzt wird’s praktisch. Ich zeige dir den kompletten Workflow – vom ersten Login bis zum fertigen Download.
Schritt 1: Gemini öffnen und anmelden
Der Zugang läuft komplett über dein Google-Konto. Keine separate Registrierung, kein Discord-Server, kein Schnickschnack.
Öffne einfach gemini.google.com im Browser oder lade die Gemini-App auf dein Smartphone. Melde dich mit deinem privaten Google-Account an – fertig.
Das Mindestalter liegt bei 18 Jahren. Das ist strenger als in vielen anderen Ländern und hängt mit den EU-Datenschutzregeln zusammen. Falls du einen Workspace-Account (Firma oder Schule) nutzt, muss dein Admin die Gemini-Funktionen erst freischalten. Mehr dazu in der offiziellen Google-Hilfe.
Schritt 2: Bildgenerierung starten
In Gemini gibt es keinen separaten „Bild-Modus“. Das System erkennt automatisch, ob du ein Bild oder eine Textantwort willst.
Der Trick: Verwende klare Trigger-Wörter wie „Erstelle“, „Generiere“, „Zeichne“ oder „Male“. Also nicht einfach „Ein Hund im Park“, sondern „Erstelle ein Bild von einem Hund im Park.“
Du kannst auch auf den Button „Bild erstellen“ klicken und dort das Modell wählen:
- „Schnell“ (Nano Banana): Für die meisten Zwecke völlig ausreichend, extrem schnelle Generierung
- „Thinking“ (Nano Banana Pro): Höhere Qualität, schärfere Details, besseres Text-Rendering – braucht aber etwas länger
Schritt 3: Prompt auf Deutsch eingeben
Hier kommt die gute Nachricht: Gemini versteht deutsche Prompts richtig gut. Du musst nichts übersetzen.
Das Geheimnis liegt in der Gemini-Zwischenschicht. Sie analysiert deinen deutschen Text, versteht kulturelle Konzepte wie „Gemütlichkeit“ oder „Schrebergarten“ und übersetzt sie in visuelle Anweisungen für das Bildmodell. Das funktioniert oft besser als bei der Konkurrenz.
- Subjekt: Was ist das Hauptmotiv? (z.B. „Ein alter Leuchtturm“)
- Medium: Welcher Kunststil? (z.B. „Ölgemälde“, „Polaroid-Foto“, „3D-Render“)
- Umgebung: Wo spielt die Szene? (z.B. „auf einer stürmischen Klippe“)
- Beleuchtung: Wie ist das Licht? (z.B. „Goldene Stunde“, „Cinematic Lighting“)
- Farbe: Welche Farbpalette? (z.B. „Pastellfarben“, „Neon-Akzente“)
- Stimmung: Welche Emotion? (z.B. „melancholisch“, „episch“)
Ein Anfänger-Prompt wäre: „Ein Bild von einer Katze im Weltraum.“
Ein Profi-Prompt klingt so: „Erstelle ein fotorealistisches Makro-Foto einer Katze in einem Astronautenanzug, die auf der Mondoberfläche steht. Im Hintergrund leuchtet die Erde. Hochdetailliert, kühle Blautöne, starker Kontrast, 4K Auflösung.“
Merkst du den Unterschied? Je mehr Details du lieferst, desto besser das Ergebnis. Mehr Tipps zum Thema findest du in meinem großen KI-Bilder erstellen Artikel.
Gemini unterstützt keine klassischen Negativ-Prompts (also „–no cars“ wie bei Midjourney). Stattdessen formulierst du positiv: Statt „keine Autos“ sagst du „eine leere, verlassene Straße“.
Schritt 4: Bild herunterladen
Nach wenigen Sekunden zeigt dir Gemini meist vier Varianten in einem Raster. Klicke auf dein Lieblingsbild für die Großansicht und dann auf das Download-Symbol (Pfeil nach unten).
Das Format ist meist JPG oder WEBP. Die Standardauflösung liegt bei etwa 1024×1024 Pixeln – für Blogs und Social Media völlig ausreichend.
Was ist SynthID? Das unsichtbare Wasserzeichen erklärt
Jedes Gemini-Bild enthält ein unsichtbares SynthID-Wasserzeichen. Das ist eine Technologie von Google DeepMind, die die Pixel so manipuliert, dass sie für das menschliche Auge unsichtbar bleiben, aber von Software als KI-generiert erkannt werden können. Das dient der Transparenz und dem Schutz vor Deepfakes. Laut Google wurden bereits über 20 Milliarden Inhalte mit SynthID markiert.

Google ImageFX – Die Alternative für mehr Kontrolle
Wenn dir Geminis Chat-Interface zu basic ist, gibt es noch ImageFX. Das ist Googles dediziertes Bildgenerator-Tool – quasi die Spielwiese für Power-User.
Was ImageFX besser kann
ImageFX nutzt ebenfalls Imagen 3, bietet aber ein komplett anderes Bedienkonzept. Statt im Chat zu tippen, arbeitest du mit sogenannten Expressive Chips. Das sind Dropdown-Menüs, die erkannte Schlüsselwörter in deinem Prompt automatisch in klickbare Optionen umwandeln.
Wenn du zum Beispiel „Eine Katze im Stil von Van Gogh“ eingibst, kannst du auf „Van Gogh“ klicken und sofort Alternativen wie „Monet“, „Picasso“ oder „Cyberpunk“ auswählen – ohne neu tippen zu müssen. Das fördert den kreativen Flow und macht Experimentieren zum Kinderspiel.

Außerdem generiert ImageFX immer vier Bilder gleichzeitig, während Gemini oft nur eines liefert. Für schnelle Iterationen ist das Gold wert.
ImageFX ist in Deutschland nicht offiziell verfügbar. Viele Nutzer berichten, dass beim Zugriff die Meldung „This tool is not available in your country“ erscheint. Der Grund: Google führt experimentelle KI-Tools in der EU oft verzögert ein, um die Konformität mit DSGVO und EU AI Act sicherzustellen. Technisch versierte Nutzer umgehen das manchmal per VPN – das ist aber nicht offiziell unterstützt.
Meine Empfehlung: Für den deutschsprachigen Raum ist Gemini der zuverlässigere Weg. Wenn ImageFX irgendwann offiziell verfügbar wird, lohnt sich der Umstieg für alle, die maximale Kontrolle wollen.

Bilder bearbeiten mit Gemini (Inpainting & Co.)
Das Suchvolumen für „Gemini Bilder bearbeiten“ ist in letzter Zeit regelrecht explodiert. Kein Wunder – denn Gemini kann nicht nur Bilder generieren, sondern sie auch iterativ verfeinern.
So funktioniert die konversationelle Bearbeitung
Der eleganteste Weg: Du bleibst einfach im selben Chat und gibst Änderungswünsche in natürlicher Sprache ein.
Angenommen, du hast ein Bild von einem Hund im Wald generiert. Der Hund gefällt dir, aber der Wald ist zu dunkel. Dann schreibst du einfach als nächste Nachricht: „Mach den Wald heller und sonniger.“
Das Besondere: Gemini behält den Hund (Identität, Pose, Fellfarbe) weitgehend bei und ändert nur den Hintergrund. Diese Konsistenz war bis vor kurzem eines der größten Probleme der KI-Bildgenerierung.
Was du bearbeiten kannst
Die Möglichkeiten sind vielfältig:
- Hintergrund austauschen: „Ersetze den Hintergrund durch einen Strand bei Sonnenuntergang.“
- Objekte entfernen: „Entferne das Auto auf der linken Seite.“
- Stil ändern: „Wandle das Bild in einen Comic-Stil um.“
- Fehler korrigieren: „Die Hand hat sechs Finger – korrigiere das bitte.“
Du kannst auch eigene Bilder hochladen und Gemini bitten, diese zu bearbeiten – etwa „Mach aus diesem Selfie ein professionelles Business-Porträt“. Mehr dazu findest du in meinem Artikel zum Thema KI-Bildbearbeitung.
Die Grenzen der Bearbeitung
Echtes Inpainting – also das pixelgenaue Markieren und Ersetzen von Bildbereichen – gibt es in der Consumer-Version von Gemini nicht. Diese Profi-Funktion ist nur in Vertex AI verfügbar, Googles Cloud-Plattform für Entwickler.
Auch Outpainting (das Erweitern von Bildern über ihre Grenzen hinaus) und Upscaling (höhere Auflösung) fehlen aktuell. Für diese Funktionen brauchst du externe Tools oder den Hintergrund-Entferner deiner Wahl.

Die besten Prompts für Google Gemini
Erfolg mit Gemini hängt zu 80% vom Prompting ab. Es ist quasi eine neue Form der Programmierung – nur eben mit natürlicher Sprache statt Code.
Deutsch vs. Englisch: Was funktioniert besser?
Die kurze Antwort: Für 90% der Fälle reicht Deutsch völlig aus.
Gemini wurde intensiv auf multilingualen Daten trainiert. Deutsche Prompts werden nicht einfach übersetzt, sondern wirklich verstanden – inklusive kultureller Nuancen. Wenn du einen „typisch deutschen Weihnachtsmarkt“ beschreibst, bekommst du Fachwerkhäuser und Glühweinstände, nicht amerikanischen Christmas-Kitsch.
Bei extrem komplexen Szenen oder sehr spezifischen künstlerischen Stilen kann ein englischer Prompt manchmal minimal bessere Ergebnisse liefern. Aber für den Alltag: Bleib bei Deutsch.
5 Beispiel-Prompts für verschiedene Anwendungen
1. E-Commerce & Marketing
Prompt: „Erstelle ein professionelles Produktfoto einer minimalistischen Hautpflege-Creme-Tube auf weißem Marmorstein. Frische Aloe-Vera-Blätter und Wassertropfen drumherum. Helle, klinisch saubere Beleuchtung, Soft-Fokus im Hintergrund, Werbefotografie-Stil.“
Ergebnis: Sauberes, kommerziell nutzbares Asset, das teure Fotoshootings ersetzen kann.
2. Blog-Header
Prompt: „Generiere ein Hero-Bild für einen Blogartikel über KI-Bildgeneratoren. Moderner Schreibtisch mit Laptop, auf dem Bildschirm eine Gemini-Oberfläche. Dezente Google-Farben, flaches minimalistisches Design, 16:9-Format.“
Ergebnis: Perfekter Header für Tech-Artikel und Tutorials.
3. Social Media
Prompt: „Erstelle ein buntes Flatlay-Foto eines aufgeräumten Designer-Schreibtischs. Laptop, Skizzenbuch, bunte Stifte, Kaffeetasse. Produktive, kreative Stimmung, helles Tageslicht von oben, Instagram-Ästhetik.“
Ergebnis: Stock-Material für Instagram-Stories und Pinterest.
4. Architektur-Visualisierung
Prompt: „Fotorealistische Visualisierung eines modernen Einfamilienhauses im Bauhaus-Stil. Große Glasfronten, Flachdach, weißer Putz. Grüner Garten mit alten Eichen. Abendstimmung mit warmweiß beleuchteten Fenstern. Perspektive von der Straße.“
Ergebnis: Hochwertige Visualisierung für Exposés und Präsentationen.
5. Kunst & Inspiration
Prompt: „Ein Porträt einer Frau, die komplett aus Blumen und Ranken besteht. Surrealistischer Stil, inspiriert von Giuseppe Arcimboldo, aber modern interpretiert. Dunkler Hintergrund, leuchtende Blütenfarben, mystische Atmosphäre.“
Ergebnis: Einzigartiges Kunstwerk, das die kreativen Grenzen der KI zeigt.
Was Gemini NICHT kann
Googles „Responsible AI“-Ansatz führt zu strengeren Filtern als bei manchen Open-Source-Alternativen wie Stable Diffusion.
- Keine echten Personen: Bilder von Prominenten, Politikern oder anderen identifizierbaren Menschen werden blockiert.
- Kein NSFW-Content: Gewalt, explizite Inhalte und Hassrede sind tabu.
- Urheberrechts-Schutz: Prompts wie „Mickey Mouse“ werden generisch interpretiert („Eine Cartoon-Maus“), um Copyright-Verletzungen zu vermeiden.
- Übervorsichtige Filter: Manchmal blockiert Gemini auch harmlose Prompts, wenn Wörter mehrdeutig sind. Dann hilft Umformulieren.

Kosten & Limits: Ist Google Gemini wirklich kostenlos?
Ja – aber mit Einschränkungen.
Das kostenlose Angebot
Die Bildgenerierung mit Gemini ist für jeden mit Google-Account grundsätzlich kostenlos. Google spricht offiziell von „Basic Access“ und vermeidet konkrete Zahlen. In der Praxis berichten Nutzer von etwa 10-20 Bildern pro Tag – das variiert aber je nach Serverauslastung.
Wenn du dein Tageslimit erreichst, zeigt Gemini eine freundliche Meldung im Stil von „Bitte komm morgen wieder.“ Kein Grund zur Panik, am nächsten Tag geht’s weiter.
Die Premium-Optionen
Wer mehr braucht, kann auf Google One AI Premium upgraden (ca. 22€/Monat). Damit bekommst du:
- Deutlich höhere Limits (laut früheren Angaben bis zu 1.000 Bilder täglich)
- Zugang zum leistungsstärkeren „Thinking“-Modell
- 2K-Auflösung
- 2 TB Cloud-Speicher inklusive
Für die meisten Blogger, Content Creator und Gelegenheitsnutzer reicht das kostenlose Kontingent aber locker aus.
Gemini vs. ChatGPT vs. Midjourney: Der Vergleich
Wie schlägt sich Gemini gegen die Konkurrenz? Hier ein ehrlicher Vergleich:
| Kriterium | Gemini (Imagen 3) | ChatGPT (DALL-E 3) | Midjourney |
|---|---|---|---|
| Preis | Kostenlos (Basis) | 2-3 Bilder/Tag gratis, sonst 20$/Monat | Ab 10$/Monat, kein Free Tier |
| Deutsche Prompts | ✅ Sehr gut | ✅ Sehr gut | ❌ Englisch bevorzugt |
| Bildqualität | Gut bis sehr gut | Sehr gut | Exzellent |
| Geschwindigkeit | Extrem schnell | Langsam bis mittel | Sehr schnell |
| Bearbeitung | ✅ Konversationell | ✅ Mit Markierung | Begrenzt |
| Charakter-Konsistenz | ✅ Sehr gut | Mäßig | Gut |
Mein Fazit: Gemini ist der „Alltags-Champion“ für alle, die schnell und kostenlos Bilder brauchen. Midjourney bleibt das „Künstler-Atelier“ mit der schönsten Bildsprache – aber eben kostenpflichtig. ChatGPT ist ein solider Allrounder, verliert aber bei Geschwindigkeit und Fotorealismus.
Wenn du tiefer in den Vergleich einsteigen willst, schau dir meinen ausführlichen Artikel zu KI-Bildgeneratoren im Test an.
Häufige Fragen (FAQ)
Ist Google Gemini Bildgenerierung wirklich kostenlos?
Ja. Die Nutzung ist mit einem normalen Google-Account kostenlos. Es gibt dynamische Tageslimits (geschätzt 10-20 Bilder), die je nach Serverauslastung variieren. Für unbegrenztes Generieren brauchst du das AI-Premium-Abo für ca. 22€/Monat.
Kann ich Gemini-Bilder kommerziell nutzen?
Grundsätzlich ja. Laut Googles Nutzungsbedingungen behältst du die Rechte an den generierten Inhalten. Allerdings gibt es keine Exklusivität – andere könnten ähnliche Bilder generieren. Achte darauf, keine Markenrechte Dritter zu verletzen (z.B. wenn die KI zufällig ein Logo generiert). Für kritische Branding-Elemente empfehle ich weiterhin menschliche Designer.
Warum funktioniert die Bildgenerierung bei mir nicht?
Die häufigsten Gründe sind:
- Tageslimit erreicht: Warte bis morgen
- Altersgrenze: 18 Jahre in der EU erforderlich
- Workspace-Konto: KI-Funktionen müssen vom Admin freigeschaltet werden
- Sicherheitsfilter: Dein Prompt wurde blockiert – formuliere neutraler
Prüfe auch, ob eine rote Warnmeldung erscheint.
Versteht Gemini deutsche Prompts genauso gut wie englische?
Für die allermeisten Anwendungen: ja. Gemini wurde auf multilingualen Daten trainiert und versteht deutsche Nuancen oft besser als die Konkurrenz. Nur bei sehr komplexen künstlerischen Stilen kann Englisch minimal bessere Ergebnisse liefern.
Wie erstelle ich KI-Bilder aus meinem eigenen Foto?
Lade dein Foto in den Gemini-Chat hoch und beschreibe die gewünschte Änderung. Zum Beispiel: „Mach aus diesem Selfie ein professionelles Business-Porträt“ oder „Ändere den Hintergrund zu einem Strand.“ Beachte: Keine Deepfakes oder täuschende Montagen – das blockiert Google. Mehr dazu in meinem Artikel zu KI-Avataren.
Fazit: Für wen lohnt sich Gemini?
Google Gemini hat sich zum besten kostenlosen KI-Bildgenerator entwickelt – zumindest für alle, die sowieso ein Google-Konto haben.
Ideal für:
- Einsteiger: Ohne Abo und ohne Lernkurve sofort loslegen
- Blogger und Content Creator: Schnell Bilder für Artikel und Social Media generieren
- Deutschsprachige Nutzer: Kein Wechsel ins Englische nötig
- Google-Workspace-User: Bilder direkt in Docs oder Slides einfügen
Weniger geeignet für:
- High-End Art Directors: Pixelgenaue Kontrolle fehlt (→ Midjourney)
- Profis mit hohem Volumen: Tausende Bilder pro Monat brauchen API-Lösungen
- NSFW-Content: Strenge Filter blockieren vieles
Mein Tipp: Probier es einfach aus. Geh auf gemini.google.com, tippe „Erstelle ein Bild von einem Astronauten im Schwarzwald“ – und staune, was in 10 Sekunden möglich ist.
Und wenn du noch tiefer in die Welt der KI-Bildgenerierung eintauchen willst, schau dir mein großes Tutorial zu KI-Bildern oder den Vergleich der besten KI-Bildgeneratoren an.






