Business Magazine

post image 022a

Was ist der beste KI Bild Generator? – Mein Vergleichstest

Inhaltsverzeichnis
    Add a header to begin generating the table of contents

    Welcher KI Bild Generator ist der Beste?

    In den letzten Monaten kam eine Reihe von KI Bild Generatoren auf den Markt, von denen einige ihren Konkurrenten weit voraus sind. Deshalb möchte ich in diesem Beitrag untersuchen, was der beste KI-Bildgenerator ist.

    Einschränkend möchte ich aber betonen, dass sich die Frage nach dem besten KI Bildgenerator nicht einfach und vor allem nicht allgemeingültig beantworten lässt. Ausschlaggebend hierfür ist, dass sich die Anforderungen und Bedürfnisse der Nutzer beträchtlich unterscheiden:

    • Manche suchen einen kostenlosen Bildgenerator.
    • Für andere ist eine möglichst hohe Bildqualität ausschlaggebend.
    • Wieder andere suchen vielfältige Einstellungsmöglichkeiten.
    • Vieler Nutzer bevorzugen einen deutschsprachigen Bildgenerator.
    • Etliche möchten eine App für Ihr Smartphone, um auch mobil KI-Bilder erzeugen zu können.

    Deshalb habe ich eine Reihe von Bestenlisten erstellt, die diesen verschiedenen Ansprüchen gerecht werden:

    Die besten kostenlosen KI Bild Generatoren:

    NightCafé

    Besonders hohe Bildqualität
    Kostenlos
    • Bildqualität: 10/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 9/10

    Deep AI

    Zahlreiche Stile und Optionen
    Kostenlos
    • Bildqualität: 6/10
    • Bedienung 6/10
    • Optionen: 8/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 9/10

    NightCafé

    Besonders hohe Bildqualität
    Kostenlos
    • Bildqualität: 5/10
    • Bedienung 6/10
    • Optionen: 4/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 6/10

    Die besten deutschen KI Bild Generatoren:

    Jasper Art

    Hohe Bildqualität
    $69 / monatlich
    • Bildqualität: 9/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 9/10
    • Gesamtnote: 9/10

    Zum kostenlosen Test hier klicken: Jasper-Art*

    Mindverse

    Viele Einstellmöglichkeiten
    39 / monatlich
    • Bildqualität: 6/10
    • Bedienung 7/10
    • Optionen: 6/10
    • Preis-Leistung: 7/10
    • Gesamtnote: 7/10
    Zum kostenlosen Test hier klicken: Mindverse*

    Neuroflash

    Einfache Benutzerführung
    29 / monatlich
    • Bildqualität: 5/10
    • Bedienung 6/10
    • Optionen: 4/10
    • Preis-Leistung: 7/10
    • Gesamtnote: 9/10
    Zum kostenlosen Test hier klicken: Jasper-Art*

    Die KI Bildgeneratoren mit der besten Gesamtleistung:

    Bildqualität, Funktionalität und Nutzerfreundlichkeit

    Jasper Art

    Hohe Bildqualität
    $69 / monatlich
    • Bildqualität: 9/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 9/10
    • Gesamtnote: 9/10

    Zum kostenlosen Test hier klicken: Jasper-Art*

    NightCafé

    Besonders hohe Bildqualität
    Kostenlos
    • Bildqualität: 10/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 9/10

    Runway ML

    Vielfältige Einstellmöglichkeiten
    $12 / monatlich
    • Bildqualität: 8/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 9/10

    Die KI-Bildgeneratoren mit der höchsten Bildqualität:

    Midjourney

    Höchste Bildqualität
    $8 / monatlich
    • Bildqualität: 10/10
    • Bedienung 6/10
    • Optionen: 4/10
    • Preis-Leistung: 8/10
    • Gesamtnote: 7/10

    Jasper Art

    Hohe Bildqualität
    $69 / monatlich
    • Bildqualität: 9/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 9/10
    • Gesamtnote: 9/10

    Zum kostenlosen Test hier klicken: Jasper-Art*

    Deep Dream

    Einfache Benutzerführung
    $19 / monatlich
    • Bildqualität: 5/10
    • Bedienung 6/10
    • Optionen: 4/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 6/10

    Die KI Bild Generatoren mit den besten Einstellungsmöglichkeiten:

    Runway ML

    Vielfältige Einstellmöglichkeiten
    $12 / monatlich
    • Bildqualität: 8/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 9/10

    Jasper Art

    Hohe Bildqualität
    $69 / monatlich
    • Bildqualität: 9/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 9/10
    • Gesamtnote: 9/10

    Zum kostenlosen Test hier klicken: Jasper-Art*

    NightCafé

    Besonders hohe Bildqualität
    Kostenlos
    • Bildqualität: 10/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 9/10

    Die KI-Bildgeneratoren mit dem besten Preis-Leistungsverhältnis:

    (kostenlose ausgenommen)

    Runway ML

    Vielfältige Einstellmöglichkeiten
    $12 / monatlich
    • Bildqualität: 8/10
    • Bedienung 8/10
    • Optionen: 8/10
    • Preis-Leistung: 10/10
    • Gesamtnote: 9/10

    Neuroflash

    Einfache Benutzerführung
    29 / monatlich
    • Bildqualität: 5/10
    • Bedienung 6/10
    • Optionen: 4/10
    • Preis-Leistung: 7/10
    • Gesamtnote: 9/10

    Midjourney

    Höchste Bildqualität
    8 / monatlich
    • Bildqualität: 10/10
    • Bedienung 6/10
    • Optionen: 4/10
    • Preis-Leistung: 8/10
    • Gesamtnote: 7/10

    Die besten KI Bild Generatoren für Smartphones:

    Wombo Dream

    Für PC, Notebook und Smartphone
    $7,50 / monatlich
    • Bildqualität: 6/10
    • Bedienung 6/10
    • Optionen: 8/10
    • Preis-Leistung: 9/10
    • Gesamtnote: 7/10

    Craiyon

    Einfach zu bedienen
    $5 / monatlich
    • Bildqualität: 6/10
    • Bedienung 6/10
    • Optionen: 8/10
    • Preis-Leistung: 9/10
    • Gesamtnote: 7/10

    Midjourney

    Höchste Bildqualität
    8 / monatlich
    • Bildqualität: 10/10
    • Bedienung 6/10
    • Optionen: 4/10
    • Preis-Leistung: 8/10
    • Gesamtnote: 7/10

    Für wen empfehlen sich KI Bild Generatoren?

    Prinzipiell eignen sich KI-Bildgeneratoren für all jene, die regelmäßig größere Mengen an Illustrationen, Fotos und Bildern benötigen. In erster Linie sind dies:

    • Blogger und Betreiber von Webseiten, die ihre Beiträge mit Abbildungen illustrieren wollen.
    • E-Commerce-Händler und Betreiber von Online-Shops, die die Qualität Ihres Online-Auftritts durch entsprechende Bilder und Illustrationen verbessern wollen.
    • Künstler und Designer, die Inspirationen für ihre Arbeit suchen beziehungsweise mit neuen Methoden Kunstwerke schaffen wollen.
    • Selbständige und Unternehmen, die durch spektakuläre Bilder die Aufmerksamkeit von Interessenten und Kunden auf sich ziehen möchten.
    • All jene, die in Social Media aktiv sind, insbesondere auch Marketing-Verantwortliche, die ihre Veröffentlichungen auf sozialen Plattformen mithilfe von KI-Bildern mehr Beachtung verschaffen wollen.

    Bisher haben diese Gruppen Bilder und Illustrationen vor allem auf Online-Foto-Plattformen wie Shutterstock, iStock, Adobe Stock und anderen ihre Bilder und Illustrationen eingekauft. Mit dem Aufkommen von KI Bild Generatoren hat sich dies grundlegend verändert:

    Nun ist es nicht mehr notwendig, Zeit für die Suche nach dem passenden Foto aufzuwenden. Vielmehr kann dieses mithilfe eines Generators entsprechend der eigenen Vorstellungen innerhalb weniger Sekunden erzeugt werden.

    Hinzu kommt ein weiterer wichtiger Vorteil: Bilder müssen nicht mehr gekauft werden, vielmehr beschränken sich die Ausgaben auf die Entrichtung der Nutzungsgebühr für den Bildgenerator.

    Gerade für all jene, die größere Mengen an Bildern benötigen, ist dieses Angebot besonders attraktiv. Vor allem dann, wenn die monatliche Gebühr die Erzeugung einer unbegrenzten Zahl an Bildern erlaubt.

    Manche der KI-Bildgeneratoren sind Teil eines KI-Textgenerators, mit dem Sie auf Basis künstlicher Intelligenz automatisiert Texte erzeugen können. Einen Überblick über aktuelle KI-Text Generatoren gebe ich Ihnen in diesem Beitrag:

    Mein KI Bild Generator Vergleichstest

    Die meisten Bild Generatoren bieten ein Eingabefeld, in dem Sie einige Stichwörter oder einen kurzen Text eingeben, um das von Ihnen gewünschte Bild zu beschreiben.

    Um alle hier getesteten KI Bild Generatoren so objektiv wie möglich vergleichen zu können, insbesondere was die Qualität der von diesen erzeugten Bildern betrifft, habe ich alle mit den gleichen Inputs „gefüttert“.

    Die Inputs sind in diesem Fall die Beschreibungen der Bilder, die erzeugt werden sollen und die als „Prompts“ bezeichnet werden. Dabei habe ich in meinem Test ein kurzes, ein längeres, und zwei lange Prompts verwendet.

    Da die meisten hier getesteten Tools aus dem angelsächsischen Raum stammen, habe ich die Bildbeschreibungen dabei durchweg auf Englisch formuliert. Hier meine vier Prompts:

    Meine erste Bildbeschreibung:

    Albert Einstein as a Cowboy in Paris

    Mein zweiter Prompt:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Die dritte Bildbeschreibung:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Der vierte Prompt:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Noch ein wichtiger Punkt zu meinem Bildgeneratoren Vergleichstest:

    Ich begrenze meinen Test weitgehend auf die einmalige Erzeugung von Bildern, wenngleich einige Generatoren die Möglichkeit bieten, auf Basis des zuerst generierten Bildes weitere Varianten erstellen zu lassen.

    Der Vorteil dieses Verfahrens ist, dass Sie auf diese Weise Bildvarianten bekommen, die stärker Ihren persönlichen Vorlieben und Vorstellungen entsprechen, als dies beim zuerst generierten Bild der Fall ist.

    Da aber nicht alle KI-Bildgeneratoren über eine derartige Funktionalität verfügen habe ich darauf verzichtet, Varianten zu bereits erzeugten Bildern anzufertigen.

    Zudem geht es mir in diesem Vergleichstest vor allem um eines: Ich möchte herausfinden, wie gut die Qualität der Bilder im ersten Durchlauf ist, da dies weitreichende Rückschlüsse auf die Leistungsfähigkeit des betreffenden Generators erlaubt.

    Oder anders formuliert: Ein Generator, der nicht schon im ersten Durchlauf ein hochwertiges Bild zustande bringt, wird dies erfahrungsgemäß auch nicht schaffen, wenn man mehrere Varianten des zuerst präsentierten Bilds berechnen lässt.

    Außerdem ist zu bedenken, dass viele Nutzer nicht die Zeit aufwenden wollen, mehrere Bildvarianten zu erstellen. Vielmehr verwenden sie einen KI-Bildgenerator, um auf Basis einiger ausgewählter Begriffe oder eines kurzen Textes rasch und ohne Mühen einige Bilder zu erzeugen.

    An einer aufwendigen Nachbearbeitung beziehungsweise der Generierung unzähliger Varianten haben derartige Nutzer kein Interesse. Dies kann ich gut nachvollziehen und beschränke mich deshalb in meinem Vergleichstest und der Beurteilung der Bildqualität auf die anfangs erzeugten Werke.

    Kommen wir nach diesen Vorbemerkungen nun aber zum Test der einzelnen KI-Bildgeneratoren.

    Jasper Art* ist die Bild-Generator-Komponente des KI-Textgenerators Jasper, der gegenwärtig von vielen als weltweit führend in diesem Marktsegment angesehen wird.

    Jasper Art* greift auf das System DALL E 2 von OpenAI zu, das neben Midjourney und Stable Diffusion zu den wichtigsten technologischen Vorreitern bei der Generierung von KI-Bildern zählt.

    Sie müssen zunächst eine Testversion oder Bezahlversion von Jasper buchen. Zur kostenlosen Testversion können Sie sich hier anmelden:

    Die Nutzung von Jasper Art* kostet pro Monat weitere 20 US-Dollar pro Nutzer. Hierfür müssen Sie sich gesondert in Ihrem Kundenbereich auf Jasper anmelden.

    Wenn Sie Jasper Art* gebucht haben, gibt es keine Beschränkung für die Zahl der KI-Bilder, die Sie erzeugen können.

    Ja, es gibt eine kostenlose Version von Jasper Art. Dabei handelt es sich um eine Fünf-Tage-Testversion, mit der Sie sowohl den Text-Generator als auch den Bildgenerator nutzen können. In der kostenlosen Version können Sie bis zu 200 Bilder generieren. Hier können Sie sich anmelden:

    Für wen empfiehlt sich Jasper Art?

    Aufgrund seiner vielfältigen Anwendungsmöglichkeiten eignet sich Japser Art für ein breites Spektrum von Nutzern.

    Hierzu gehören an erster Stelle Blogger und die Betreiber von Webseiten, daneben aber auch Unternehmen und Selbständige, die aufsehenerregende KI-Bilder in ihren Webauftritt beziehungsweise Werbematerial integrieren wollen.

    Wie erzeugt man KI-Bilder mit Jasper Art?

    Wie bei den anderen hier getesteten KI-Bildgeneratoren beschäftige ich mich hier ausschließlich mit der Generierung von Bildern auf Basis einer eingegebenen Beschreibung.

    Zunächst können Sie in das Feld unterhalb „Describe what you want to create“ Ihre Bildbeschreibung eingeben, die nicht länger als 400 Buchstaben sein darf.

    Nun können Sie eine Reihe von Einstellungen vornehmen, mit denen Sie Einfluß auf Inhalt und Stil des zu erzeugenden Bildes nehmen. Im Einzelnen sind dies: Mood, Medium, Style, Keywords und Language.

    Wie bei den anderen Bildgeneratoren wähle ich im Interesse der Vergleichbarkeit der Tests zunächst keine dieser Optionen aus.

    Zunächst wähle ich Englisch als Eingabesprache, werde aber gleich noch die korrespondierende deutsche Bildbeschreibung versuchen.

    Hier meine erste Bildbeschreibung:

    Albert Einstein as a Cowboy in Paris

    Dann klicke ich auf den Button „Create art“ und erhalte hierauf folgende vier Bildvarianten:

    Albert Einstein findet sich in drei der Bilder, auf dem vierten rechts unten ist der Kopf abgeschnitten, so dass nicht erkennbar ist, um wen es sich handelt.

    Es handelt sich ausnahmslos um fotorealistische Bilder von Albert Einstein, allerdings ist er dort weder als Cowboy dargestellt, noch deutet ein Bildelement auf Paris hin.

    Nun zur nächsten Bildbeschreibung:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Hier erhalten wir diese vier Bildvarianten:

    Die Bilder links oben und rechts unten sind sehr gut gelungen, die beiden anderen dagegen etwas weniger. Insgesamt ist die Qualität der Bilder, oder zumindest von drei der vieren, insgesamt gut bis sehr gut.

    Um Jasper Art weiter zu testen, versuche ich es mit der deutschen Version dieses Prompts:

    Albert Einstein, auf einem Gemälde von Vincent van Gogh. Dargestellt mit wildem Haar, im Anzug und mit einer Pfeife oder einer Tafel in der Hand, umgeben von Sonnenblumen, Büchern und Formeln

    Hier erhalten wir folgende Bildvarianten:

    Zumindest die beiden oberen Bilder sind gut gelungen, die beiden unteren eher weniger.

    Gehen wir zum nächsten Prompt:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Folgende Bildvarianten präsentiert Jasper Art:

    Vor allem das erste Bild ist gut, auf den beiden nächsten sieht man leider nur das Kolosseum, während dies in der vierten Bildvariante nur einen Ausschnitt des Kolosseums bildet.

    Versuchen wir es mit der deutschen Version dieses Textes:

    Ein belebtes Stadtbild von Rom mit dem Kolosseum und dem Forum Romanum im Vordergrund und den berühmten roten Ziegeldächern und Kuppeln der Stadt im Hintergrund. Die Stimmung ist großartig und historisch, mit einem Sinn für antike Wunder und architektonische Schönheit

    Folgende Bildvarianten wurden von Japser Art berechnet:

    Die mit dem deutschsprachigen Prompt generierten Bilder entsprechen in ihrer Qualität in etwa dem englischsprachigen Prompt. Auf zweien taucht das Kolosseum auf, auf einem anderen das Forum Romanum.

    Nun zur letzten Bildbeschreibung: Die RMS Titanic in Paris, zunächst in englischer Sprache:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Hier die auf dieser Beschreibung generierten vier Bildvarianten:

    Zumindest im linken oberen Bild ist eine Kirche erkennbar, bei der es sich um die Kathedrale Notre Dame handeln könnte.

    Generell ist aber festzustellen, dass auf dem Bild weder Paris noch das Schiff Titanic eindeutig zu erkennen ist. Alleine im Hinblick auf die Zahl der Kamine kann keines der abgebildeten Schiffe die Titanic sein.

    Versuchen wir es mit der deutschen Formulierung dieses Prompts:

    Die RMS Titanic in Paris, massiv, großartig und beeindruckend, schwimmt auf dem ruhigen Wasser der Seine, umgeben von beeindruckender Architektur, darunter die berühmte Kathedrale Notre Dame, Glockentürme und verzierte Paläste, mit einer ruhigen und friedlichen Atmosphäre, mit Booten und Menschen

    Wir bekommen folgende Bildvarianten von Jasper Art:

    Die Titanic ist auf dem vierten Bild als solches erkennbar, auf den anderen drei allerdings nicht. Paris ist im ersten Bild zu sehen, zumindest die Kathedrale Notre Dame ist erkennbar, eventuell auch der Eifelturm.

    • Die zahlreichen vorgegebenen Kunststile, Medien und Stimmungen erleichtern die Erzeugung von Bildern und sind gleichzeitig eine wichtige Inspirationsquelle. Ähnlich wie bei Runway ML animieren diese Einstellungsmöglichkeiten dazu, weitere Bilder zu generieren, wodurch man viele und teilweise überaus faszinierende Varianten geliefert bekommt.
    • Die Qualität der Bilder ist zumeist gut bis sehr gut, wenngleich der Test gezeigt hat, dass deren Inhalt oft nicht ausreichend mit der vorgegebenen Bildbeschreibung korrespondiert.
    • Von jedem Bild werden vier verschiedene Varianten erzeugt.
    • Die Erzeugung der Bilder erfolgt mit einer hohen Auflösung von 2k, so dass die Kunstwerke auch bei einer großformatigen Wiedergabe eine hohe Detailgenauigkeit aufweisen.
    • Man kann die Bilder in drei verschiedenen Auflösungen herunterladen, die größte davon ist 2048×2048 Pixel.
    • Man kann ein generiertes Bild nicht innerhalb von Jasper Art weiterbearbeiten, wie dies beispielsweise bei Canva möglich ist. Vielmehr muß man hierfür ein anderes Tool wie Photoshop nutzen.
    • Sie haben nicht die exklusiven Rechte auf die von Ihnen generierten Bilder, vielmehr kann jeder andere Nutzer diese in unveränderter oder veränderter Form verwenden.
    • Der Preis von Jasper rangiert am oberen Ende des Angebots, denn schließlich muß man zum einen den generellen Jasper-Tarif bezahlen, von dem der günstigste 59 US-Dollar pro Monat kostet. Zum anderen muß man die Zusatzgebühr für Jasper Art bezahlen, die sich auf 20 US-Dollar pro Monat beläuft.

    Eine noch ausführlichere Besprechung von Jasper Art und eine Vielzahl von Bildern, die ich mit diesem KI Bild Generator erzeugt habe, finden Sie hier:

    Canva Text to Image

    Was zeichnet Canva Text to Image aus?

    Canva ist kein KI-Bildgenerator im herkömmlichen Sinne. Vielmehr handelt es sich bei Canva um eine Plattform, auf der Sie Fotos, Abbildungen, Audio- und Videodateien kaufen können. Außerdem haben Sie auf Canva freien Zugriff auf ein breites Spektrum von Vorlagen und Werkzeugen, mit denen Sie Bilder bearbeiten können.

    Die Kombination aus Bilddatenbank, Vorlagen und Tools zur Bildbearbeitung erlaubt es Ihnen, Abbildungen und Grafiken für eine Vielzahl unterschiedlicher Verwendungszwecke auf einfache Art zu erstellen. Zu denken ist hier an Beiträge für Social Media, Videos, Webseiten und Dokumente verschiedenster Art wie etwa Präsentationen, Vorträge und Textbeiträge zu denken.

    Das Verfahren ist dabei immer das gleiche: Man lädt ein eigenes Bild in das System oder wählt eines aus dem großen Angebot von Canva aus und bearbeitet dieses dann weiter. Diese Bearbeitung umfasst vor allem die Anpassung der Größe sowie die Ergänzung von Bildelementen, Symbolen und Texten.

    In Ergänzung zu diesem Angebot hat Canva im September 2022 die Funktion „Canva Text to Image“ in der Beta-Version eingeführt.

    Im Vergleich zu dezidierten KI-Bildgeneratoren wie Jasper oder Midjourney hat Canva Text to Image einen stark eingeschränkten Funktionsumfang. Es mangelt an den zahlreichen Einstellmöglichkeiten, die andere Generatoren bieten, allerdings hat er einen entscheidenden Vorteil: Seine Nutzung ist zumindest gegenwärtig nach wie vor kostenlos.

    Gibt es Canva Text to Image kostenlos?

    Ja, Canva Text to Image kann gegenwärtig noch kostenlos genutzt werden. Zudem gib es eine kostenfreie Version von Canva namens „Canva Free“. Diese bietet Zugriff auf 250.000 kostenlosen Design-Vorlagen, 100 verschiedene Design-Typen sowie mehr als eine Million kostenlose Fotos und Grafiken.

    Bereits diese Zahlen illustrieren, daß der Tarif Canva Free trotz seiner Einschränkungen Zugriff auf ein beträchtliches Volumen an Fotos, Dokumente und Vorlagen zulässt.

    Was kostet Canva Text to Image?

    Neben dem kostenlosen Tarif „Canva Free“ gibt es zwei Bezahlversionen:

    • Canva Pro, die pro Jahr 109,99 Euro für eine Person bei jährlicher Bezahlung kostet. Bei monatlicher Zahlung kostet Canva Pro 11,99 Euro.
    • Canva für Teams, die mit 139,90 Euro pro Jahr bei jährlicher Zahlung zu Buche schlägt und von fünf Personen genutzt werden kann. Bei monatlicher Zahlung kostet Canva für Teams 13,99 Euro.

    In diesen beiden Tarifen haben Sie Zugriff auf 100 Millionen Fotos, Videos, Grafiken und Audio-Dateien. Zudem stehen Ihnen mehr als 600.000 Vorlagen für unterschiedlichste Design-Anforderungen sowie Cloud-Speicher mit einer Größe von einem Terabyte (1 TB) zur Verfügung.

    Meiner Meinung nach reicht die kostenlose Version völlig aus, wenn man nur gelegentlich Bilder und Vorlagen benötigt. Hat man allerdings häufiger Bedarf und braucht man mehr Quellmaterial, insbesondere wenn es um Video- und Audio-Dateien geht, ist Canva Pro definitiv eine gute Wahl.

    Die Auswahl an Fotos, Abbildungen, Vorlagen, Videos und Audios ist nahezu unübersehbar, die gut funktionierende Suchfunktion erlaubt es aber, die gewünschten Daten schnell zu finden.

    Wie erzeugt man KI-Bilder mit Canva Text to Image? - Meine Erfahrung mit Canva Text to Image

    Nach der Anmeldung bei Canva muß man sich entscheiden, ob das neue Bild in ein bestehendes Design eingebunden oder ob mit diesem ein neues Design erstellt werden soll.

    Ich wähle in diesem Fall „Im neuen Design verwenden“ und kann dann die Größe dieses Designs bestimmen.

    Ich wähle hier Dokument und habe nun ein Design ohne Titel.

    Nun kopiere ich die erste Bildbeschreibung in das freie Feld mit der Bezeichnung „Beschreibe das Bild, das du sehen möchtest“, nämlich:

    Albert Einstein as a Cowboy in Paris

    Nach Eingabe der Beschreibung kann ich noch zwischen einem von sechs Stilen wählen.

    Ich wähle „Concept-Art“ und klicke ich auf „Bild erstellen“, worauf ich innerhalb weniger Sekunden vier Versionen meines Bildes bekomme:

    Ich mache einen neuen Anlauf, füge abermals die gleiche Beschreibung ein und klicke auf den Button „Mehr generieren“, worauf ich folgende vier weitere Bilder erhalte:

    Albert Einstein trägt nun zwar einen Cowboy-Hut, von Paris sieht man aber nach wie vor nichts. Ich klicke abermals auf „Mehr generieren“ und erhalte vier neue Bilder, die aber mit Ausnahme des Cowboy-Hut, der sich auf zwei Abbildungen findet, nicht mit meiner Bildbeschreibung korrespondieren:

    Versuchen wir es mit einer längeren Bildbeschreibung mit Albert Einstein, nämlich:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Hier erhalten wir die folgenden vier Abbildungen:

    Die beiden Abbildungen sind gar nicht so schlecht.

    Kommen wir zur nächsten Bildbeschreibung, nämlich Rom:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Hier bekommen wir vier foto-realistische Abbildungen:

    Die Bilder sind ebenfalls nicht schlecht, aber auch nicht umwerfend. Schade ist, dass deren Format so klein ist und ein näherer Blick zeigt, dass weite Bereiche der Bilder etwas unscharf sind.

    Zudem ist das Forum Romanum in keinem der vier Bilder zu sehen. So sieht das Forum Romanum aus:

    BeBo86, CC BY-SA 3.0, via Wikimedia Commons

    Versuchen wir es mit der letzten Bildbeschreibung, dem Schiff RMS Titanic in Paris:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Mit dieser Bildbeschreibung erhalten wir die folgenden vier Bilder:

    Das Bild rechts oben zeigt ein Schiff, das in etwa der Titanic entspricht, alle anderen weisen nur eine geringe Ähnlichkeit auf.

    Eines der Bilder, nämlich das erste links oben, zeigt eine Stadt im Hintergrund, allerdings läßt sich nicht sagen, welche Stadt dies ist. Monumente der Stadt Paris und insbesondere die Kathedrale Notre Dame sind nicht erkennbar.

    Für wen empfiehlt sich Canva Text to Image?

    Aufgrund der im Vergleich mit anderen Bildgeneratoren eingeschränkten Funktionalität von Canva Text to Image empfiehlt sich dieses Tool für all jene, die keine zu großen Ansprüche an die Qualität der generierten Bilder haben.

    Auch an die Passgenauigkeit der Bilder, sprich wie stark die generierten Abbildungen mit der eingegebenen Bildbeschreibung korrespondieren, sollte man keine zu großen Erwartungen haben. Die von mir generierten Beispielbilder haben dies aus meiner Sicht deutlich illustriert.

    Aufgrund der zahlreichen Tools zur Bildbearbeitung und der enormen Zahl von Fotos und Abbildungen, die dem Nutzer zur Verfügung stehen, empfiehlt sich die Nutzung von Canva Text to Image in Kombination mit diesen Ressourcen.

    Vorzüge von Canva Text to Image

    • Die Nutzerführung ist durchdacht und die Bedienung einfach.
    • Die Generierung der Bilder erfolgt schnell.
    • Es werden vier Bild-Varianten nach jeder Eingabe erzeugt.
    • Im Gegensatz zu vielen anderen KI-Bildgeneratoren bietet Canva die Möglichkeit, das generierte Bild sogleich weiter zu bearbeiten. Hierfür steht der Canva-Editor mit seinen zahlreichen Bearbeitungsmöglichkeiten zur Verfügung.

    Nachteile von Canva Text to Image

    • Auf den Inhalt der Bilder kann nur über die Bildbeschreibung Einfluß genommen werden. Es gibt aber keine Instrumente, die eine Vorauswahl von Stile oder Kunstrichtung ermöglichen, wie dies beispielsweise bei Jasper Art und Runway ML der Fall ist.
    • Die Größe der generierten Bilder ist klein und die Auflösung ist nicht frei wählbar.
    • Es sind nur sechs Stile in der Voreinstellung wählbar, während andere Bildgeneratoren erheblich mehr Optionen bieten.

    NightCafé

    NightCafé ist einer der ältesten KI-Bildgeneratoren, der bereits seit 13. November 2019 verfügbar ist. Der Name „NightCafé“ ist eine Referenz an Van Gogh und dessen Gemälde „Le Café de nuit“.

    Im Unterschied zu vielen anderen Bildgeneratoren können Sie bei NightCafé eigene Bilder in das System laden und diese als Grundlage für die Erzeugung neuer Bilder verwenden. Dies wird als „Image-to-Image AI“ bezeichnet, ein Verfahren, das ich in meinem folgenden Beitrag erläutere:

    Was ist der beste KI-Bildgenerator und was ist AI Kunst?

    NightCafé verfügt über die Möglichkeit, generierte Bilder im eigenen Profil anderen Nutzern zugänglich zu machen und sich mit diesen auszutauschen. Profile auf NightCafé verfügen über Funktionalität, wie man sie von sozialen Medien kennt, wie beispielsweise Follow und Likes.

    Eine weitere Besonderheit von NightCafé ist die Integration von Print on Demand, so daß es einfach möglich ist, erzeugte Bilder drucken zu lassen.

    Was kostet NightCafé?

    AI Beginner

    5,99 US-Dollar pro Monat bei monatlicher Bezahlung und 4,79 US-Dollar bei Bezahlung pro Quartal, was einer Ersparnis von 20 Prozent entspricht. Hierfür erhält man 100 Credits, womit man pro Monat rund 1.200 Bilder generieren kann.

    AI Hobbyist

    9,99 US-Dollar pro Monat bei monatlicher Bezahlung beziehungsweise 7,99 US-Dollar bei Bezahlung pro Quartal. Hierfür erhält man 200 Credits, sprich 0,05 US-Dollar pro Credit bei monatlicher oder 0,36 US-Dollar bei Quartals-Bezahlung.

    AI Enthusiast

    19,99 US-Dollar pro Monat bei monatlicher und 15,99 US-Dollar bei Bezahlung pro Quartal, wofür man 500 Credits erhält, sprich 0,04 US-Dollar pro Credit bei monatlicher und 0,288 US-Dollar bei Quartalsbezahlung. Mit diesem Tarif können rund 2.800 Bilder pro Monat generiert werden.

    AI Artist

    49,99 US-Dollar pro Monat bei monatlicher und 39,99 US-Dollar bei Quartalsbezahlung. Hierfür erhält man 1.400 Credits. Jeder Credit kostet damit 0,036 US-Dollar, womit rund 6.400 Bilder pro Monat erzeugt werden können

    Ist NightCafé kostenlos?

    Ja, es ist möglich, sich mit NightCafé in einer kostenlosen Testversion vertraut zu machen. Dabei erhalten Sie fünf Credits, mit denen Sie fünf Bilder erzeugen können.

    Besonders erfreulich ist, dass Sie täglich fünf neue Credits erhalten und damit weitere Kunstwerke ohne Bezahlung generieren lassen können.

    Für wen empfiehlt sich NightCafé?

    NightCafé empfiehlt sich vor allem für Nutzer, die ein eigenes Portfolio von KI-Kunst aufbauen, teilen und bekanntmachen wollen. Besonders empfiehlt sich NIghtCafé für Privatpersonen, Künstler und Blogger.

    Wie erzeugt man KI-Bilder mit NightCafé?

    Es gibt grundsätzlich zwei Möglichkeiten, KI-Bilder mit NightCafé zu erzeugen:

    • Durch Eingabe einer Bildbeschreibung in Textform.
    • Durch Upload eines eigenen Bildes in Kombination mit Eingabe einer Beschreibung, wie das Bild verändert werden soll.

    Es gibt fünf sogenannte Creation Methods, sprich Generierungs-Modi, in NightCafé:

    • Stable
    • DALL E 2
    • Coherent
    • Artistic
    • Style Transfer

    Meine Erfahrung mit NightCafé

    Nach der kostenlosen Anmeldung, für die Sie nur Ihre Email-Adresse angeben müssen, erhalten Sie zunächst drei Credits.

    Im Anschluß daran klicken Sie auf „Create“ und werden dann auf eine Seite geleitet, auf der Sie die Auswahl zwischen den fünf genannten Generierungs-Modi auswählen können: Stable, DALL E 2, Coherent, Artistic und Syle Transfer.

    Ich wähle zunächst Stable und werde dann zur Eingabe der Bildbeschreibung geleitet. Bilder generiere ich wiederum mit den von mir auch bei anderen KI-Bildgeneratoren verwendeten Beschreibungen.

    Ich gebe also in das Feld „Your text prompt“ folgenden Text ein:

    Albert Einstein as a Cowboy in Paris

    Daraufhin suche ich mir einen „Style“ aus. Verfügbar sind: NightCafe, Artistic Portrait, Bon Voyage, Photo, Epic, Dark Fantasy, Anime, Modern Comic, CGI Character, Neo Impressionists, Pop Art, B&W Portrait.

    Ich wähle den Style „NightCafe“ aus und entscheide dann, wie viele Bilder generiert werden sollen: Ein Bild kostet 0,5 Credits, vier Bilder kosten einen Credit. Die Voreinstellung, die ich beibehalte, sind vier Bilder. Nun klicke ich auf „Create (1 Credit)“.

    Nach wenigen Sekunden erhalte ich vier Bildvarianten von “Albert Einstein as a Cowboy in Paris”.

    nightcafe einstein in paris 01a

    Um das System weiter zu testen, lasse ich mir nochmals vier Bildvarianten mit dieser Bildbeschreibung erstellen.

    Ich kann mir die vier Bilder in der Übersicht darstellen lassen und kann sie dann herunterladen. Ich kann auch ein bestimmtes Foto heraussuchen, indem ich auf dieses klicke und „Set as main image“ auswähle.

    Dieses Bild kann ich dann entweder weiter bearbeiten, Varianten erzeugen lassen („Evolve“) oder dieses vergrößern („Enhance“).

    Für die Vergrößerung werden mir abhängig von der Vergrößerungsstufe Credits in Rechnung gestellt.

    Ich entscheide mich zunächst für eine zweifache Vergrößerung, die mich einen Credit kostet. Diese vergrößerte Bildversion lade ich dann herunter:

    Das Bild enthält zwar die drei Komponenten Albert Einstein, Cowboy (zumindest symbolisiert durch das Pferd) und Paris in Form des Eifelturms. Die Qualität des Bildes insgesamt und vor allem die Darstellung von Pferd und Reiter ist allerdings missraten.

    Probieren wir es mit der nächsten Bildbeschreibung, wobei ich wieder den Erzeugungsmodus Stable und den Style „NightCafé“ wähle. Hier wähle ich wieder 4 Images, wofür mir ein Credit in Rechnung gestellt wird:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Die vier Bilder von Albert Einstein entsprechen zweifellos dem Stil von Van Gogh. Besonders gelungen finde ich das Bild links oben und das links unten.

    Nun zur nächsten Bildbeschreibung:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Auch hier wähle ich wieder den Modus „Stable“, zur Abwechselung aber den Stil „Epic“, und lasse wieder vier Bildvarianten berechnen:

    Das Kolosseum steht im Zentrum von zwei drei der vier Bilder, das Forum Romanum erscheint leider nicht, so wie dies auch bei anderen hier vorgestellten KI-Bildgeneratoren der Fall war. Insgesamt sind die Bilder zwar nicht schlecht, aber aus meiner Sicht auch nicht umwerfend.

    Außerdem erkennt man bei einer vergrößerten Darstellung, dass diese in weiten Bereichen etwas unscharf und insbesondere im Bildhintergrund wenig definiert sind.

    Nun zur vierten Bildbeschreibung, Titanic in Paris. Der genaue Text des Prompts lautet:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Ich behalte die vorigen Bildeinstellungen bei und erhalte folgende vier KI-Bilder:

    RMS Titanic wird nur im Bild rechts unten gut getroffen, Paris taucht nur in einem Bild, nämlich rechts oben in Form von Notre Dame auf. Insgesamt sind die Kunstwerke aber wenig gelungen.

    Vorzüge von NightCafé

    • Positiv ist die Möglichkeit, sowohl KI-Werke auf Basis von Bildbeschreibungen als auch durch Verwendung von selbst in das System geladenen Fotos erzeugen zulassen.
    • Die Nutzung von NightCafé ist einfach und die gut durchdachte Bedienerführung erlaubt es, das System und seine Möglichkeiten bereits nach kurzer Einarbeitung zu bedienen. Dies gilt insbesondere für die Auswahl verschiedener Kunststile.
    • Erfreulich ist, dass es einen kostenlosen Tarif gibt, mit dem pro Tag fünf Bilder erzeugt werden können.
    • Ebenfalls positiv ist die Möglichkeit, eigene Kreationen innerhalb von NightCafé online zu stellen und diese von anderen Nutzern bewerten zu lassen beziehungsweise sich mit diesen auszutauschen.

    Nachteile von NightCafé

    • Die Erzeugung von Bildern dauert abhängig von den gewählten Voreinstellungen etwas länger als bei anderen Generatoren. Dies liegt vor allem daran, dass sich häufig zahlreiche Bilder in der Generierungs-Schlange befinden.
    • Es ist von Vorteil, Erfahrung mit der Erstellung von Bildbeschreibungen („Prompts“) zu haben, denn je besser diese geschrieben sind um so eindrucksvoller werden die Ergebnisse.

    Was zeichnet Neuroflash aus?

    Neuroflash* ist ein deutscher KI-Textgenerator, mit dem man seit einiger Zeit auch KI-Bilder generieren kann. Dies ist allerdings nur ein „Nebenprodukt“, der Fokus dieses Software-Tools liegt auf der Texterzeugung. 

    Weitergehende Informationen zu Neuroflash als Textgenerator finden Sie hier:

    Was kostet Neuroflash?

    Der KI-Bildgenerator kann nicht als Einzelprodukt genutzt werden, stattdessen müssen Sie die Monatsgebühr für das Tool in seiner Gesamtheit bezahlen.

    Die nachfolgende Übersicht zeigt Ihnen, wie viele KI-Bilder Sie pro Monat erzeugen können und welche Kosten hierbei anfallen:

    • Im kostenlosen Tarif ein KI-Bild pro Monat.
    • Im Basic-Tarif, der pro Monat 29 Euro bei monatlicher Bezahlung kostet, können monatlich 25 KI-Bilder erzeugt werden.
    • Im Tarif Power können bei monatlicher Bezahlung für 79 Euro pro Monat 50 KI-Bilder generiert werden.
    • Im Tarif Premium können Sie eine unbegrenzte Zahl von Bildern erzeugen, wobei dieser Tarif 199 Euro pro Monat bei monatlicher Zahlung kostet.

    Kann man Neuroflash kostenlos nutzen?

    Im Free-Tarif können Sie Neuroflash zeitlich unbegrenzt nutzen, was es Ihnen ermöglich, ein KI-Bild pro Monat kostenfrei zu erzeugen.

    Wie erzeugt man KI-Bilder mit Neuroflash? – Meine Erfahrungen

    Klickt man auf den Menüpunkt „KI BILDER“ erscheint ein Eingabefeld, in das man die Beschreibung des gewünschten Bildes einfügen kann.

    Wichtig:

    Die Beschreibung, von Neuroflash* als „Briefing“ bezeichnet, muss in englischer Sprache verfasst sein.

    In das Feld gebe ich nun wie bei den anderen KI-Bildgeneratoren die erste Beschreibung ein:

    Albert Einstein as a Cowboy in Paris

    Mit dieser Beschreibung erhalte ich das folgende Bild:

    Wie Sie sehen, ist zwar Albert Einstein auf dem Bild, allerdings ist er nicht als Cowboy erkennbar. Zudem findet sich auf dem Bild und insbesondere im Hintergrund kein Element, das an Paris erinnert.

    Versuchen wir es mit einem längeren Briefing:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Die Verwendung einer längeren Beschreibung brachte schon ein besseres Resultat. Wenden wir uns der nächsten Bildbeschreibung zu, der Stadt Rom. Diese lautet:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Hier ergibt sich folgendes Bild:

    Das Bild macht auf den ersten Blick, zumindest was den Vordergrund betrifft, einen fotorealistischen Eindruck. Elemente, die sich im Hintergrund im oberen Drittel des Bildes befinden, weisen dagegen eine geringe Definition auf.

    Auffällig ist noch etwas: In der Bildbeschreibung werden gleich am Anfang das Kolosseum („Collosseum“) und das Forum Romanum („Roman Forum“) als Elemente genannt.

    Im generierten Bild tauchen diese dagegen nicht auf, vielmehr wurde diese Anweisung vom Neuroflash-Bildgenerator ignoriert.

    Versuchen wir es mit dem vierten Testbild: Die Titanic in Paris.

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Wir erhalten folgendes Bild:

    Die Darstellung der RMS Titanic entspricht weitgehend dem tatsächlichen Aussehen der Titanic, allerdings ist sie nicht einwandfrei: Vor allem im Bereich der Brücke ist die Gestaltung unsauber, beispielsweise aufgrund der gebrochenem Fensterlinien.

    Hier ein historisches Bild der Titanic bei der Abfahrt aus dem Hafen von Southampton am 19. April 1912:

    Quelle: Francis Godolphin Osbourne Stuart, Public domain, via Wikimedia Commons

    Eine Auslassung ist aber „bildlich gesprochen“ unübersehbar:

    Auf dem Bild ist zwar ein Schiff, das durchaus RMS Titanic sein könnte, von Paris sieht man aber nichts. Damit hat der Neuroflash KI-Bildgenerator auch hier wieder wesentliche Elemente der Beschreibung nicht in das Bild aufgenommen.

    • Einfache Bedienung.
    • Im Preis des Neuroflash-Textgenerators enthalten.
    • Die Qualität der von Neuroflash generierten Bilder liegt beträchtlich unterhalb der zahlreicher Konkurrenten.
    • Mit Ausnahme der Tarife Power und Premium ist die Anzahl der Bilder, die pro Monat erzeugt werden kann, stark limitiert. Mit anderen Worten: Bei Neuroflash muss man eine im Vergleich zu anderen Bildgeneratoren hohe monatliche Gebühr bezahlen, kann dafür aber nur eine begrenzte Zahl von Kunstwerken generieren.
    • Obgleich Neuroflash ein deutscher KI-Textgenerator ist, muß die Beschreibung des KI-Bildes, das generiert werden soll, in englischer Sprache formuliert werden.

    Shutterstock Generate

    Was zeichnet Shutterstock Generate aus?

    Shutterstock ist die aktuell größte kommerzielle Online-Bilderdatenbank mit mehr als 400 Millionen Fotos. Wichtige Konkurrenten von Shutterstock sind Adobe Stock, iStock, Envato Elements und Depositphotos.

    Neben Fotos gibt es auch ein breites Spektrum von Abbildungen und Grafiken, Videos und Audiodateien auf Shutterstock. Die Bilder ebenso wie alle anderen Materialien werden von Nutzern zum Verkauf eingestellt und erhalten dafür einen Anteil des erzielten Honorars.

    Am 25. Januar 2023 hat die Foto-Plattform mit Shutterstock Generate einen AI Image Generator den Nutzern zugänglich gemacht. Die Einführung dieses KI-Bildgenerators basiert auf einer Zusammenarbeit mit DALL E 2 beziehungsweise OpenAI.

    Was kostet Shutterstock Generate?

    Da es sich gerade in der Markteinführungsphase entstehen für die Nutzung von Shutterstock Generate keine Kosten.

    Das System bietet allerdings die Möglichkeit, neben der Generierung des vom Nutzer gewünschten Bildes auch weitere ähnliche Abbildungen anzuzeigen. Hierfür muß man allerdings bei Shutterstock angemeldet sein, was kostenlos ist und sich deshalb empfiehlt. Anmelden können Sie sich hier.

    Ist Shutterstock Generate kostenlos?

    Ja, Shutterstock Generate ist gegenwärtig kostenlos. Allerdings ist für den  Download der Bilder ohne Wasserzeichen eine Gebühr zu entrichten.

    Wie erzeugt man KI-Bilder mit Shutterstock Generate?

    Es ist möglich, das System ohne Anmeldung zu nutzen. Klicken Sie dazu einfach hier:

    Shutterstock Generate

    Besser ist es allerdings, ein kostenloses Konto bei Shutterstock zu eröffnen, um dann auch die vom System präsentierten verwandten Abbildungen angezeigt zu bekommen. Anmelden können Sie sich hier:

    Shutterstock

    Nach Eingabe des Textes der Bildbeschreibung kann man zwischen fünf verschiedenen Stilen wählen: Alle Stile, Fotos, Kunst, Digital und 3D.

    Versuchen wir es mit der ersten Bildbeschreibung:

    Albert Einstein as a Cowboy in Paris

    Dann wähle ich „Alle Stile“ und bekomme diese vier Bilder:

    Mit viel Fantasie ist Albert Einstein zu erkennen, die Vorgaben „Cowboy“ und „Paris“ wurden von Shutterstock Generate aber komplett ignoriert.

    Versuchen wir es mit dem nächsten Prompt:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Auch diese vier Bilder sind qualitativ weit unter den von anderen KI-Bildgeneratoren erzeugt wurden. Zudem haben die verwandten KI-Bilder aus dem Shutterstock-Archiv keine Beziehung zum soeben generierten Bild.

    Dies läßt sich wohl dadurch erklären, dass das KI-Bilder-Archiv von Shutterstock noch klein ist, da der Service erst sehr kurz angeboten wird.

    Zum Test übersetzte ich den englisch-formulierten Prompt ins Deutsche:

    Albert Einstein, auf einem Gemälde von Vincent van Gogh. Dargestellt mit wildem Haar, im Anzug und mit einer Pfeife oder Tafel in der Hand, umgeben von Sonnenblumen, Büchern und Formeln

    Nachstehend die vier Bildvarianten, die Shutterstock Generate mit dieser Bildbeschreibung erzeugt hat:

    Versuchen wir es mit dem nächsten Prompt:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Die Bilder sehen fotorealistisch aus, haben aber nicht die Qualität der von anderen Bildgeneratoren produzierten AI Art.

    Kommen wir zu RMS Titanic in Paris:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Paris, die Seine und insbesondere die Kathedrale Notre Dame ist deutlich erkennbar, von RMS Titanic fehlt aber jede Spur. Zu sehen sind zu nur Schiffe, die eher einem Ausflugsdampfer als der Titanic ähnlich sind.

    Vorzüge von Shutterstock Generate

    • Die Erzeugungsgeschwindigkeit bei Shutterstock Generate ist hoch.
    • Von jedem Bild werden vier Varianten erzeugt.
    • Die Bildbeschreibung kann auch in deutscher Sprache verfaßt werden.
    • Positiv ist, daß dem Nutzer inhaltliche verwandte KI-Bilder zu seinem Werk angezeigt werden. Dabei wird auch der Prompt angegeben, der für die Erzeugung des Bildes genutzt wurde.

    Nachteile von Shutterstock Generate

    • Die Qualität der Bilder kann nur als mäßig betrachtet werden und auch die Übereinstimmung zwischen der eingegebenen Bildbeschreibung und dem dann genierten Bild hält sich in engen Grenzen.
    • Es gibt gegenwärtig nur ein Ausgabeformat, nämlich 1024×1024 Pixel.
    • Der Download von Bildern ist nur möglich, wenn man das Bild kauft. Der Kaufpreis eines Bildes liegt abhängig vom gewählten Tarif zwischen 0,37 und 2,90 Euro. Damit bewegt sich Shutterstock bei den KI-Bildern preislich im oberen Bereich des Marktes.

    Midjourney

    Was zeichnet Midjourney aus?

    Midjourney wurde im März 2022 der Öffentlichkeit vorgestellt, wobei das System seitdem mehrmals grundlegend revidiert wurde. Midjourney war früher auf dem Markt als dessen beiden wichtigsten Konkurrenten DALL-E und Stable Diffusion.

    In der kurzen Zeit seiner Existenz wurde Midjourney vor allem durch zwei Dinge bekannt:

    Zum einen für den ersten Platz in der Colorado State Fair im Bereich Digital Arts. Dies war der erste Sieg eines KI-Bildgenerators in einem derartigen Wettbewerb.

    Zum anderen ist Midjourney der erste KI-Bildgenerator, der von Künstlern wegen Verletzung ihrer Urheberrechte verklagt wurde.

    Was kostet Midjourney?

    Basic Plan

    8 US-Dollar pro Monat bei jährlicher Abrechnung, bei monatlicher Zahlung 10 US-Dollar pro Monat. Mit diesem Tarif können 200 Bilder pro Monat generiert werden.

    Standard Plan

    24 US-Dollar pro Monat bei jährlicher Abrechnung. Bei monatlicher Bezahlung kostet dieser Tarif 30 US-Dollar. Sie haben in diesem Tarif die Möglichkeit, eine unbegrenzte Zahl von Bildern zu erzeugen.

    Pro Plan

    48 US-Dollar pro Monat bei jährlicher Abrechnung und 60 US-Dollar bei monatlicher Bezahlung mit unbegrenztem Generierungsvolumen.

    Ist Midjourney kostenlos?

    Ja, es gibt eine kostenlose Version, mit der Sie 25 Bilder erzeugen können. Allerdings teilen Sie sich diesen kostenlosen Zugang mit einer Vielzahl anderer Nutzer. Deshalb dauert die Erzeugung von Bildern einiges an Zeit und gleichzeitig ist die Bedienung mehr als unübersichtlich.

    Für wen empfiehlt sich Midjourney?

    Midjourney empfiehlt sich für all jene, die sehen wollen, welche anderen Bildbeschreibungen, sprich Prompts, andere Nutzer eines KI-Bildgenerators verwenden und wie sie diese weiter verfeinern. Dies kann nämlich in Midjourney gut nachverfolgt werden.

    Die Bedienung von Midjourney ist ziemlich unübersichtlich, weshalb sich dieses Tool nicht für all jene empfiehlt, die keine Erfahrung mit KI-Bildgeneratoren haben.

    Haben Sie die Rechte auf die mit Midjourney generierten Bilder?

    Generierte Bilder können für kommerzielle Zwecke verwendet werden, allerdings müssen diese mit einer der Bezahlversionen von Midjourney erzeugt worden sein.

    Wie erzeugt man KI-Bilder mit Midjourney?

    Zunächst muß man sich beim Discord-Server von Midjourney anmelden, wobei diese Anmeldung kostenlos ist. Den Link dazu finden Sie hier.

    Daraufhin kommen Sie in Ihren Discord-Account. Wenn Sie dort auf „Entdecke öffentliche Server“ klicken, erhalten Sie eine Auswahl verschiedener Communities, wobei die erste Community, die Ihnen angezeigt wird, Midjourney ist.

    Nachdem Sie in Midjourney sind, klicken Sie auf „Getting Started“.

    Sie werden dann darauf hingewiesen, dass Sie sich noch im Vorschaumodus befinden, aber durch Klick auf die Taste „Midjourney beitreten“ auf den Server kommen.

    Nun können Sie die kostenlose Version nutzen. Wenn Sie die Bezahlversion buchen wollen, gehen Sie zu dieser URL:

    Midjourney

    Nachdem Sie Ihren Tarif gebucht haben und können jetzt in Ihren Mitgliedsbereich gehen.

    Klicken Sie dann auf „Join the Discord to start creating!“

    Auf der nächsten Seite klicken Sie auf „Einladung annehmen“.

    Dann gehen Sie in einem beliebigen Kanal wie beispielsweise „newbie“ und gebe nach “/imagine prompt” meine erste Bildbeschreibung ein:

    Albert Einstein as a Cowboy in Paris

    Hierauf erhalte ich folgende vier Bildvarianten:

    Wie Sie sehen, gehören die vier Bildvarianten mit Ausnahme der Abbildung rechts oben zu den besten, die von allen hier getesteten KI-Bildgeneratoren erzeugt wurden.

    Dann teste ich die nächste Bildbeschreibung:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Mit diesem Prompt erhalte ich folgende vier Bildvarianten:

    Auch diese vier Bildvarianten sind von hoher Qualität und greifen vor allem die zentralen Elemente der Bildbeschreibung auf.

    Kommen wir zum nächsten Prompt, der Stadt Rom:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Diesen vier Variationen fehlt der Fotorealisimus, der die Bilder vieler anderer Bildgeneratoren auszeichnet, zeichnen sich aber durch eine eigene Ästhetik aus. Auch sind die beiden zentralen Elemente, nämlich das Kolosseum und das Forum Romanum nicht ausreichend präsent.

    Testen wir die vierte Bildbeschreibung, RMS Titanic in Paris:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Auch diese vier Bildvarianten zeichnen sich durch eine eigenständige Ästhetik aus, die den Bildern eine besondere Stimmung verleihen. Die Titan ist zumindest in drei Bildern einigermaßen gut getroffen, Paris ist allerdings nur im Bild rechts unten ansatzweise erkennbar.

    Hiervon abgesehen sind die Bilder, die Midjourney zu diesem Prompt erstellt, weit über dem Durchschnitt der hier vorgestellten Bildgeneratoren, wenn nicht sogar an der Spitze.

    Vorzüge von Midjourney

    • Die Qualität der von Midjourney generierten Bildern gehört zu den besten, die es gegenwärtig gibt: Im Vergleich zu allen anderen hier getesteten KI-Bildgeneratoren produziert Midjourney Kunstwerke, die komplexer und realistischer sind, als die aller Konkurrenten und sehen durchweg aus, als wären sie handgemalt
    • Der kostenlose Testzugang bietet Ihnen die Möglichkeit, sich mit Midjourney in aller Ruhe vertraut zu machen und 25 Bilder kostenlos berechnen zu lassen.
    • Der kostenlose Testzugang hat einen entscheidenden Vorteil: Sie sehen die Prompts, die andere Nutzer verwenden und welche Bilder daraus entstehen. So gewinnen Sie auf einfache Art neue Ideen für eigene Kreationen.

    Nachteile von Midjourney

    • Der größte Nachteil von Midjourney ist dessen schwierige Bedienung und die Tatsache, dass man sich zunächst bei Discord anmelden muß. Die Anmeldung bei Discord ebenso wie bei Midjourney ist unübersichtlich und könnte weit benutzerfreundlicher gestaltet werden.
    • Ehrlich gesagt, die Nutzung der kostenlosen Version ist so unübersichtlich, dass sich der Erwerb der kostenpflichtigen Version von Midjourney empfiehlt, wenn Sie mittel- oder längerfristig mit diesem KI-Bild-Generator arbeiten wollen.
    • Sie teilen sich in der kostenlosen Testversion den Zugang zu Midjourney, was negativ im Hinblick auf Verarbeitungsgeschwindigkeit und Nutzerfreundlichkeit ist. Zudem sehen alle anderen Anwesenden die von Ihnen erzeugten Bilder und können diese auch herunterladen.

    Was zeichnet Mindverse aus?

    Wie bei Neuroflash und CopyCockpit ist die Erzeugung von KI-Bildern nicht das Zentrum der Dienstleistung. Vielmehr ist dieses eine Zusatzmöglichkeit, während sich alle drei Software-Tools um die Textgenerierung drehen.

    In diesem Artikel habe ich den KI Text Generator Mindverse getestet, wobei Sie sich die Texte, die ich mit diesem System generiert habe, ansehen und auch herunterladen können:

    Was kostet Mindverse?

    Tarif Basic

    Der Tarif Basic schlägt mit 39 Euro pro Monat zu Buche schlägt, können lediglich vier KI-Bilder erzeugt werden. Falls Sie die Nutzungsgebühr jährlich im Voraus bezahlen, kostet ein Monat 33 Euro, sprich 396 Euro pro Jahr. In diesem Tarif können Sie pro Monat vier KI-Bilder erzeugen.

    Tarif Premium

    Der Tarif Premium, der monatlich 99 Euro kostet, haben Sie die Möglichkeit, 50 KI-Bilder zu generieren. Zudem gibt es einen Editor, mit dem die erzeugten Bilder nachbearbeitet werden können. Bei jährlicher Vorauszahlung kostet der Tarif Premium 83 Euro pro Monat und damit 996 Euro jährlich. Dieser Tarif erlaubt es Ihnen, 50 KI-Bilder pro Monat zu generieren.

    Tarif Premium Plus

    Im teuersten Tarif Premium Plus, für den pro Monat Nutzungsgebühren in Höhe von 199 Euro zu entrichten sind, kann der Nutzer 150 KI-Bilder vom System erstellen lassen. Bei jährlicher Bezahlung kostet dieser Tarif 166 Euro pro Monat und damit 1.992 Euro pro Jahr.

    Ist Mindverse kostenlos?

    Es gibt eine kostenlose Testversion, die es Ihnen erlaubt, sich mit dem System vertraut zu machen. Dies betrifft sowohl die Generierung von Texten als auch von KI-Bildern.

    Für wen empfiehlt sich Mindverse?

    Wie Neuroflash und CopyCockpit empfiehlt sich Mindverse für all jene, die regelmäßig Bilder und Illustrationen, insbesondere in größeren Mengen benötigen.

    Damit eignet sich dieser KI Bild Generator für die Betreiber von Webseiten und Blogs, sowie für all jene, die im Ecommerce aktiv sind und Bilder brauchen.

    Wichtig: Die Nutzung von Mindverse als Bildgenerator macht nur Sinn, wenn Sie vordringlich Texte mit dem System erzeugen.

    Wie erzeugt man KI-Bilder mit Mindverse?

    Nachdem man sich in Mindverse angemeldet hat, findet man auf der linken Seite den Menüpunkt „Bilder“. Klickt man diesen an, kommt man zum Feld, in dem die Bildbeschreibung eingegeben werden kann.

    Zudem kann man hier mehrere Einstellungen vornehmen, nämlich:

    • Stil
    • Bildverhältnis
    • Mehr Details hinzufügen
    • Metapher für Bild erstellen
    • Bildmodell auswählen

    Wie beim Test der anderen KI-Bildgeneratoren verzichte ich hier auf die Wahl eines Stils. „Mehr Details hinzufügen“ aktiviere ich, „Metapher für Bild erstellen“ dagegen nicht. Ein spezielles Bildmodell wähle ich ebenfalls nicht aus, sondern belasse die Einstellung auf „Mindverse Standard Modell“.

    Versuchen wir es mit der ersten Bildbeschreibung. Da es Mindverse erlaubt, Bildbeschreibungen in deutscher Sprache anzugeben, übersetze ich das Prompt, das ich bei anderen Generatoren in Englisch nutze, auf Deutsch:

    Albert Einstein als Cowboy in Paris

    Mit dieser kurzen Beschreibung erhalten wir folgendes Bild:

    Wir erhalten vier Bildvarianten, auf denen Einstein zwar teilweise gut getroffen ist, was insbesondere für die beiden Bilder auf der linken Seite gilt.

    Allerdings kommen keine Elemente im Bild vor, die mit den Stichwörter Cowboy oder Paris zu tun haben.

    Kommen wir zur nächsten Bildbeschreibung:

    Albert Einstein, auf einem Gemälde von Vincent van Gogh. Dargestellt mit wildem Haar, im Anzug und mit einer Pfeife oder einer Tafel in der Hand, umgeben von Sonnenblumen, Büchern und Formeln

    Leider weigert sich Mindverse, Bilder für diese Beschreibung zu erstellen, denn ich erhalte folgende Fehlermeldung:

    Ich habe beim Mindverse-Support nachgefragt und ich erhielt die Auskunft, dass mit dem System keine Bilder bekannter oder existierender Personen generiert werden können.

    Schade. Problematisch erscheint mir allerdings, dass mir die fehlgeschlagene Bilderzeugung berechnet wurde. Dadurch reduziert sich die Anzahl von Kunstwerken, die ich generieren kann, um eines. Insbesondere für Kunden, die mit ihrem Tarif nur eine begrenzte Zahl von Bildern erzeugen kann, ist dies überaus ärgerlich.

    Versuchen wir es mit der nächsten Bildbeschreibung:

    Ein belebtes Stadtbild von Rom mit dem Kolosseum und dem Forum Romanum im Vordergrund und den berühmten roten Ziegeldächern und Kuppeln der Stadt im Hintergrund. Die Stimmung ist großartig und historisch, mit einem Sinn für antike Wunder und architektonische Schönheit

    Hier generiert Mindverse* die folgenden vier Bildvarianten:

    Die Bilder sehen durchweg gut aus, allerdings läßt sich nicht eindeutig erkennen, daß es sich bei der Stadt um Rom handelt.

    Man sieht zwar eine Kirche, die der Petersdom sein könnte, die beiden in der Beschreibung genannten Monumente Kolosseum und Forum Romanum erscheinen aber nicht in den Bildern.

    Lediglich im Bild rechts oben ist ein Gebäude, das entfernt an das Kolosseum erinnert.

    Kommen wir zur vierten Bildbeschreibung:

    Die RMS Titanic in Paris, massiv, großartig und beeindruckend, schwimmt auf dem ruhigen Wasser der Seine, umgeben von beeindruckender Architektur, darunter die berühmte Kathedrale Notre Dame, Glockentürme und verzierte Paläste, mit einer ruhigen und friedlichen Atmosphäre, mit Booten und Menschen

    Hier erhalte ich folgende vier Bildvarianten:

    Zumindest in den Bildern rechts oben und links weist das abgebildete Schiff eine große Ähnlichkeit zur RMS Titanic auf. Auf den Bildern links oben und rechts unten ist die Titanic dagegen nicht erkennbar, zumal sich Fehler in die Darstellung eingeschlichen haben.

    • Ein besonderer Vorteil des KI-Bildgenerators von Mindverse liegt darin, dass man als Bildbeschreibung deutsche Texte verwenden kann.
    • Die Benutzung des Bildgenerators ist sehr einfach.
    • Im Gegensatz zu anderen deutschen Bildgeneratoren wie Neuroflash und CopyCockpit werden bei Mindverse bei jeder Bildgenerierung vier Varianten erzeugt.
    • Die Möglichkeit, sowohl aus einem breiten Spektrum von Stilen als auch aus mehreren Erzeugungsmodellen auszuwählen bietet im Unterschied zu den beiden anderen deutschsprachigen KI-Bildgeneratoren Neuroflash und CopyCockpit nur Mindverse.
    • Die Qualität der Bilder ist besser als die von CopyCockpit und Neuroflash erzeugten.
    • Eine Nutzung von Mindverse zur ausschließlichen Generierung von KI-Bildern macht keinen Sinn: Bei Mindverse bezahlen Sie in erster Linie für den Textgenerator, die Möglichkeit, KI-Bilder zu generieren ist nur eine zusätzliche Option, die aber nicht separat gebucht werden kann.
    • Die Zahl der Bilder, die Sie pro Monat erzeugen können, hält sich mit Ausnahme des teuersten Tarifs in engen Grenzen.
    • Die Erzeugung der Bilder dauert erheblich länger als bei den meisten anderen Generatoren. Mindverse selbst gibt an, dass die Berechnung bis zu einer Minute in Anspruch nehmen kann.

    Was zeichnet CopyCockpit aus?

    Ebenso wie Neuroflash und Mindverse steht auch bei CopyCockpit* der Textgenerator im Zentrum, die Möglichkeit, KI-Bilder zu erzeugen ist lediglich ein Service, der nachträglich eingefügt wurde. Und wie bei den beiden Konkurrenten ist Zahl der Bilder, die monatlich erzeugt werden kann, begrenzt.

    Ich habe den KI Text Generator CopyCockpit getestet, wobei Sie sich die Texte, die ich mit diesem Tool erzeugt habe, in folgendem Beitrag ansehen und herunterladen können:

    Was kostet CopyCockpit?

    Es gibt zwei Tarife, wobei Sie monatlich als auch jährlich bezahlen können:

    Tarif Personal

    Der Tarif „Personal“ schlägt bei monatlicher Zahlung pro Monat mit 29, bei jährlicher Bezahlung mit 24 Euro zu Buche. Bitte beachten Sie, dass Sie in diesem Tarif keine KI-Bilder erzeugen können.

    Tarif Pro

    Der Tarif „Pro“ kostet im Monat 99 Euro, wenn Sie monatlich bezahlen und 79 Euro wenn Sie pro Jahr bezahlen.

    Die beiden Tarife unterscheiden sich nach dem Volumen an Wörtern, die Sie erzeugen können: Im Tarif „Personal“ sind dies 20.000 Wörter pro Monat, im Tarif „Pro“ unterliegt die Zahl der erzeugten Wörter keiner Begrenzung.

    Bitte beachten Sie, dass Sie im Tarif „Personal“ keine KI-Bilder erzeugen können, dies ist nur im Tarif „Pro“ möglich, dort aber ohne jegliche Volumen-Beschränkung.

    Ist CopyCockpit kostenlos?

    Sie können CopyCockpit kostenlos testen, allerdings ist das Volumen an Wörtern und Bilder, die Sie erzeugen können, stark beschränkt.

    Für wen empfiehlt sich CopyCockpit?

    Es macht nur Sinn, KI-Bilder mit CopyCockpit zu erzeugen, wenn man primär den Textgenerator des Systems nutzt, da man sonst viel Geld für die Generierung von einer kleinen Zahl von Bildern ausgibt.

    Wie erzeugt man KI-Bilder mit CopyCockpit?

    Zunächst muß man sich für einen kostenlosen Testzeitraum anmelden, und zwar hier.

    Um KI-Bilder zu erzeugen, klicken Sie zunächst links auf den Menüpunkt „CopyCockpit Artist“ und dann auf das Symbol „Bild erstellen“.

    Ich beginne mit Eingabe der ersten Bildbeschreibung. Da CopyCockpit neben einer Vielzahl von Sprachen auch die Verwendung von deutschsprachigen Prompts erlaubt, gebe ich folgenden Text ein:

    Albert Einstein als Cowboy in Paris

    Ein Hinweis: Die Bildbeschreibung darf nicht länger als 77 Zeichen sein.

    Die Voreinstellung, dass vier Varianten erzeugt werden, lasse ich unverändert und klicke auf „Bild erstellen“. Hierauf erhalte folgende Bildvarianten:.

    Albert Einstein ist auf keinem der vier Varianten zu erkennen, aber die abgebildete Person sieht zumindest entfernt wie ein Cowboy aus. Von Paris fehlt allerdings jede Spur auf den Bildern.

    Versuchen wir unser Glück mit der nächsten Bildbeschreibung:

    Albert Einstein, auf einem Gemälde von Vincent van Gogh. Dargestellt mit wildem Haar, im Anzug und mit einer Pfeife oder einer Tafel in der Hand, umgeben von Sonnenblumen, Büchern und Formeln

    Folgende vier Bildvarianten werden mir zu dieser Beschreibung erstellt:

    Auch diese Bilder sind wenig beeindruckend. Nur eines, nämlich das erste, trifft die Thematik, liegt aber von der Bildqualität her weit unter dem Durchschnitt der hier vorgestellten Bildgeneratoren.

    Kommen wir zur dritten Bildbeschreibung.

    Da die Bildbeschreibung nicht länger als 77 Zeichen sein darf, kürze ich den bei anderen Generatoren verwendeten Text. Dieser lautet nun:

    Ein belebtes Stadtbild von Rom mit dem Kolosseum und dem Forum Romanum im Vordergrund und den roten Ziegeldächern und Kuppeln der Stadt im Hintergrund. Die Stimmung ist großartig und historisch, mit Sinn für antike Wunder

    Die Bilder sind auf den ersten Blick ansprechend, blickt man aber in der Vergrößerung auf die Details, lassen sich aber verschiedene Schwächen in den Abbildungen erkennen.

    Positiv ist allerdings, dass das Kolosseum in allen vier Bildern erkennbar, weshalb man davon ausgehen kann, dass es sich hier um eine Darstellung der Stadt Rom handelt.

    Nun zur vierten Bildbeschreibung:

    Die RMS Titanic in Paris, massiv, großartig und beeindruckend, schwimmt auf dem ruhigen Wasser der Seine, umgeben von beeindruckender Architektur, darunter die berühmte Kathedrale Notre Dame, Glockentürme und Paläste

    Hier erhalten wir die folgenden vier Bildvarianten:

    Auf allen vier Bildern ist zwar Paris erkennbar, zumindest wenn man davon ausgeht, dass es sich bei der abgebildeten Kirche und die Kathedrale Notre Dame handelt. Schiffe sind nur in zwei Bildern erkennbar.

    Allerdings handelt es sich dabei nicht um die RMS Titanic, sondern um die für die Paris typischen Ausflugschiffe.

    • Die Bildbeschreibung kann in Deutsch und einer Vielzahl weiterer Sprachen eingegeben werden.
    • Die Bilder können in einem großen Format und hoher Auflösung heruntergeladen werden.
    • Die Tarifgestaltung im Hinblick auf die Generierung von KI-Bildern finde ich befremdlich: Im Tarif „Personal“, der 24 Euro beziehungsweise 29 Euro pro Monat kostet, können keine KI-Bilder erzeugt werden. Im Tarif „Pro“ können diese dagegen generiert werden, hierzu muss man aber monatlich 79 Euro beziehungsweise 99 Euro aufwenden.
    • Damit macht es keinen Sinn, den Bild-Generator zu nutzen, nicht aber den Text-Generator, denn dann bezahlt man einen hohen Preis für eine geringe Leistung.
    • Es ist nicht möglich, das Bildformat auszuwählen und auch weitere Einstellungen wie etwa Stil oder Stimmung können nicht vorgegeben werden.

    Runway ML

    Was zeichnet Runway ML aus?

    Runway ML ist eigentlich eine Video-Editor-Plattform, vergleichbar mit den Funktionen, die Tools wie Adobe After Effects und DaVinci Resolve bieten.

    Das Rendering der Videos erfolgt dabei in der Cloud, wobei auch Videos in 4K-Auflösung bearbeitet und exportiert werden können. Runway ML bietet auch die Funktion „Text-to-Video“, die sich allerdings noch in einer frühen Entwicklungsphase befindet.

    Eine Besonderheit von Runway ML liegt in der Möglichkeit, generierte Bilder einfach und schnell bearbeiten zu können. Dabei können Bereiche markiert und dann mithilfe von eingegebenen Textbeschreibungen verändert werden.

    Ist Runway ML kostenlos?

    Es gibt eine kostenlose Testversion, für die Sie sich nach Angabe Ihrer Email-Adresse anmelden können. Zur kostenlosen Anmeldung geht es hier.

    Die kostenlose Version erlaubt ihnen die Anlage von drei Video-Projekten, die Arbeit mit 720p-Videos sowie die Generierung von 25 KI-Bildern, wenngleich deren Export eingeschränkt ist.

    Was kostet Runway ML?

    Neben der kostenlosen Version gibt es zwei zahlungspflichtige Tarife:

    Tarif Pro

    Der Pro-Tarif kostet 15 US-Dollar pro Monat bei monatlicher und 12 US-Dollar pro Monat bei jährlicher Bezahlung. Sie haben damit Zugriff auf einen 4K-Video-Editor, eine unbegrenzte Zahl von Projekten, 125 KI-Bildern und erweiterte Exportmöglichkeiten, nämlich ein Download als HD, 1080p und 2k.

    Tarif Team

    Der Tarif „Team“ kostet 35 US-Dollar pro Monat bei monatlicher und 28 US-Dollar pro Monat bei jährlicher Bezahlung. Ähnlich wie der Pro-Tarif haben Sie Zugriff auf einen 4K-Video-Editor und eine beliebige Zahl von Projekten. Pro Monat können Sie 450 KI-Bilder erzeugen und habe unlimitierte Exportoptionen, nämlich  Download als HD, 1080p, 2k, PNG und ProRres.

    Für wen empfiehlt sich Runway ML?

    Runway ML ist für all jene gut geeignet, die für einen überschaubaren monatlichen Betrag eine unbegrenzte Zahl von KI-Bildern erzeugen möchten und dabei Zugriff auf eine Vielzahl unterschiedlicher Tools haben möchten.

    Besonders gut eignet sich Runway ML auch für alle, die Videos editieren wollen, vor allem wenn man bedenkt, dass in der monatlichen Gebühr nicht nur den KI-Bildgenerator, sondern auch die Nutzung des Video-Editors umfasst.

    Wie erzeugt man KI-Bilder mit Runway ML?

    Nachdem Sie sich angemeldet haben, können Sie sich einen Überblick über die Ihnen zur Verfügung stehenden Tools machen. Alle mit einem Schloss gekennzeichneten Tools sind nur gegen Entrichtung einer einmaligen Gebühr verfügbar.

    Ihnen steht ein breites Spektrum von Tools zur Bearbeitung von Fotos, Video und Audio sowie zur Generierung von KI-Bildern zur Verfügung. Für diesen Artikel sind dabei die folgenden beiden Tools von Interesse:

    • Text to Image: Dies ist der eigentliche KI-Bildgenerator
    • Image to Image: Mit diesem Tool kann man KI-Bilder erzeugen, indem man ein eigenes Bild in das System lädt.

    Nachdem Sie sich angemeldet haben, finden Sie den Text-to-Image-Generator in der ersten Zeile der angezeigten Tools. Dort finden Sie unter der Überschrift „Prompt“ das Eingabefeld, in das Sie Ihre Bildbeschreibung eingeben.

    Wie bei den anderen Generatoren kopiere ich in das Textfeld die Beschreibung des ersten Bildes, das generiert werden soll, nämlich:

    Albert Einstein as a Cowboy in Paris

    Im Bereich „Settings“ finden sich mehrere Auswahlmöglichkeiten:

    Für diesen Test wähle ich Ratio: Landscape (3:2), Resolution 2560×1440 und vier Outputs.

    Dann klicke ich auf „Advanced“, um weitere wichtige Einstellungen vornehmen zu können:

    • Style, also der Kunststil.
    • Medium, sprich Technik.
    • Mood, die Stimmung.
    • Prompt Weight: Hier kann man einstellen, wie stark sich die Bildbeschreibung auf das finale Bild auswirkt. Ich behalte die Voreinstellung 7,5 bei.

    Um Runway ML möglichst neutral zu testen, halte ich mich bei der Wahl von Style, Medium und Mood zurück. Zunächst generiere ich vier Varianten, bei denen ich weder Style noch Medium oder Mood auswähle.

    Versuchen wir es mit dem ersten Prompt:

    Albert Einstein as a Cowboy in Paris

    Die mir präsentierten Bilder finde ich nicht beeindruckend. Auf einem Bild fehlt der Kopf von Albert Einstein, auf einem ist der Kopf nur teilweise sichtbar, auf einem anderen gibt es zwei Albert Einsteins und. Kein Bild erinnert weder an Cowboy noch an Paris.

    Versuchen wir es durch Auswahl von Style, Medium und Mood, um eine andere Version zu erhalten. Ich entscheide mich für Style: „Art Deco“, Medium „Oil Painting“ und Mood „Colorful“ und erhalte die folgenden vier Bildvarianten:

    Hier gewinnt man schon eher den Eindruck, dass es sich um Albert Einstein als Cowboy handeln könnte. Zudem ist Paris anhand des Eifelturms deutlich erkennbar, wenngleich dieser in zwei Bildern gleich doppelt auftaucht.

    Ich versuche noch eine andere Kombination: Style: „Pop Art“, Medium „Fresco“ und Mood „Dramatic“ und erhalte folgende Bildvarianten:

    Die generierten Bilder sind zwar beeindruckend, allerdings zeigen Sie Albrecht Einstein weder als Cowboy noch in Paris.

    Ich gehe nun zur nächsten Bildbeschreibung:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Zunächst lasse ich Runway ML vier Bildvarianten ohne jeglichen Style, Medium und Mood erzeugen:

    Zwei der Bilder, nämlich die beiden oberen sind völlig missraten. Das Bild rechts unten ist schlecht, aber das Bild links unten halte ich durchaus für gelungen.

    Ein weiterer Versuch, dieses mal mit Style: „Folk“, Medium „Glass“, Mood „Dramatic“:

    Die beiden unteren Bilder sind nicht gut, insbesondere beim linken fehlt Albert Einstein die Hälfte des Kopfes. Das Bild oben rechts gefällt mir ebenfalls nicht, das oben links ist dagegen aus meiner Sicht durch ansehnlich.

    Kommen wir zum nächsten Prompt:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Zunächst generiere ich vier Bildvarianten wiederum ohne Style, Medium und Mood:

    Die Bilder sind ansehnlich.

    Nun versuche ich noch die Generierung mit Style: „Retro“, Medium „Photography“, Mood „Warm“:

    Kommen wir nun zur Titanic in Paris mit dem folgenden Textprompt:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Hier erhalten wir ohne die Auswahl von Style, Medium und Mood folgende Bildvarianten:

    Vorsichtig gesagt: Die Darstellung der RMS Titanic zeichnet sich hier durch ein nicht geringes Maß an künstlerischer Freiheit aus. Oder anders formuliert: Man sieht zwar ein Schiff, dass es sich dabei um die Titanic handelt, ist nicht erkennbar. Hinzu kommt, dass sich in keinem der Bilder Elemente finden, die an Paris erinnern.

    Versuchen wir es mit einer anderen Variante: Style: Minimalism, Medium: Watercolor, Mood: Elegant:

    Vorzüge von Runway ML

    • Runway ML enthielt eine nahezu unübersehbare Zahl von Tools, mit denen auf unterschiedlichste Art Bilder generiert und bearbeitet werden könne. Dies gilt sowohl für Bilder, die man selbst in das System geladen hat als auch für solche, die man von Runway ML generieren ließ.
    • Die beträchtliche Zahl verschiedener Stile, Hintergründe und Modi erlaubt die Generierung unterschiedlichster Bilder auf einfache und schnelle Art. Ich möchte es aber noch weitergehender formulieren: Die Generierung von Bildern mit Runway ML auf Basis der Kombination von Stilen, Technik und Stimmung macht Spaß und kann durchaus süchtig machen.
    • Die Benutzung von Runway ML ist sehr einfach.
    • Angesichts der zahlreichen Tools, die Runway ML bietet, ist die Nutzungsgebühr erstaunlich niedrig.

    Nachteile von Runway ML

    • Die Generierung von Bildern in Runway ML dauert lange, länger als bei nahezu allen anderen KI-Bildgeneratoren.

    Deep AI

    Was zeichnet Deep AI aus?

    Ähnlich wie NightCafé sind in Deep AI eine Social Media-Funktionalitäten integriert: Sie können ein Profil anlegen und in diesem Bilder veröffentlichen. Gleichzeitig können Sie den Profilen anderen folgen und deren Bilder liken.

    Was kostet Deep AI?

    Es gibt bei Deep AI zwei Tarife:

    Tarif DeepAI PRO

    Der Tarif „DeepAI PRO“ kostet pro Monat 4,99 US-Dollar und erlaubt Ihnen die Erzeugung von 500 Bildern pro Monat.

    Tarif Pay as you go

    Der Tarif „Pay as you go“ kostet 5 US-Dollar monatlich für 100 API Calls. Dieser Tarif ist für „normale“ Endbenutzer nicht relevant, sondern eignet sich nur für Nutzer, die über ein Tool auf Deep AI zugreifen.

    Gibt es eine kostenlose Version von Deep AI?

    Es gibt eine kostenlose Version von Deep AI, in der dem Nutzer allerdings nur eine begrenzte Anzahl von Kunststilen und Optionen zur Verfügung stehen. Von besonderem Vorteil an der kostenlosen Version ist, daß keine Anmeldung notwendig ist.

    In der kostenlosen Version können Sie abhängig von den gewählten Optionen bis zu zehn Bildern erzeugen.

    Für wen empfiehlt sich Deep AI?

    Deep AI ist für all jene empfehlenswert, die sich mit KI Art beschäftigen wollen, ohne dabei viel Geld aufwenden zu wollen.

    Wie erzeugt man KI-Bilder mit Deep AI?

    Deep AI bietet drei verschiedene Generierungs-Modi sowie ein breites Spektrum von Einstellungsoptionen. Die drei Erzeugungsmodi sind: Text 2 Dream, Deep Style und Deep Dream.

    Im kostenlosen Modus wird der Nutzer mit zahlreichen Werbeeinblendungen behelligt, die sich sehr störend auswirken.

    Beginnen wir mit der ersten Bildbeschreibung, die wir in das Eingabefeld eingeben:

    Albert Einstein as a Cowboy in Paris

    Wir haben dann die Auswahl zwischen einer Reihe sogenannter „Styles“.

    Ich entscheide mich zunächst für den Text2Image Generator. Dann habe ich die Auswahl zwischen fünf verschiedene Bildformaten.

    Testweise wähle ich den Style „Renaissance Painting Generator“ und ein Portrait-Format, Hierauf erhalte mit dem gleichen Prompt folgendes Bild:

    Albert Einstein ist hier immerhin auf einem Pferd, dass es Einstein ist, erkennt man aber nicht unbedingt. Es gibt auch kein Bildelement, das mit Paris zu tun hätte.

    Kommen wir zur zweiten Bildbeschreibung:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Hier erhalten wir folgendes Bild:

    Albert Einstein ist darauf zwar deutlich erkennbar und auch die Sonnenblumen sind da. Wieso er aber gleich zweimal erscheint, ist mir persönlich ein Rätsel.

    Wenden wir uns der dritten Bildbeschreibung zu, das antike Rom:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Auf Basis dieses Prompts erhalten wir folgendes Bild:

    Es ist nicht erkennbar, dass es sich bei dieser Abbildung um Rom handelt, denn keines der bekannten Gebäude ist darauf erkennbar. Dies gilt insbesondere für die beiden Monumente, die in der Bildbeschreibung erwähnt sind, nämlich Kolosseum und Forum Romanum.

    Versuchen wir die vierte Bildbeschreibung, das Schiff RMS Titanic in Paris:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Deep AI erzeugt das folgende Werk:

    Wieso wieder zwei Schiffe, ähnlich wie zwei Albert Einsteins auf dem Bild erscheinen, kann ich wiederum nicht nachvollziehen. Auch ist die Ähnlichkeit der beiden Schiffe mit RMS Titanic weit geringer als in Abbildungen, die andere Generatoren erzeugt haben.

    Welche Stadt im Bild gezeigt wird, läßt sich nicht erkennen. Ich habe mit der gleichen Bildbeschreibung eine zweite Version des Bildes erzeugen lassen, wobei ich hier den Style „Renaissance Painting Generator“ gewählt habe.

    Das Bild ist etwas ansprechender als das erste. Trotzdem ist auf dem Bild weder die Titanic noch Paris erkennbar:

    deep ai review titanic paris 02a

    Das gleiche Prompt, allerdings mit dem Style „Impressionism Painting Generator“ ergibt ein Bild, das wiederum zwei Schiffe zeigt und auf dem von Paris nichts zu sehen ist:

    Im Style „Contemporary Architecture Generator“ liefert die gleiche Bildbeschreibung ein sonderbares Bild:

    Im Style „Fantasy World Generator“ entsteht ebenfalls ein sonderbares Bild. Allerdings bleibt Deep AI hier sich selbst treu und zeigt wiederum zwei Schiffe. Dass es sich dabei um die Titanic beziehungsweise Paris handelt ist allerdings nicht erkennbar.

    Vorzüge von Deep AI

    • Es gibt zahlreiche Optionen für die Erzeugung von Bildern. Erwähnenswert ist insbesondere die Möglichkeit, aus verschiedenen Kunststilen auszuwählen.
    • Die Bedienung von Deep AI ist besonders einfach.
    • Ein besonderer Vorteil von Deep AI liegt darin, dass eine kostenlose Version zur Verfügung steht.
    • Die Nutzung von Deep AI ist günstig.

    Nachteile von Deep AI

    • Die Generierung von Bildern bei Deep AI benötigt etwas Zeit.
    • Es wird nur ein Bild generiert, während andere KI-Bildgeneratoren vier Varianten ein- und desselben Bildes generieren.
    • Es ist nicht möglich, Bilder in unterschiedlichen Auflösungen zu erzeugen. Vielmehr müssen Sie sich mit der vorgegebenen Auflösung begnügen.

    Stable Diffusion

    Was zeichnet Stable Diffusion aus?

    Stable Diffusion wurde am 22. August 2022 von der Firma Stability AI auf den Markt gebracht und am 24. November 2022 folgte die Version 2.0.

    Es handelt sich dabei nicht um ein Software-Tool, das wie andere KI-Bildgeneratoren, auf eine spezifische Technologie zurückgreift, die von anderen wie etwa OpenAI bereitgestellt wird. Vielmehr handelt es sich um eine eigene Technologie, die Bildgeneratoren nutzen.

    Ihre wesentlichen Vorzüge liegen darin, dass sich die erzeugten Bilder nahe an den eingegebenen Bildbeschreibungen bewegen und dass das System überaus realistische Bilder erzeugt.

    Eine Besonderheit von Stable Diffusion liegt darin, dass der Quellquode des Systems öffentlich ist. Der Code hat mit 10 GB ein erstaunlich geringes Volumen und kann deshalb sogar auf einem PC laufen. Eine Anleitung wie Sie Stable Diffusion auf Ihrem PC installieren können, finden Sie hier.

    Was kostet Stable Diffusion?

    Stable Diffusion ist kostenlos.

    Für wen empfiehlt sich Stable Diffusion?

    Stable Diffusion empfiehlt sich für alle, die kostenlos KI-Bilder erzeugen wollen und vor allem für all jene, die sich mit dieser Technologie vertraut machen wollen.

    Wie erzeugt man KI-Bilder mit Stable Diffusion?

    Stable Diffusion bietet zwei Erzeugungsmodi an: Einen Modus für die Generierung von Bildern auf Basis einer Bildbeschreibung, einen anderen Modus auf Basis eines importierten Bildes.

    Da das Software-Tool kostenlos ist und die Ressourcen zwangsläufig begrenzt sind, bestehen erhebliche Wartezeiten bei der Bildgenerierung. Diese können bis zu 15 Minuten dauern.

    Wenn Sie auf der Website von Stable Diffusion nicht weiterkommen, können Sie mit den Suchbegriffen „Stable Diffusion Demo“ andere Installationen im Internet recherchieren.

    Eine populäre Demo von Stable Diffusion 2.1 finden Sie bei Huggingface.com.

    Anmelden kann man sich auch hier:

    Dreamstudio AI

    Nach Anmeldung erhalten Sie Zugang zu Stable Diffusion und können in das Eingabefeld die Beschreibung des gewünschten Bildes eingeben. Außerdem können Sie im Menü auf der rechten Seite verschiedene Voreinstellungen treffen.

    Rechts oben wird angezeigt, wie viele Credits die zu generierenden Bilder verbrauchen. Bei einem Bildformat von 512×512 Pixel kostet ein Bild 0,2 Credits.

    Ich lasse die Bildformat bei 512×512 Pixel und wähle die Option, dass mir vier Bilder erzeugt werden. Beim Modell wechsle ich auf „Stable Diffusion v2.1“, die aktuelle Version des Systems.

    Wie bei den anderen Bildgeneratoren beginne ich mit folgendem Prompt:

    Albert Einstein as a Cowboy in Paris

    Ich klicke auf den Button „Dream“ und warte ab:

    Die vier Bilder zeigen zwar Albert Einstein, allerdings ist die einzige Referenz an die Bildbeschreibung der Hut, den man im weitesten Sinne als Cowboy-Hut durchgehen lassen kann. Es gibt kein Element, das an Paris erinnert.

    Vielleicht war die Bildbeschreibung für Stable Diffusion zu kurz. Versuchen wir es mit einer längeren:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Ich gebe diese Bildbeschreibung in das Eingabefeld ein und klicke wieder den Button „Dream“:

    Insgesamt sind die Bilder gut, wenn auch nicht umwerfend, insbesondere im Vergleich mit anderen hier besprochenen KI-Bildgeneratoren.

    Versuchen wir es mit der nächsten Bildbeschreibung, dem antiken Rom:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Ich erhalte die folgenden vier Bildvarianten:

    Die vier generierten Bilder weisen eine starke Ähnlichkeit auf. Zudem ist nicht eindeutig erkennbar, dass es sich um Rom handelt. Auch wurden die wesentlichen Elemente der Beschreibung nicht in das Bild übernommen: Man sieht weder das Kolosseum noch das Forum Romanum.

    Bei diesen Bildern habe ich Stable Diffusion 1.5 verwendet. Wählt man Version 2.1 aus, so erhält man Bilder, die keineswegs besser als die der Version 1.5 sind:

    Die Bilder sind durchweg nicht überzeugend.

    Versuchen wir es mit der vierten Bildbeschreibung:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Hier die vier Bildvarianten, generiert mit der Stable Diffusion Version 1.5:

    Und hier mit der Version 2.1:

    Die Bilder sind weder in der Stable Diffusion-Version 1.5 noch in der Version 2.1 überzeugend. Ein Unterschied zwischen den beiden Versionen wird allerdings deutlich: In der neueren sieht man zumindest in zwei Bildern die Kathedrale Notre Dame.

    Vorzüge von Stable Diffusion

    • Die Nutzung von Stable Diffusion ist kostenlos, was definitiv ein großer Vorteil ist.
    • Stable Diffusion ist sehr einfach zu bedienen.
    • Es ist möglich, dass Sie auf Ihrem Rechner Ihre eigene Version von Stable Diffusion installieren, wodurch Sie nicht an die Limitationen im Hinblick auf Computerressourcen sind, die kostenlose Versionen des Systems im Internet haben.

    Nachteile von Stable Diffusion

    • Die Erzeugung von Bildern nimmt etwas Zeit in Anspruch, andere KI-Bildgeneratoren sind etwas schneller.
    • Wenngleich die Bildqualität zumeist gut ist, korrespondieren die generierten Bilder häufig nicht mit der Bildbeschreibung, wie dies der vorliegende Test gezeigt hat.

    Deep Dream Generator

    Was zeichnet Deep Dream Generator aus?

    Der Deep Dream Generator wurde von Alexander Mordvintsev, einem früheren Google-Mitarbeiter entwickelt. Er nutzt neuronale Netzwerke und erzeugt Bilder auf Basis von Bildbeschreibungen in Textform.

    Deep Dream Generator verfügt über Social Media-Funktionen: Sie können ein eigenes Profil inklusive einem frei wählbaren Hintergrundbild einrichten, Bilder dort speichern und publizieren. Außerdem können Sie anderen Nutzern folgen und deren Bilder liken.

    Was kostet Deep Dream Generator?

    Es gibt drei Tarife:

    Tarif Advanced

    Der Tarif Advanced kostet 19 US$ pro Monat. Für diesen Betrag erhält man 120 Energy Credits / Energiepunkte und eine Bildauflösung von Full HD (2,1 MP) sowie 20 GB Online-Speicher.

    Tarif Professional

    er Tarif Professional kostet Sie 39 US$ pro Monat. 250 Energy Credits / Energiepunkte, Bilder in Quad HD+ Auflösung (5 MP) und 50 GB Online-Speicher.

    Tarif Ultra

    Für den Tarif Ultra sind pro Monat 99 US$ zu entrichten. 750 Energy Credits / Energiepunkte, Bilder in Quad HD+ Auflösung (5 MP) und 200 GB Online-Speicher.

    Ist Deep Dream Generator kostenlos?

    Es gibt eine kostenlose Version von Deep Dream Generator, die es erlaubt, sich mit der Funktion des Systems vertraut zu machen. Mit den 100 Credits, die Sie kostenlos erhalten, können Sie abhängig von der Bildqualität und weiteren Einstellungen bis zu zehn Bilder erzeugen.

    Für wen empfiehlt sich Deep Dream Generator?

    Deep Dream Generator empfiehlt sich besonders für Künstler, die auf einfache Art kreative Werke erzeugen und diese rasch bekanntmachen wollen.

    Wie erzeugt man KI-Bilder mit Deep Dream Generator?

    Nach der Anmeldung stehen dem Benutzer drei verschiedene Erzeugungsmodi zur Verfügung.

    Zudem gibt es eine Reihe von Optionen, mit denen Sie auf die Gestaltung der von Ihnen erzeugten Bilder Einfluss nehmen können.

    Nach der Anmeldung für die kostenlose Version haben Sie die Wahl, zwischen den drei Erzeugungsmodi. Ich wählte „Text 2 Dream“ und gebe wie bei den anderen KI-Bildgeneratoren meinen ersten Prompt ein:

    Albert Einstein as a Cowboy in Paris

    Zu diesem Prompt kann man noch einen sogenannten „Modifyer“ auswählen. Diese sind in mehrere Kategorien gegliedert, nämlich Generic, Artists, Quality, Effects und Photography.

    Sie können dann zwischen sieben verschiedenen sogenannten KI-Modellen auswählen.

    Bei Aspect Ratio, sprich dem Bildformat kann man auswählen zwischen Square, Landscape und Portrait, sprich Quadrat, waagrechtes Rechteck und senkrechtes Rechteck.

    Dann kann man bei Quality zwischen „Normal“ und „High“ auswählen.

    Ich wähle zunächst Artistic und erhalte folgendes Bild:

    Das Bild, das uns Deep Dream Generator generiert hat, ist gar nicht so schlecht, wenngleich Albert Einstein nicht unbedingt wie ein Cowboy aussieht. Ebenso ist nicht erkennbar, dass sich das Ganze in Paris abspielt. Lediglich Pferd und Reiter im Hintergrund könnten im an den Begriff „Cowboy“ erinnern.

    Nun versuche ich es mit dem zweiten Prompt:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Hier wähle ich als „Aspect Ratio“ „Portrait“, um ein senkrechtes Bild zu erhalten. Außerdem klicke ich auf „Modifiers“ und wähle unter „Artists“ „Van Gogh“:

    Das Bild, das ich erhalte, ist sehr gut. Aus meiner Sicht sogar das Beste, das ich bisher bei meinem Vergleichstest bekommen habe.

    Nun zum dritten Text-Prompt, der Stadt Rom:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Basierend auf dieser Bildbeschreibung erhalte ich folgende AI Art:

    Dieses Bild sieht völlig anders aus als die meisten anderen hier präsentierten Kunstwerke. Es überrascht durch seine Präsenz, allerdings ist das dreifache Auftauchen des Kolosseums und das Fehlen des Forum Romanum im Bild.

    Zum vierten Prompt:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Wir erhalten nun folgendes KI-Kunstwerk:

    Auch dieses Bild zeichnet sich wieder durch eine große Präsenz aus. RMS Titanic ist zwar nicht originalgetreu getroffen, um dies zu erkennen, muss man aber das Schiff genau kennen und wissen, dass dieses vier und nicht fünf große Kamine hatte.

    Vorzüge von Deep Dream Generator

    • Das System bietet drei KI-Algorithmen und eine Reihe von Einstellmöglichkeiten, mit denen Sie auf die Inhalte der von Ihnen generierten Bilder Einfluß nehmen können.
    • Als Input ist sowohl die Eingabe einer Bildbeschreibung in Textform als der Upload eigener Bilder möglich.
    • Die Qualität der generierten Bilder ist hoch.
    • Das System ist einfach zu benutzen.

    Nachteile von Deep Dream Generator

    • Die Benutzerführung ist weniger intuitiv als die bei anderen Bildgeneratoren.
    • Die Bezahlversion von Deep Dream Generator ist teuer.
    • Die Verwendung und Abrechnung der eingekauften Credits ist etwas verwirrend.
    • Sie haben kein exklusives Copyright auf Ihre Bilder.

    Wombo Dream / Dream by WOMBO

    Was zeichnet Wombo Dream aus?

    Die in Kanada ansässigen Entwickler von Wombo Dream wollten einen Bild-Generator schaffen, der vor allem NFTs erzeugt und damit den Ansprüchen von NFT-Künstlern besondere Beachtung schenkt. Deshalb überrascht es auch nicht, dass sich dieses von Wombo Studios, Inc. entwickelte Tool besonders gut zur Generierung von NFTs eignet.

    Im Gegensatz zu nahezu allen anderen KI-Bildgeneratoren können Sie Wombo Dream nicht nur auf PC und Notebook, sondern auch mobil nutzen und ist als App im Google Playstore und im Apple Appstore erhältlich.

    Sie finden Dream by Wombo unter folgenden Links:

    Google Playstore

    Apple Appstore

    Was kostet Wombo Dream?

    Die Premium-Version kostet 9,99 US-Dollar pro Monat bei monatlicher Bezahlung und 7,50 US-Dollar monatlich bei jährlicher Bezahlung.

    Die Bezahlversion gibt dem Nutzer Zugriff auf eine Reihe von Funktionen, die nicht in der kostenlosen Version enthalten sind. Hierzu zählen insbesondere sogenannte „Premium Styles“, sprich spezifischen Kunststilen. Zudem können vier anstelle von einer Version gleichzeitig erzeugt werden.

    Ist Wombo Dream kostenlos?

    Es gibt eine kostenlose Version des Wombo Dream KI-Bildgenerator. Außerdem kann die Bezahlversion mit einer Drei-Tage-Testversion genutzt werden.

    Für wen empfiehlt sich Wombo Dream?

    Wombo Dream eignet sich für all jene, die damit beginnen, sich mit KI-Kunst zu beschäftigen und die erste eigene Werke erzeugen wollen. Dream by Wombo empfiehlt sich außerdem für Nutzer, die auf ihrem Smartphone oder iPhone AI Art produzieren wollen.

    Wie erzeugt man KI-Bilder mit Dream by Wombo?

    Man kann sowohl auf Basis eines eingegebenen Textes als auch durch Auswahl eines Kunststils Bilder erzeugen.

    Es ist auch möglich, eigene Bilder in das System zu laden und basierend hierauf neue Werke zu schaffen. Eine Funktion, die ich nur in meiner ausführlichen Besprechung von Wombo Dream vorstelle, die Sie hier finden.

    Nachdem Sie sich angemeldet haben, können Sie Ihre Bildbeschreibung in das Feld „Enter prompt“ eingeben. Dann wählen Sie den sogenannten „Art Style“ aus, wo Ihnen eine sehr große Zahl unterschiedlicher Stile zur Verfügung stehen.

    Versuchen wir es mit der ersten Beschreibung:

    Albert Einstein as a Cowboy in Paris

    Als „Art Style“ wähle ich „Realistic v2“, klicke auf den Butten „Create“ und erhalte folgendes Bild:

    Albert Einstein sieht zwar nicht wie ein Cowboy aus und hat auch kein Pferd. Zumindest steht aber neben ihm ein Cowboy auf einem Pferd. Auch ist im Hintergrund der Eifelturm sichtbar, womit deutlich wird, dass sich das Ganze in Paris abspielt.

    Kommen wir zur nächsten Bildbeschreibung:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Auch hier wähle ich wieder „Realistic v2“ als Art Style, worauf mir Dream by Wombo folgendes Bild berechnet:

    Das generierte Bild ist ebenfalls nicht schlecht und besser als der Durchschnitt der hier von anderen KI-Bildgeneratoren mit diesem Prompt erzeugten Bilder.

    Kommen wir zur Stadtansicht von Rom. Da das Eingabefeld auf 200 Zeichen begrenzt ist, muss ich die mit anderen KI-Bildgeneratoren verwendete Bildbeschreibung etwas kürzen:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical

    Folgendes Bild erhalte ich hierauf von Dream by Wombo:

    Auch die nächste Bildbeschreibung müssen wir wieder etwas kürzen, um innerhalb des 200-Zeichen-Limits zu bleiben:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame

    Das Bild, das Dream by Wombo auf Basis dieses Prompts erzeugt, sieht folgendermaßen aus:

    Vorzüge von Wombo Dream

    • Es gibt eine kostenlose Version von Wombo Dream.
    • Die Bezahlversion von Wombo Dream ist mit 7,50 US-Dollar pro Jahr günstiger als viele andere KI-Bildgeneratoren.
    • Wombo Dream gibt es sowohl für Desktop-PC und Notebook, als auch für Smartphone und iPhone.

    Nachteile von Wombo Dream

    • Es ist in der kostenlosen Version nicht möglich, Bilder in einem anderen Format als dem senkrechten zu erzeugen.
    • In der kostenlosen Version kann man Bilder nicht abspeichern, weshalb es wichtig ist, diese gleich herunterzuladen.

    Craiyon

    Was zeichnet Craiyon aus?

    Craiyon hatte ursprünglich die Bezeichnung DALL-E Mini, wenngleich es keine Beziehungen dieses Tools mit DALL-E von OpenAI gibt. Entwickelt wurde die Software von Boris Dayma im Rahmen eines Programmierwettbewerbs.

    Der Quellcode von Craiyon ist offen und kann bei Github eingesehen oder heruntergeladen werden.

    Eine Besonderheit an Craiyon ist, dass es diesen auch als Android-App für Smartphones gibt.

    Was kostet Craiyon?

    Neben einer kostenlosen Version gibt es zwei Bezahlversionen:

    Tarif Supporter

    Der Tarif „Supporter“ kostet sechs US-Dollar pro Monat bei monatlicher Bezahlung und fünf US-Dollar bei jährlicher Bezahlung. Man kann in diesem Tarif zwar eine unbegrenzte Zahl von Bildern erzeugen, allerdings liegt die Zeit für die Generierung bei rund einer Minute.

    Im Gegensatz zur kostenlosen Version gibt es keine Werbeeinblendungen, die Bilder haben kein Wasserzeichen und sie sind privat, sind also nicht anderen zugänglich.

    Tarif Professional

    Der Tarif „Professional“ kostet 24 US-Dollar pro Monat bei monatlicher Bezahlung und 20 US-Dollar bei jährlicher Bezahlung. Auch in diesem Tarif kann eine unbegrenzte Zahl von Bildern erzeugt werden, wobei die Wartezeit bei der Generierung in der Regel unter 20 Sekunden liegt.

    Auch hier gibt es keine Werbeeinblendungen, keine Wasserzeichen und können von anderen Nutzern nicht eingesehen werden.

    Ist Craiyon kostenlos?

    Es gibt eine kostenlose Version von Craiyon, mit der man eine unbegrenzte Zahl von Bildern erzeugen kann. Allerdings dauert in dieser Version eine Wartezeit für die Fertigstellung eines Bildes ein bis zwei Minuten. Zudem gibt es zahlreiche Werbeeinblendungen in der kostenlosen Version.

    Für wen empfiehlt sich Craiyon?

    Craiyon empfiehlt sich für all diejenigen, die sich mit KI-Bildgeneratoren vertraut machen wollen und die einen einfach zu bedienenden, kostenlosen Generator suchen.

    Wie erzeugt man KI-Bilder mit Craiyon?

    Nach der Anmeldung bei Craiyon wird man auf die Seite mit dem Eingabe-Prompt geleitet. Dort gebe ich die erste Bildbeschreibung ein, nämlich:

    Albert Einstein as a Cowboy in Paris

    Folgend neun Bildvarianten erzeugt Craiyon auf Basis dieser Bildbeschreibung:

    Die generierten Bilder sind wenig überzeugend und liegen qualitativ am unteren Ende der hier getesteten KI-Bildgeneratoren.

    Versuchen wir es mit der nächsten Bildbeschreibung:

    Albert Einstein, in a Vincent van Gogh painting. Depicted with wild hair, wearing a suit and holding a pipe or blackboard, surrounded by sunflowers, books and formulas

    Hier die neun erzeugten Bildvarianten:

    Auch die mit diesem Prompt erzeugten Bilder sind nicht beeindruckend, andere Generatoren kommen zu weit besseren Ergebnissen.

    Das gleiche gilt für den Prompt mit der Stadtansicht von Rom:

    A bustling cityscape of Rome, with the Colosseum and the Roman Forum in the foreground, and the city’s famous red-tiled roofs and domes in the background. The mood is grand and historical, with a sense of ancient wonder and architectural beauty

    Hier die Bilder, die auf Basis dieser Beschreibung erzeugt wurden:

    Kommen wir zur vierten Bildbeschreibung:

    RMS Titanic in Paris, massive, grand, and impressive, floating on the calm waters of the river Seine, surrounded by stunning architecture, including the famous cathedral Notre Dame, bell towers, and ornate palaces, with a serene and peaceful atmosphere, with boats, and people moving along the waterways

    Hier erhalten wir folgende vier Bildvarianten:

    Die Bilder zeigen zwar ein großes Schiff, das die Titanic sein könnte, von Paris fehlt aber leider jede Spur.

    Vorzüge von Craiyon

    • Die Nutzung von Craiyon ist kostenlos.
    • Die Benutzerführung von Craiyon ist durchdacht und die Bedienung einfach.
    • Positiv ist, daß es Craiyon auch als Smartphone-App für Android gibt.
    • Craiyon erzeugt in einem Durchgang neun Varianten und damit weit mehr als andere KI-Bildgeneratoren.

    Nachteile von Craiyon

    • Die Werbeanzeigen werden manche Nutzer als störend empfinden.
    • Die Generierung der Bilder braucht Zeit, das System ist langsamer als viele Konkurrenten. Gleichzeitig werden während der Erzeugung der Bilder Werbeanzeigen eingeblendet.
    • Die Qualität der Bilder liegt beträchtlich unter der nahezu aller Konkurrenten, insbesondere wenn es um Gesichter geht.