Dieses KI-Tool vereint die Kontrolle von Stable Diffusion und die Bildqualität von Midjourney – Es heißt Distillery
In der Welt der KI-Bild-Generatoren ragen zwei Namen heraus: Midjourney und Stable Diffusion. Midjourney kann Bilder von außergewöhnlicher Qualität erzeugen, lässt sich aber nicht auf deinem eigenen Gerät ausführen. Stable Diffusion ist berühmt dafür, Open-Source zu sein, doch die Qualität des Basismodells ist nach wie vor weit von Midjourney entfernt.
Nun gibt es ein KI-Modell, das die Kontrolle von Stable Diffusion mit der Benutzerfreundlichkeit und einer Qualität ähnlich der von Midjourney kombiniert – es heißt Distillery.
Was ist Distillery?
Distillery ist ein KI-Kunst-Generator, der vollständig Open-Source ist und von FollowFox entwickelt wurde, einem KI-Venture-Studio, das sich auf kleine KI-Modelle konzentriert. Laut dem Unternehmen sind sie bestrebt, alle ihre Backends und Modelle gegenüber der Community offenzulegen.
Distillery ist Open-Source
FollowFox hat sein neuestes Modell Cosmopolitan veröffentlicht, das auf Stable Diffusion 1.5 (SD 1.5) basiert. Dieses leistungsstarke Modell hat sich als hochgradig fähig für allgemeine Anwendungsfälle erwiesen und kann kostenlos auf Distillery in Discord genutzt werden.
Im Einklang mit seiner Open-Source-Philosophie macht das Unternehmen seine Trainingsmethoden und Codes öffentlich zugänglich.
Der Entwicklungsprozess umfasste mehrere Schritte: Auswahl und Erstellung eines Datensatzes, Feinabstimmung des Modells und Mischen verschiedener Modellversionen, um das gewünschte Ergebnis zu erzielen. Das Team hat offensichtlich eine Menge harter Arbeit investiert, um Distillery Wirklichkeit werden zu lassen.
Du kannst das Open-Source-Modell auf CivitAI ausprobieren, um das Modell lokal auf deinem Gerät auszuführen.
Distillery auf CivitAI
Wenn du mehr darüber erfahren möchtest, wie das Backend von Distillery funktioniert, schau dir diesen Artikel an.
So kannst du es ausprobieren
Es gibt zwei Möglichkeiten, das Cosmopolitan-Modell auszuprobieren:
In diesem Beispiel zeige ich dir den Prozess der Bilderzeugung auf Discord. Gehe zum free-generations-Kanal.
Distillery auf Discord
Drücke die „/“-Taste und du wirst einige Optionen sehen:
- /command-infos – Informationen zu Distillery-Befehlen
- /serve – Erstelle vier hochskalierte Bilder mit bezahlten Modellen
- /serve-free – Erstelle vier hochskalierte Bilder mit kostenlosen Modellen
- /suggest – Erstelle einen ausführlichen Prompt aus einfachem Text mit Distillerys LLMs
- /upscale – Skaliere ein Bild mit dem bezahlten Modell hoch
- /upscale-free – Skaliere ein Bild mit dem kostenlosen Modell hoch
- /zoomout – Zoome ein Bild heraus
Distillery-Befehle auf Discord
Prompt: Ein Bild eines Astronauten, der auf dem Mond ein Pferd reitet
Die Bilderzeugung dauerte etwa eine Minute. Was denkst du über die Ergebnisse? Ich finde, sie sehen ziemlich gut aus; das Detailniveau ist außergewöhnlich.
Sie sind wahnsinnig detailliert und auf einer Stufe mit Midjourney.
LoRA
LoRA oder Low Rank Adaptation ist eine optionale und einfache Möglichkeit, einen vortrainierten Stil zu deinen generierten Bildern hinzuzufügen.
Es gibt Dutzende kuratierte LoRAs, die in die Standard-Modelle von Distillery integriert sind. Für beste Ergebnisse ist es wichtig, die LoRAs mit ihren entsprechenden Aktivierungswörtern im Prompt zu verwenden.
Hier sind einige Beispiele:
Prompt: /serve-free ein Astronaut, der auf dem Mars Fahrrad fährt — lora realism — image
Distillery Beispielbild
Prompt: /serve-free ein Foto von Jennifer Lawrence, die in einem Pariser Café sitzt, Analog-Stil — lora analog — cfg 5 — seed 2000 — neg deformiert, schlechte Qualität — ar 16:9
Distillery Beispielbild
Derzeit haben Nutzer Zugriff auf über 90 verschiedene Stile. Nutzer können bis zu fünf unterschiedliche LoRAs in einem Prompt mischen, was zu positiv unerwarteten Kreationen führen kann. Ich liebe die Möglichkeit, so viele Stile und Einflüsse in einem einzigen Bild zu kombinieren.
Distillery Beispielbild
Siehe die komplette Liste der unterstützten LoRAs hier.
Stile mischen
Ein einzigartiges Merkmal von Distillery ist die Möglichkeit, Stile zu mischen und ein Bild als Basis für die Generierung zu verwenden. Nachfolgend ist eine Demonstration, wie man ein Bild eines Kriegers mit einem Hintergrund des Ipanema-Strandes unter Verwendung der Control- und Adapt-Funktionen von Distillery zusammenführt.
Distillery-Beispiel für gemischte Stile
Das ist großartig.
Hier ist ein weiteres Beispiel für den praktischen Einsatz von Distillery. Das erwartete Endergebnis ist eine Mischung aus Realismus und Magie, die offene Fenster zu unendlichen kreativen Möglichkeiten symbolisiert. Um die Ergebnisse zu erhalten, wird ein Bild eines „offenen Fensters“ als Basisbild und ein zweites Bild für den Stil verwendet.
Distillery-Beispiel für gemischte Stile
Es braucht einige Zeit, um sich mit allen Funktionen, Modellen, Stilen und deren Anwendungsfällen in Distillery vertraut zu machen, aber sobald man damit vertraut ist, wird es am interessantesten, denn dann kann man alles zusammen nutzen und anfangen, Stile und Bilder zu mischen, um neuartige Entdeckungen zu machen.
Preisgestaltung
Distillery ist ein Freemium-Produkt auf Discord mit drei Service-Stufen:
- Kostenlos – Dies gibt dir 10 kostenlose Generierungen pro Tag. Jede kostenlose Anfrage liefert dir vier hochauflösende Bilder (1024×1024 Pixel).
- Early User – Dies kostet 9,99 $ pro Monat. Du bekommst 300 Premium-Generierungen pro Monat, ohne tägliche Nutzungsbegrenzungen. Jede Anfrage liefert dir 4 Bilder (im Gegensatz zu den 2 in der kostenlosen Stufe).
- Founders‘ Pass – Für 24,99 $ bekommst du 1.000 Premium-Anfragen pro Monat (3,33x mehr als der Early User). Founders‘ Pass-Mitglieder erhalten lebenslangen Zugang zu allen zukünftigen öffentlichen Stufen und damit verbundenen Angeboten.
Distillery Preisgestaltung
Beachte, dass dies noch eine Alpha-Version des Modells ist und sich in Zukunft noch verbessern könnte.
Wir müssen betonen, dass dies immer noch unsere MVP ist. Wir haben große Pläne für Distillery in der allernächsten Zukunft, und wir freuen uns sehr darauf, sie in kommenden Beiträgen zu erörtern.
Abschließende Gedanken
Insgesamt zeichnet sich Distillery als bemerkenswert offenes Bild-Modell aus, das die Qualität von Midjourney erreicht und gleichzeitig die meiste Kontrolle über den Generierungsprozess bietet. Die Open-Source-Natur des Bild-Modells macht es auch zu einer attraktiven Wahl für diejenigen, die es in ihre eigenen Produkte integrieren möchten.
Distillery befindet sich noch in der Entwicklung, daher können wir Verbesserungen in den nächsten Iterationen erwarten. Dies ist eines, das in den kommenden Monaten genau zu beobachten ist!