Stable Diffusion is creative Napalm and I love it
I love the smell of a creativeAI-lawsuit in the morning, award winning painting by Alex Ross, in the style of Napster, trending on artstation
GOOD INTERNET ELSEWHERE // Twitter (Newsletter) / Twitter (Links) / Facebook (Newsletter) / Facebook (Links) / Instagram (Pics and Memes) / Reddit (Links) / Telegram (Links)
SUPPORT // Substack / Patreon / Steady / Ko-Fi / Paypal / Spreadshirt
Musicvideos have their own Newsletter now: GOOD MUSIC. All killers and absolutely zero fillers. The latest issues featuring Arctic Monkeys, Catbite, Fidlar, De Lux, Magdalena Bay, Gilla Band and many more. You can also find all the tracks from all Musicvideos in a Spotify-Playlist.
A Data-Explorer for Stable Diffusion
Have you ever danced with the devil in the pale moonlight? (The Joker in Tim Burtons Batman, 1989)
Ich hatte in der Vergangenheit hier bereits aufgeschrieben, wie Bild-Generatoren wie Dall-E die Arbeit von Illustratoren und Designern verändern und warum diese Bild-Generatoren sich möglicherweise in rechtlichen Fallstricken wiederfinden könnten, die die kommerzielle Anwendung dieser Technologie verzögern könnten.
Im Wired-Magazin kommen einige Künstler zu Wort, deren Arbeiten in dem Datenset zu finden sind, auf dem nun Stable Diffusion, das "Most Important AI Art Model Ever", trainiert wurde.
Stable Diffusion wurde vor einer Woche als Open Source-Model veröffentlicht und die Geschwindigkeit der Innovationen ist atemberaubend. Schon jetzt finden sich unzählige Adaptionen der Technologie für Video-Anwendungen, Plugins für Bildbearbeitungsprogramme wie Photoshop, GIMP und Krita und neu implementierte Techniken wie img2img erzeugen Präzision in der Illustrations-Generation, die mit Bildgeneratoren wie Dall-E vor ein paar Tagen noch nicht möglich gewesen wäre. Der Beruf des Illustrators wird sich wahrscheinlich alleine durch die Veröffentlichung von Stable Diffusion in rasender Geschwindigkeit verändern und nicht wenige der eher unqualifizierten Illustratoren dürften auf absehbare Zeit ihren Job verlieren: Das AI-Modell ermöglicht bereits jetzt den vollständig automatisierten Einsatz in Low End-Anwendungsfällen wie User-Avataren.
Das Problem und der von mir oben angerissene rechtliche Fallstrick: Keiner der Künstler in dem gigantischen Datenset, auf dem Stable Diffusion trainiert wurde, hat sein Einverständnis gegeben. Das Web-Crawling für solche Datensätze ist zwar legal, allerdings in engen Anwendungsgebieten und ich fürchte, dass das Web-Crawling für den Einsatz für kommerzielle Anwendungen schlichtweg illegal ist. Das bedeutet, das hier eine komplette technologische Infrastruktur mit extrem mächtigen Werkzeugen zur Produktion von Illustrationen entsteht, die auf einem rechtlich angreifbaren Fundament aufgebaut werden. Auch das dürfte ein Grund dafür sein, warum sich Adobe, die selbst an Systemen von Creative AI forschen und Technologien zur Bild-Forensik vorgestellt haben, bislang in diesem Sektor auffällig zurückhalten.
Um die rechtliche Lage der Bild-Generatoren einzuschätzen, wäre es hilfreich, die Daten erforschen zu können, auf dem diese Kreativmaschinen aufgebaut werden. Der bekannteste Bildgenerator Dall-E wurde auf 400 Millionen Bildern und ihren Textbeschreibungen trainiert, OpenAI verscheigt allerdings bislang die genaue Quelle der Bilder. Im Gegensatz dazu hat Stable Diffusion seine Datenquellen offengelegt.
Andy Baio und Simon Willis haben nun die Datensätze kopiert und ein Tool gebaut, mit dem man einen kleinen Teil der verwendeten Bilder erforschen kann: "about 2% of the 600 million images used to train the most recent three checkpoints, and only 0.5% of the 2.3 billion images that it was first trained on".
In einem langen Artikel hat Andy Baio die Daten nun ausgewertet und alleine die Verwendung der Comic-Figuren in einem Data-Set, das nun Einzug in kommerzielle wie nicht-kommerzielle Werkzeuge auf der ganzen Welt findet und einen ganzen Berufszweig nachhaltig verändern wird, dürfte in den Rechtsabteilungen von Disney alle Alarmglocken klingeln lassen.
Characters from the MCU like Captain Marvel (4,993 images), Black Panther (4,395), and Captain America (3,155) are some of the best represented in the dataset. Batman (2,950) and Superman (2,739) are neck and neck. Luke Skywalker (2,240) has more images than Darth Vader (1.717) and Han Solo (1,013). Mickey Mouse barely breaks the top 100 with 520 images.
Auch die weiteren Details zum Data-Set sind urheberrechtlich, sagen wir mal, interessant, vor allem der Abschnitt zu den Stock Image Sites unten:
Nearly half of the images, about 47%, were sourced from only 100 domains, with the largest number of images coming from Pinterest. Over a million images, or 8.5% of the total dataset, are scraped from Pinterest’s pinimg.com CDN.
User-generated content platforms were a huge source for the image data. WordPress-hosted blogs on wp.com and wordpress.com represented 819k images together, or 6.8% of all images. Other photo, art, and blogging sites included 232k images from Smugmug, 146k from Blogspot, 121k images were from Flickr, 67k images from DeviantArt, 74k from Wikimedia, 48k from 500px, and 28k from Tumblr.
Shopping sites were well-represented. The second-biggest domain was Fine Art America, which sells art prints and posters, with 698k images (5.8%) in the dataset. 244k images came from Shopify, 189k each from Wix and Squarespace, 90k from Redbubble, and just over 47k from Etsy.
Unsurprisingly, a large number came from stock image sites. 123RF was the biggest with 497k, 171k images came from Adobe Stock’s CDN at ftcdn.net, 117k from PhotoShelter, 35k images from Dreamstime, 23k from iStockPhoto, 22k from Depositphotos, 22k from Unsplash, 15k from Getty Images, 10k from VectorStock, and 10k from Shutterstock, among many others.
Mit anderen Worten: Wer sich bereits zu Napster-Zeiten hervorragend über die absurdistische rechtliche Situation des Urheberrrechts in digitalen Zeiten amüsiert hat, dürfte in den kommenden Jahren voll auf seine Kosten kommen.
Stable Diffusion hat heute Nacht die neue Version 1.5 seines Bildgenerators in einer neuen Beta-Phase auf Discord gestartet. Hier einige weitere Variationen von “a very serious lawyer in a sharp black suit is shaking hands with batman and the joker in gotham at night”, frisch vom Bot aus dem Latent Space gefischt. Ich liebe diese Joker-Lawyer-Mashups und Warner is not amused. (But I am).