Redaktionellt | 9 Dec 2022 | Lena Källberg

AI- bör kreatörer bäva?

Kommer artificiell intelligens göra fotografer överflödiga i framtiden? Bör yrkeskåren bäva? Framför allt genrebilder kommer snart att ersättas av AI-bilder, tror Marcus Weiland som driver AI-företaget Savantic. Men bröllopsfotografer och fotojournalister lär fortfarande behövas. Text: Lena Källberg. Bilder: Lena Källberg/Redaktionen/AI

AI- bör kreatörer bäva?

Den här bilden skapade MidJourney när prompten löd »en dokumentär bild i svartvitt, från 1930-talet, av en kvinna som kör bil«.

Ofta är det med en blandning av skräck och skratt man betraktar resultaten som bildskapande AI-verktyg spottar ur sig. Ska detta föreställa vår nya visuella värld? Är det här den bildvärld som maskinerna kommer att ersätta våra manuellt framställda fotografier med framöver?

Som så ofta när tekniken rör sig snabbt i nya riktningar börjar vi människor oroa oss för att maskinerna ska ta över våra liv och våra jobb. Och kanske hade vi hoppats att just våra kreativa yrken skulle klara sig undan den artificiella intelligensens inblandning. Men det verkar inte så.

Många fotografer använder förmodligen redan ett antal AI-baserade verktyg, kanske utan att tänka på det: innehållsanpassad borttagning, snabbmarkeringar och inte minst de neurala filter som finns i Photoshops senaste versioner och bygger på AI-teknik. Vi ser de här funktionerna som användbara hjälpmedel snarare än som hot mot våra jobb, men när AI-tekniken börjar skapa sina egna alster kan det börja kännas mer hotfullt.

Det här är resultatet av en MidJourney-prompt i stil med »modefoto från 1970-talet med bleknade Polaroid-färger«.

 


Det här är resultatet av en MidJourney-prompt i stil med »modefoto från 1970-talet med bleknade Polaroid-färger«.

Jag ber Marcus Weiland, vice vd på AI-företaget Savantic, att berätta hur han tror att AI kommer att påverka vårt bildskapande framöver. Han tror att våra skapande yrken kommer att påverkas lika mycket av AI-tekniken som alla andra områden.

– AI kan användas till så mycket, så frågan är inte om, utan när, AI gör entré, i bransch efter bransch. När det gäller kreativa yrken ser vi ju att AI redan används inom musik, text, design och illustration. 

Men det här med att skapa bilder från grunden med AI, hur funkar det egentligen?

– För att en AI ska kunna skapa något måste den först tränas, vilket betyder att den lär sig upptäcka mönster i data. Den visuella kreativiteten – om vi nu tillåter oss att kalla den så – hos en AI uppstår ur kopplingarna mellan bilder och de texter som beskriver dem. Dall-E 2, till exempel har tränats genom att titta på 650 miljoner bilder på internet och deras textbeskrivningar, säger han.

Tekniken som används kallas GPT-3. Den användes från början för att skapa texter med hjälp av AI, utifrån några få ord, en så kallad prompt. Det visade sig att samma teknik, med vissa justeringar, går utmärkt att använda även för att skapa bilder.

– Så utgångspunkten för att skapa bild är densamma, man beskriver i text, mer eller mindre detaljerat, vilken bild man vill ha. AI-modellen jobbar en stund och presenterar sedan en eller flera bildvarianter som den tycker passar, enligt sin egen uppsättning associationer mellan bild och text, säger Marcus.

Det låter ju smidigt. Men jobben då? Kommer AI att göra fotografer överflödiga?

– Nej, det tror jag inte.  Jag tror att genrebilder, stockfoton, i allt högre grad kommer att skapas med AI-verktyg, men det går ju inte att helt överlåta till en AI att skapa till exempel bröllopsfoton eller reportagebilder. Många bilder måste ju fortfarande fotograferas på en verklig plats.

En AI är bra på att utföra smala, väl definierade, uppgifter, men den har ju ingen fotografisk blick, så människan behövs fortfarande för att ge instruktioner och välja ut rimliga bilder.

– Jag tror framför allt att AI kommer att användas till tidsödande redigering, exempelvis för att restaurera bilder, säger han.

Kanske blir det snarare så att det kommer att skapas en ny yrkeskategori. Konsten att skapa bilder med AI är snarare en konst att förklara vad man vill ha fram, på ett sätt som AI:n förstår. Det gäller att kunna verbalisera en massa kunskap som annars sitter i ryggmärgen: val av optik, perspektiv, beskärning, färgskala, skärpedjup, allt sådant måste man säga i stället för att göra.

Från prompten »Down with this sort of thing, the queen says« gav Dalle-E 2 det här förslaget.

Men varför ger ett antal AI-forskningslabb oss nästan kostnadsfritt tillgång till de här imponerande bildverktygen? När jag läser företagens beskrivningar av sig själva får jag en känsla av att de egentligen strävar mot något helt annat än att jag ska ha kul med att skapa knasiga bilder på löpande band.

– Visst är det så! De här forskarna fokuserar på att undersöka hur AI kan bli bättre, och emellanåt trillar det ut tillämpningar, lite som en biprodukt. Att ett stort antal bildskapare använder ett sådant här verktyg hjälper forskarna framåt. Information om vilka av AI:ns bildförslag som godkänns eller ratas av användarna matas tillbaka i systemet och trimmar in AI:n så att den blir bättre.

Efter mina egna första prova-på-dagar med AI som bollplank kan jag konstatera att det är som att ha en otroligt kreativ och ganska knäpp kollega vid sin sida hela tiden. En som inte ens blir sur om jag väljer bort det den har skapat.

Det tekniska
PROMPT
De flesta AI-baserade verktyg för bildska- pande bygger på prompten, det vill säga den text som kreatören skriver in som beskrivning på bilden som ska skapas. Genom att ändra i prompten kan man finjustera instruktionen till modellen för att göra ändringar i bilden.

GAN-MODELLER
(Generative Adversarial Networks). En GAN-modell består av två så kallade neurala nätverk, som arbetar tillsam- mans, eller snarare mot varandra, för att skapa ”troliga” bilder. Det ena nätverket skapar bilder och det andra försöker skilja på dessa bilder och ”riktiga” bilder. När träningen är klar behåller man bara det nätverk som genererar bilderna.

DIFFUSIONSMODELLER
En diffusionsmodell är en AI som lär sig att ta bort brus i en bild och fylla i bilden med det som verkar saknas. Genom att succes- sivt öka mängden brus tvingas modellen att mer och mer utgå ifrån texten. Till slut ger man AI:n en bild som helt består av brus, plus en textprompt. Då börjar modellen ta bort bruset och fylla i detaljer tills en bild som matchar prompten framträder.

Några AI-verktyg


Prompt: en man i blå rock vandrar i dimmig skog.

 DALL-E 2
• openai.com/dall-e-2
En diffusionsmodell skapad av OpenAI. Varje prompt ger upphov till fyra bild- förslag, som man kan välja att vidare- utveckla. Förutom att skapa bilder kan verktyget också användas för inpainting, där man byter ut eller lägger till element i en bild, och outpainting, där man gör bildytan på en befintlig bild större, och låter modellen fylla ut tomrummet med innehåll. Gratis att skapa 50 uppdrag. Bilder som genereras med Dall-E 2 ägs av den som har skapat dem. Det går att neka OpenAI att återanvända ens alster, om man inte vill att de ska användas för vidareutveckling av verktyget.

CRAIYON
• craiyon.com
En gratisversion av Dall-E. Verktyget skapar en panel med 3 × 3 oftast ganska märkligabilderi”skärmupplösning”. Bildskapare har rätt att sprida bilderna på sociala medier, samt använda dem i forsknings- och utbildningssyfte, utan kostnad.


Prompt: Foto av äldre dam som dansar i en gul klänning

MIDJOURNEY
• midjourney.com
En diffusionsmodell som är gratis upp till 25 uppdrag. Verktyget sägs vara speciellt duktigt på att skapa futu- ristiska och måleriska bilder. Själva användarupplevelsen känns också
lite speciell, ganska teknisk: för att skapa bilder arbetar man på MidJour- neys Discord-server, där man kom- municerar med en bot som genererar bilderna. MidJourney erbjuder Creative Commons-licens på det som skapas i verktyget, med rätt för vem som helst att vidareutveckla andras prompter och bilder. Betalkonton finns, där använda- ren får ha sina alster i fred.


Prompt: Hundar som springer i snö, fotorealism.

STABLE DIFFUSION
• beta.dreamstudio.ai/dream
Även detta en diffusionsmodell, utveck- lad av företaget Stability.ai. Verktygets webbaserade gränssnitt heter Dream- Studio, och där finns en hel del reglage att dra i för att skapa, redigera och fin- justera bilder på många sätt. Gratis 200 prova-på-krediter. Företaget hänvisar till att copyright-frågor kring AI-genererad konst är komplicerade och skiljer sig åt mellan olika rättssystem.


THIS PERSON DOES

NOT EXIST
• thispersondoesnotexist.com
Ett gratis GAN-verktyg som skapar porträttfoton av personer som inte finns.

Prenumerera på Fotografisk Tidskrift

Vinnare av Publishing Priset 2021. Fotografisk Tidskrift har funnits sedan 1888 men är i högsta grad ett magasin mitt i samtiden. För medlemmar i SFF är den gratis. Här tecknar du en prenumeration. Läs mer