Herinner je je die virale video van Will Smith die spaghetti at? Het was een verbluffend kunstwerk gegenereerd door AI dat het internet enige tijd geleden veroverde. Duidelijk nep, maar cool om te zien, liet het ons verbijsterd achter en misschien zelfs een beetje ongemakkelijk. Destijds stonden AI-gegenereerde video’s nog in de kinderschoenen en er was duidelijk nog een lange weg te gaan. Sora, de nieuwe tool van OpenAI brengt daar revolutionair verandering in.
Sora is een AI-model dat realistische en fantasierijke scènes kan creëren op basis van louter tekstinstructies. Dit gaat van realistische beelden tot surrealisme en animatievideo’s. Momenteel alleen beschikbaar voor onderzoekers om feedback te verzamelen en potentiële risico’s te beoordelen, maar de potentie van Sora is ronduit verbluffend. Het is echt bizar hoe snel de ontwikkelingen in 1 jaar tijd zijn gegaan. Dat geeft gelijk een aantal vragen over de (nabije) toekomst. Hoe gaat AI-generated video marketingbureaus en contentcreators helpen? Wat zijn de mogelijke gevaren en hoe worden deze ingeperkt? Laten we eens kijken hoe we er nu voorstaan.
Met 1 prompt een realistische video
Door middel van een tekstinput, ook wel prompt genoemd, genereert Sora video’s die 1 minuut in lengte zijn. Net zoals zijn broertje DALL-E tekst kan omzetten in afbeeldingen, is Sora in staat om een ingevoerde tekst om te zetten in bewegend beeld. En omdat het om video gaat moet de tool begrijpen hoe bepaalde oppervlakten, belichting en reflecties met elkaar samenhangen. En dat doet Sora heel erg knap!
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
Je hersenen weten dat je naar een AI-gegenereerde video kijkt, dus als je goed kijkt, kun je foutjes en imperfecties ontdekken. Maar over het algemeen is het gegenereerde beeld al verbazingwekkend realistisch. In het voorbeeld hierboven zie je een vrouw over straat lopen. Deze clip overtreft veruit de eerste video’s die door AI zijn gegenereerd (denk aan de Spaghetti etende Will Smith). De reflecties op straat, de belichting, huidtinten en bewegingen voelen levensecht aan.
Prompt: A young man at his 20s is sitting on a piece of cloud in the sky, reading a book.
Een andere verbluffende clip is die van een jongeman die op een wolk zit en een boek leest. Deze voelt al voor 90% als een echte video. Ook hier zijn de belichting, schaduwen en huidtinten erg realistisch. Je zou aan de beweging van de pagina’s van het boek kunnen merken dat het om een AI-video gaat. Toch is het een knap staaltje werk. Nog verbazingwekkender is de filmtrailer over de 30-jarige astronaut met de rode, wollen ruimtehelm. De close-ups van zijn gezicht, de textuur van het wol op zijn helm, de filmgrain en de cinematografische look maken deze clip voor mij een van de meest realistische AI-gegenereerde video’s die ik ooit heb gezien.
Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.
AI’s Rol in Marketing en Creativiteit
Deze voorbeelden kunnen zeker doorgaan voor echte video’s. Dit brengt ons bij de vraag: wat gaan videografen, content creators en marketingbureaus hier nou aan hebben? Staan onze banen op het spel? Dat is een lastige vraag waar niet gemakkelijk antwoord op te geven is. Ik denk dat de vraag naar ‘echte’ content met echte mensen altijd zal blijven bestaan. Ook krijgen makers een nieuwe rol toebedeeld. Je moet immers kunnen omgaan met de nieuwe technologie die AI heet. Sommige content kan echter vervangen worden door AI-generated content. Ik denk dan bijvoorbeeld aan stockbeelden, die gebruikt worden in videoproducties, presentaties, advertenties of op websites. De volgende AI-generated clip is daar een goed voorbeeld van.
Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.
We zien een realistisch droneshot van een klif met een mooie vuurtoren. De manier waarop het water beweegt, de zon ondergaat en een cinematografisch beeld creëert, kan zo doorgaan voor echte video en dus gebruikt worden in producties. De drone-operator hoeft niet meer op pad en dure stockbeelden hoeven niet meer te worden aangeschaft.
Optimalisatie van de tool
De ontwikkelingen volgen elkaar in rap tempo op en de mogelijkheden zijn eindeloos. Natuurlijk zijn er nog steeds verbeteringen Zo heeft Sora bijvoorbeeld nog moeite met het onderscheiden van links en rechts, en er moet een serieuze discussie gevoerd worden over de potentiële schadelijke gevolgen van deze tool. Wat mij vooral fascineert, is hoe lang het nog zal duren voordat AI complete video’s kan produceren, compleet met sound design en andere details. Wat is jouw mening over deze nieuwe AI-generatietool? Persoonlijk ben ik erg enthousiast over de mogelijkheden die het biedt voor de toekomst. Wie weet welke nieuwe kansen er nog meer op ons afkomen.