DeepMind AI maakt video van stilstaande beelden

- Jeroen Langendam

DeepMind, een zusteronderneming van Google werkt aan een AI-tool die stilstaande beelden omzet naar video. Ze gebruiken hiervoor een nieuw algoritme, waardoor meer kan worden bereikt met dezelfde hardware.

In het bedrijfsleven wordt steeds meer gebruik gemaakt van (animatie-) video’s. Video’s blijken commercieel interessant, omdat ze erin slagen om een complexe boodschap duidelijk over te brengen. Door video te gebruiken wordt de boodschap beter onthouden én begrepen.

De reden hiervoor is dat video, in tegenstelling tot geschreven tekst, intuïtief te begrijpen is. Zien is begrijpen. Doordat video dynamisch is, houdt het ook de aandacht vast. Ook in het onderwijs kan voordeel worden behaald met het visueel maken van de lesstof.

Soms gebeurt dat nog met ouderwetse illustraties. Zo wordt in de biologieles nog gebruik gemaakt van illustraties om de celdeling duidelijk te maken. Maar ook in het rekenonderwijs wordt gebruik gemaakt van visuele stappenplannen. Het gebruik van digitale video is een goede vervolgstap om het onderwijs verder te verrijken.

AI genereert video

DeepMind is, net als Google, een dochteronderneming van Alphabet. Dit bedrijf werkt aan een AI tool die in staat is om filmpjes te maken van een serie foto’s. Volgens een door Alphabet gepubliceerd paper getiteld ‘Efficient Video Generation on Complex Datasets’ kan de tool inmiddels video’s van 256 x 256 pixels maken van 48 frames lang. Dit levert een speelduur op van ongeveer 2 seconde.

Nog weinig praktisch nut, veel potentie

In de lespraktijk is een dergelijke kleinbeeldvideo van 2 seconde van weinig toegevoegde waarde. Het belang van de ontwikkeling zit hem dan ook vooral in de vervolgstappen die DeepMind hoopt te zetten.

‘Het genereren van een natuurlijk ogende video is een voor de hand liggende vervolguitdaging voor generatief modelleren, maar wel eentje die wordt geplaagd door een toenemende data-complexiteit en stijgende behoefte aan rekenkracht’, schrijft een van de auteurs , ‘daarom ging veel eerder werk over het genereren van video over relatief eenvoudige datasets, of naar taken waarbij sterke informatie over de temporale conditionaliteit aanwezig is’.

DeepMind kiest echter voor een andere invalshoek, namelijk een nieuwe manier van berekenen, waardoor veel efficiënter met de beperkte rekenkracht kan worden gewerkt. Dit nieuwe algoritme opent de weg naar verdere vooruitgang op het gebied van het genereren van video.

Door de AI van DeepMind te trainen met (onder meer) YouTube video’s hoopt DeepMind deze vooruitgang snel dichterbij te maken, zodat ook leerkrachten binnenkort video’s kunnen maken uit stilstaande illustraties.