Ny komprimeringsteknik skal tackle en af internettets største flaskehalse

"Vi behøver ikke hele filen for at gemme et billede. Vi skal bare bruge en slags indholdsfortegnelse af, hvordan billedet skal bygges op af andre stumper af data. Ligesom instruktionsbogen til en Lego model," siger lektor Daniel Lucani Rötter fra Institut for Ingeniørvidenskab, Aarhus Universitet. Foto: Peer Klercke.

22. marts 2019 af Jesper Bruun

Der er rift om pladsen på internettet, og en voldsom vækst i antallet af tilsluttede Internet of Things (IoT)-enheder betyder, at løkken strammes om drømmen om et superhurtigt internet. I alt 1,1 milliarder nye IoT-enheder blev koblet på nettet i 2018 – altså ikke telefoner eller computere, men udelukkende enheder som eksempelvis smarte fjernsyn, wearables, sikkerhedssystemer og andre ting med indbyggede sensorer.

Det er en så markant vækst, som genererer en så enorm mængde data, at det sænker læse- og skrivehastigheden overalt på nettet. Et nyt forskningsprojekt ved Institut for Ingeniørvidenskab, Aarhus Universitet, vil løse problemet ved i at finde nye måder at komprimere data på.

"Hvis vi ser på, hvordan tingene udvikler sig, er der enorme mængder data, der skal lagres, og en af de store udfordringer er, hvordan vi får adgang til de data. Man kan have store mængde data lagret på en enkelt disk, men læsehastigheden forbliver den samme. Det betyder, at datacentre løber ind i flaskehalse. Det sker allerede nu, hvor visse store datacentre går efter mindre harddiske, simpelthen fordi læsehastigheden er blevet en flaskehals," siger lektor Daniel Lucani Rötter, som derfor er gået sammen med flere tech-virksomheder og internationale universiteter i projektet Scale-IoT, der sigter efter at mindske den nødvendige lagringsplads betydeligt.

LÆS OGSÅ: AU-forskere laver fremtidens CO2-frie brændstof ud af el, vand og luft

"Projektet handler om at begrænse mængden af data, der skal lagres, ved at ændre på måden hvorpå data håndteres. Vi ser på, hvordan vi kan udnytte karakteristika for forskellige typer data for på den måde at mindske lagerdata dramatisk," fortsætter han.

(Artiklen fortsætter under billedet)

Scale-IoT-projektet er ikke kun målrettet IoT- og cloud data, forklarer Daniel Lucani Rötter. Målet er også, at den nye teknologi skal komme lokal datalagring til gavn. Foto: Lars Kruse / AU Foto.

LÆS OGSÅ: Aarhus Universitet satser stort på nye civilingeniøruddannelser

Det handler om sammenfald - forskellige data der deler ligheder.

Daniel Lucani Rötter peger som eksempel på det ganske almindelige JPEG-format for billeder. Så snart billedet er knipset, bliver det komprimeret. Man gemmer som regel ikke hver eneste pixel, da der er masser af redundans i fotografiet, som man kan dele billedet op efter. Det er lidt den samme tilgang, der sigtes efter i Scale-IoT-projektet.

Men i stedet for udelukkende at komprimere billeder på denne måde, sigter projektet efter at omfavne al data.

"Tag en helt normal .zip-fil. Når man skal bruge den komprimerede data, skal man først dekomprimere filen. Vores idé går ud på at kunne komprimere alting, men stadig give mulighed for at læse hver enkelt fil for sig selv, så snart man vil have adgang til den," siger han og fortsætter:

"I teorien tager vi en fil og springer den i tusind små data-stykker. Herefter fragmenterer man småstykkerne og forsøger at identificere ligheder mellem dem alle sammen."

LÆS OGSÅ: Nyt forskningslaboratorium i verdensklasse åbner på Aarhus Universitet

Og eftersom projektet går ud på at komprimere alle typer data, er der rigtig gode muligheder for at udnytte data-ligheder – særligt når det kommer til datacentre og cloud computing.

"Vi behøver ikke hele filen for at gemme et billede. Vi skal bare bruge en slags indholdsfortegnelse af, hvordan billedet skal bygges op af andre stumper af data. Ligesom instruktionsbogen til en Lego model," siger lektoren.

Det behøver ikke engang være nøjagtige ligheder. I Lego-analogien kan man derfor godt benytte en lidt mindre eller lidt større klods, bare det er "tæt nok på", som Lucani Rötter siger det: Så bliver uoverensstemmelsen lagret og resten indekseret i "instruktionsbogen". På den måde ender man op med en række ID-datablokke med tilhørende uoverensstemmelser, og derved kan man gendanne lagrede data uden fejl.

"Projektet er ikke kun målrettet IoT- og cloud data. Med modifikationer kan det såmænd også benyttes til lokal datalagring, hvor du pludselig kunne få langt mere ud af din 256 Gb harddisk på din bærbare. Der er et meget stort potentiale i at lagre data på denne måde," afslutter lektor Daniel Lucani Rötter.

Baggrund

Læse- og skrivehastighed er en voksende bekymring for mange store it-virksomheder rundt omkring i verden. Den amerikanske tech-gigant Amazon har endda målt på, hvor store omkostninger der er forbundet med lavere hastighed. Og den fandt, at en ændring på blot 100 millisekunder var nok til at gøre kunder så ophidsede, at de ville annullere deres abonnement med tabte indtægter i milliardstørrelsen til følge.

Kontakt

Daniel Lucani Rötter
Lektor
Mail: daniel.lucani@eng.au.dk
Tlf.: 93508763