Petabyte til folket: DNA-lagring kan komme som kassettpatroner innen 2030

DNA
(Foto: Shutterstock / Billion Photos)

Behovet for datalagring vokser langt raskere enn det kan dekkes av velkjent teknologi som harddisker (HDD), halvlederminne (SSD) og Linear Tape-Open (LTO). Det gjelder både når det gjelder selve lagringskapasiteten til de individuelle enhetene og den fysiske plassen de fysiske enhetene tar opp.

TechRadar Pro har også tidligere meldt om vidløftige ideer om å flytte datasentre til månen for å løse de fysiske plassproblemene, men dette krever uansett tradisjonell lagringsteknologi og fører til bekymringer om avfall i verdensrommet.

Så kommer DNA-lagring på banen. Dette er en måte å kode data på innenfor syntetiserte DNA-strenger i skriveprosessen, samt DNA-sekvensering for å kunne lese av dataene. Der foregår det en oversettelse mellom DNA-basene A, C, G og T og binær kode.

I henhold til nylig publiserte whitepapers, er fordelene allerede åpenbare. Omkring 9 TB med DNA-kode kan få plass innenfor en plass på 1 kubikkmillimeter.

Det franske oppstartsselskapet Biomemory mener at DNA benyttet i lagringsøyemed – som de anser som en fremtidssikret lagringsteknologi –  ikke kan komme på banen fort nok. De anslår at menneskeheten innen 2025 vil ha generert 175 000 000 000 000 000 000 000 bytes, eller 175 zettabytes, med data

TechRadar Pro tok en prat med Alex Mouradian, CEO for Biomemory-klienten eureKARE (og nylig anfører for en såkorninvestering på 5 millioner euro i selskapet), som ga oss en orientering om dette revolusjonerende spranget innen datalagring.

Hvordan skiller deres teknologi seg fra det andre gjør?

Forskning på DNA som datalagring utføres for det meste i akademiske laboratorier og i oppstartsselskaper som spinnes ut av disse laboratoriene.

Disse forskningsprosjektene er i stor grad offentlig finansiert i USA. Det omfatter blant annet Intelligence Advanced Research Projects Activity (IARPA) og Defense Advanced Research Projects Agency (DARPA), mens finansieringen i EU stort sett stammer fra nasjonale og europeiske tilskudd.

I Frankrike ble programmet PEPR MoleculArXiv nylig etablert for å styrke dette feltet som er i emning. Microsoft og Twist Bioscience har inntatt en ledende rolle innen forskning og utvikling på dette området, og en håndfull oppstartsselskaper som satser på DNA-lagring har dukket opp de senere årene. 

Blant dem kan vi nevne Catalog, Ansa Biotechnologies og Iridia i USA, samt Helixworks, DNA Script og BioSistemika i Europa.

DNA-lagring er så langt blitt utviklet ved bruk av kjemisk eller enzymatisk syntetiserte  oligonukleotide bassenger. Dette er kortstrengede DNA-sekvenser med færre enn 200 baser.

Selv om denne metoden har underbygget gjennomførbarheten av DNA-lagring av data, har avhengigheten av petrokjemi  til løsninger samt dyre bestanddeler, de miljømessige konsekvensene og de høye produksjonskostnadene (1000 USD per MB) stått i veien for utvikling i stor skala.

Biomemory har snudd det bestående DNA-paradigmet på hodet. I stedet for å konsentrere seg om oligonukleotider, utnytter de levende organismers naturlige evne til å bearbeide dobbeltstrengede DNA-molekyler, som kromosomer og plasmider, for å kunne skape en skalerbar og bærekraftig DNA-basert lagringsteknologi.

Arbeidet er ennå på et tidlig stadium, men prosessen er allerede på nivå med kjemisk og enzymatisk syntese.

Hva mer kan du fortelle oss om Biomemory?

Biomemory ble grunnlagt i juli 2021 av Stéphane Lemaire (forskningsdirektør hos CNRS), Pierre Crozet (Associate Professor ved Sorbonne Université), og Erfane Arwani, som er informatiker og vellykket seriegründer.

Biomemory sprang ut av forskningen ved Centre National de la Recherche Scientifique (CNRS) ved Sorbonne-universitetet, der Stéphane Lemaire og hans team utviklet en metode for DNA-lagring av data som senere har ledet frem til selskapets patenterte teknologi DNA Drive.

Denne teknologien organiserer dataene fysisk på lange, biokompatible og biosikrede dobbeltstrengede DNA-molekyler. Det gir en holdbar lagringsløsning med ubegrenset lagringskapasitet som kan kopieres biologisk med svært små kostnader.

Biomemory vil konsentrere seg om miniatyrisering, automasjon og parallellisering av en gjennomgående integrert og kontinuerlig mikrofluidisk enhet for DNA-sammensetning som kan rettes mot markeder i mellomsegmentet.

Hva er de største hindringene for at DNA skal entre lagringsmarkedet i nær fremtid?

Teknologi for DNA-lagring er fremdeles et område i fremvekst og utforsking. De første resultatene av betydning ble publisert i 2012. Siden den gang er det gjort fremskritt innen koding av algoritmer og strekkoding for å gjøre det mulig med korrigering, direkte tilgang og komprimering. Men det er fremdeles utfordringer som må løses før DNA kan bli et levedyktig alternativ til de rådende lagringsformene.

DNA-syntesen gjennomføres kjemisk med utgangspunkt i fossilt brensel, Dette medfører flere ulemper, ettersom det 1) gir an stor andel feil, 2) gjør bruk av giftige forbindelser avledet av fossilt brensel i oppbyggingen av de kostbare bestanddelene.

Miniatyrisering og parallellisering av denne metoden har det seneste tiåret redusert kostnadene til kjemisk DNA-syntese, slik at det har fått mange bruksområder innen livsvitenskap.

For at DNA-lagring skal kunne bli praktisk anvendelig må DNA-sekvenseringen skje i mye større skala enn nå, til en brøkdel av kostnaden, mens andelen feil samtidig reduseres kraftig. De høye kostnadene har så langt stått i veien for praktisk bruk av denne teknologien til omfattende datalagring.

Nylig har flere akademiske grupperinger og en håndfull selskaper (som DNA Script, Ansa Biotechnologies og Molecular Assemblies) utviklet metoder basert på enzymer for å erstatte kjemi basert på fosforamiditter.

DNA-syntesen som bygger på enzymet Terminal Transferase (TdT) gjør at man unngår bruk av fossilt brensel, ettersom prosessen kan foregår i vannbaserte oppløsninger. I fremtiden kan dette åpne for bruk av lengre fragmenter.

For øyeblikket er den enzymatiske DNA-syntesen fremdeles for langsom til å ha noen praktisk nytteverdi. Dessuten er kostnadene høye, særlig fordi man i bunn og grunn fremdeles er avhengig av bestanddeler fra fossilt brensel.

Andre oppstartsselskaper som Catalog, HelixWorks og DATANA/Biosistemica har utviklet metoder for lagring av data i DNA ved bruk av biblioteker av oligonukleitider som organiseres enzymatisk i lengre DNA-molekyler. 

Disse metodene reduserer kostnadene ved DNA-lagring, men de avhenger fremdeles av kostbare kjemiske prosesser til syntesen av byggeklossene og av PCR-prosesser, som er utsatt for mange feil.

Hva venter du deg når det gjelder forholdet mellom ytelse og pris?

Vår teknologi kan potensielt skaleres opp i nær fremtid, slik at kostnadene og hastigheten er konkurransedyktig med stordata og behovet for store datasentre. 

Når det gjelder vår enhet, er visjonene frem mot 2030 å utvikle en selvstendig enhet som har dimensjoner som kan sammenlignes med de eksisterende datasentrenes infrastruktur, og særlig serverrack.

Denne enheten vil kunne ta i bruk ulike enheter som DNA-baserte kassettpatroner som vil sikre funksjonaliteten og samhandlingsmulighetene med andre enheter i verdikjeden.

En av deres konkurrenter har begynt å leke seg med DNA-data. Hvordan møter dere utfordringen?

Biomemory er skapt for å rette seg utelukkende mot DNA-basert lagring. Vår synteseteknologi er utviklet for kun å skape biologisk sikre sekvenser som kodes med digitale data. Dermed kan den ikke «hackes» i forsøk på å skape skadelige DNA-strenger. Vårt hovedmål er å håndtere den økologiske utfordringen som knyttes til elektronisk datalagring.

Vi satser på å skape en bærekraftig løsning for DNA-lagring med minimalt karbonavtrykk, for det er på denne måten vi tror DNA-lagring vil tjene menneskeheten best.

Geir Tandberg Steigan

Skribent, forfatter og illustratør med en spesiell forkjærlighet for produkter og brukergrensesnitt fra Apple. 

Med bidrag fra