Debemos almacenar datos en el ADN
Por/By Emily Leproust
La humanidad genera 2,5 quintillones de bytes de datos, suficientes para maximizar la capacidad de almacenamiento de unos 40 millones de iPhones, todos los días. Gran parte se almacena “en la nube”, lo que significa que se guarda en centros de datos helados y en expansión.
Desafortunadamente, estos centros de datos están contribuyendo a la destrucción del medio ambiente. Representan hasta el 1,5 % del consumo total anual de electricidad en el mundo y son responsables de la emisión de más de 200 millones de toneladas métricas de dióxido de carbono, a la par de las emisiones anuales de todos los viajes aéreos comerciales en todo Estados Unidos.
Y dado que la cantidad total de datos creados se duplica cada dos años, el problema está a punto de empeorar. Para seguir el ritmo de la cantidad de datos que estamos creando, toda la superficie del planeta debería estar cubierta con centros de almacenamiento de datos para 2060.
Muchas empresas y ambientalistas han reconocido durante mucho tiempo el daño ecológico de nuestra adicción al almacenamiento de datos. Los centros de datos usan un volumen asombroso de agua, alrededor de 3 a 5 millones de galones por día. Eso es suficiente para una ciudad pequeña de 30.000 a 50.000 habitantes, según el profesor de la Universidad Tecnológica de Texas, Venkatesh Uddameri.
También exigen grandes cantidades de minerales de tierras raras para construir su hardware. El proceso de minería para extraer esos minerales es notoriamente terrible para el medio ambiente.
Las empresas pueden hacer que estos centros de datos sean menos dañinos, pero en realidad no pueden hacerlos ecológicos. Y el apetito voraz de datos del mundo está anulando rápidamente cualquier mejora marginal. Por ejemplo, los centros de datos están en camino de representar el 14 % de todas las emisiones globales para 2040. Eso es equivalente a lo que emite actualmente todo Estados Unidos.
La solución real radica en repensar por completo cómo almacenamos los datos.
En lugar de almacenarlos electrónicamente, los científicos son optimistas de que pronto podríamos codificar datos en hebras de ADN, un medio mucho más poderoso, a gran escala.
El ADN es mucho más eficiente en el almacenamiento de información que cualquier otro método existente. Un solo gramo de ADN puede almacenar hasta 215 millones de gigabytes de información; eso equivale a aproximadamente 10 millones de copias de la totalidad de Wikipedia. En teoría, si el ADN se utilizara en todo su potencial, todos los datos del mundo podrían almacenarse en la caja de un camión.
En Twist Bioscience, la empresa que dirijo, desarrollamos un proceso de transformación para “escribir” datos en pequeños chips de silicio usando ADN. Nuestros científicos almacenaron recientemente una serie original de Netflix en ADN sintético. Y más recientemente, los investigadores del Instituto de Tecnología de Georgia, en colaboración con nuestro equipo, descubrieron una forma de aumentar la eficiencia de los métodos actuales de almacenamiento de datos de ADN en un factor de 100.
A diferencia de los servidores en los centros de datos, los métodos de almacenamiento basados en ADN son ecológicos. Una vez que la información se convierte en ADN, no consume energía. Esos datos también duran mucho más; mientras que los discos duros magnéticos convencionales se desgastan y necesitan ser reemplazados cada década, los datos que han sido codificados en el ADN teóricamente podrían durar más de 500,000 años.
Nuestra civilización está produciendo más datos que nunca. Sin nuevos enfoques, el almacenamiento de datos amenaza con empeorar las crisis ambientales y generar otras nuevas. Y con cientos de millones de nuevos usuarios de Internet agregados cada año, la urgencia no podría ser mayor. Los enfoques como el almacenamiento basado en el ADN pueden ayudar a aprovechar todo el potencial y la promesa de la era de la información sin sacrificar la salud del planeta.
Emily Leproust es directora ejecutiva y cofundadora de Twist Bioscience. Esta pieza se publicó originalmente en RealClearScience.
—————-
Data Centers Are Unsustainable
We Must Store Data in DNA
Humanity generates 2.5 quintillion bytes of data — enough to max out the storage capacity of about 40 million iPhones — every day. Much of it gets stored “in the cloud,” meaning it’s saved in sprawling, frigid data centers.
Unfortunately, these data centers are contributing to the destruction of the environment. They account for as much as 1.5% of the world’s total annual electricity consumption — and are responsible for emitting more than 200 million metric tons of carbon dioxide, on par with the annual emissions from all commercial air travel in the entire United States. And with the total quantity of data created doubling every two years, the problem is poised to get much worse. To keep pace with how much data we’re creating, the entire surface of the planet would need to be covered with data storage centers by 2060.
Many companies and environmentalists have long recognized the ecological harm of our data-storage addiction. Data centers use a staggering volume of water, about 3-5 million gallons per day. That’s enough for a small city of 30,000-50,000 people, according to Texas Tech University professor Venkatesh Uddameri.
They also demand large amounts of rare earth minerals to construct their hardware. The mining process to extract those minerals is notoriously awful for the environment.
Companies can make these data centers less damaging — but they can’t actually make them green. And the world’s voracious appetite for data is quickly canceling out any marginal improvements. For example, data centers are on track to account for 14% of all global emissions by 2040. That’s equivalent to what the entire United States currently emits.
The real solution lies in completely rethinking how we store data.
Instead of storing it electronically, scientists are optimistic that we could soon encode data into strands of DNA, a vastly more powerful medium, on a massive scale.
DNA is orders of magnitude more efficient at storing information than any existing method. A single gram of DNA can store up to 215 million gigabytes of information; that’s equivalent to roughly 10 million copies of the entirety of Wikipedia. In theory, if DNA were used to its full potential, all of the world’s data could be stored in the bed of a semi-truck.
At Twist Bioscience, the company I lead, we developed a transformational process to “write” data onto small silicon chips using DNA. Our scientists recently stored a Netflix original series in synthetic DNA. And more recently, researchers at the Georgia Institute of Technology, in collaboration with our team, discovered a way to increase the efficiency of current DNA data storage methods by a factor of 100.
Unlike servers in data centers, DNA-based storage methods are environmentally friendly. Once the information is converted into DNA, it consumes zero energy. That data also lasts much longer; while conventional magnetic hard drives wear out and need to be replaced every decade or so, data that’s been encoded in DNA could theoretically last for more than 500,000 years.
Our civilization is producing more data than ever. Without new approaches, data storage threatens to worsen environmental crises and spawn new ones. And with hundreds of millions of new internet users added every year, the urgency couldn’t be greater. Approaches like DNA-based storage can help leverage the full promise and potential of the Information Age without sacrificing the planet’s health.
Emily Leproust is CEO and co-founder of Twist Bioscience. This piece originally ran in RealClearScience.