РЕКЛАМА

ДНК като среда за съхранение на огромни компютърни данни: реалност много скоро?

ИНЖЕНЕРИНГ И ТЕХНОЛОГИЯДНК като среда за съхранение на огромни компютърни данни: реалност много скоро?

Едно пробивно проучване прави значителна стъпка напред в стремежа да се разработи базирана на ДНК система за съхранение на цифрови данни.

Цифров данни днес нараства с експоненциална скорост поради зависимостта ни от джаджи и изисква стабилно дългосрочно съхранение. Съхранението на данни бавно става предизвикателство, тъй като настоящите цифрови технологии не могат да предоставят решение. Пример е, че през последните две години са били създадени повече цифрови данни, отколкото през цялата история на компютрите, всъщност се създават 2.5 квинтилиона байта {1 квинтилион байт = 2,500,000 2,500,000,000 XNUMX терабайта (TB) = XNUMX XNUMX XNUMX XNUMX гигабайта (GB)} данни всеки ден в света. Това включва данни за сайтове за социални мрежи, транзакции за онлайн банкиране, записи на компании и организации, данни от сателити, наблюдение, изследвания, разработки и т.н. Тези данни са огромни и неструктурирани. Ето защо сега е голямо предизвикателство да се справят с огромните изисквания за съхранение на данни и техния експоненциален растеж, особено за организации и корпорации, които изискват стабилно дългосрочно съхранение.

Достъпните опции в момента са твърд диск, оптични дискове (CD), памети, флаш устройства и по-модерните лентови устройства или оптични BluRay дискове, които съхраняват приблизително до 10 терабайта (TB) данни. Такива устройства за съхранение, въпреки че се използват обикновено, имат много недостатъци. Първо, те имат нисък до среден срок на годност и трябва да се съхраняват при идеални условия на температура и влажност, за да могат да издържат много десетилетия и по този начин изискват специално проектирани физически пространства за съхранение. Почти всички те консумират много енергия, обемисти са и непрактични и могат да се повредят при обикновено падане. Някои от тях са много скъпи, често са засегнати от грешки в данните и поради това не са достатъчно стабилни. Опция, която е универсално приета от организацията, се нарича облачни изчисления – споразумение, при което компанията основно наема „външен“ сървър за обработка на всичките си изисквания за ИТ и съхранение на данни, наричан „облак“. Един от основните недостатъци на облачните изчисления са проблемите със сигурността и поверителността и уязвимостта към атаки от хакери. Има и други проблеми, като високи разходи, ограничен контрол от страна на родителската организация и зависимост от платформата. Облачните изчисления все още се считат за добра алтернатива за дългосрочно съхранение. Изглежда обаче, че цифровата информация, която се генерира в световен мащаб, със сигурност изпреварва способността ни да я съхраняваме и са необходими още по-стабилни решения, за да се погрижим за този потоп от данни, като същевременно осигуряваме мащабируемост, за да вземем предвид и бъдещите нужди за съхранение.

Може ли ДНК да помогне в компютърното съхранение?

Нашата ДНК (Дезоксирибонуклеинова киселина) се разглежда като вълнуваща алтернативна среда за съхранение на цифрови данни. ДНК е самовъзпроизвеждащият се материал, присъстващ в почти всички живи организми и е това, което съставлява нашата генетична информация. Изкуствен или синтетичен ДНК е издръжлив материал, който може да бъде направен с помощта на налични в търговската мрежа машини за синтез на олигонуклеотиди. Основното предимство на ДНК е нейната дълготрайност, тъй като ДНК издържа 1000 пъти по-дълго от силиция (силициев чип – материалът, използван за изграждане на компютри). Удивително, само един кубичен милиметър от ДНК може да побере квинтилион байтове данни! ДНК също е ултракомпактен материал, който никога не се разгражда и може да се съхранява на хладно и сухо място в продължение на стотици векове. Идеята за използване на ДНК за съхранение е съществувала дълго време назад от 1994 г. Основната причина е сходният начин, по който информацията се съхранява в компютъра и в нашата ДНК – тъй като и двете съхраняват чертежите на информацията. Компютърът съхранява всички данни като 0s и 1s, а ДНК съхранява всички данни на жив организъм, използвайки четирите бази – тимин (T), гуанин (G), аденин (A) и цитозин (C). Следователно ДНК може да се нарече стандартно устройство за съхранение, точно като компютър, ако тези бази могат да бъдат представени като 0s (бази A и C) и 1s (бази T и G). ДНК е здрава и дълготрайна, като най-простото отражение е, че нашият генетичен код – планът на цялата ни информация, съхранявана в ДНК – се предава ефективно от едно поколение на следващо по многократен начин. Всички софтуерни и хардуерни гиганти желаят да използват синтетична ДНК за съхраняване на огромни количества, за да постигнат целта си за решаване на дългосрочно архивиране на данни. Идеята е първо да се преобразува компютърният код 0s и 1s в ДНК код (A, C, T, G), преобразуваният ДНК код след това се използва за производство на синтетични нишки от ДНК, които след това могат да бъдат поставени в хладно съхранение. Когато е необходимо, ДНК нишките могат да бъдат премахнати от хладно съхранение и тяхната информация се декодира с помощта на машина за ДНК секвениране и ДНК последователността накрая се превежда обратно в двоичен компютърен формат от 1s и 0s, за да бъде прочетена на компютъра.

Показано е1 че само няколко грама ДНК могат да съхраняват квинтилони байтове данни и да ги запазят непокътнати до 2000 години. Това просто разбиране обаче е изправено пред някои предизвикателства. Първо, записването на данни в ДНК е доста скъпо и също болезнено бавно, т.е. действителното преобразуване на 0s и 1s в ДНК базите (A, T, C, G). Второ, след като данните са „записани“ върху ДНК, е трудно да се намерят и извличат файлове и изисква техника, наречена ДНК секвениране – процес на определяне на точния ред на базите в ДНК молекула – след което данните се декодират обратно до 0s и 1s.

Едно скорошно проучване2 от учени от Microsoft Research и Университета на Вашингтон са постигнали „произволен достъп“ до съхранението на ДНК. Аспектът на „произволен достъп“ е много важен, защото означава, че информацията може да бъде прехвърлена към или от място (обикновено памет), в което всяко място, независимо къде в последователността, и може да бъде достъпно директно. Използвайки тази техника на произволен достъп, файловете могат да бъдат извлечени от съхранението на ДНК по селективен начин в сравнение с по-рано, когато такова извличане изисква необходимостта от секвениране и декодиране на цял набор от ДНК данни, за да се намерят и извличат няколкото търсени файлове. Значението на „произволния достъп“ се повишава още повече, когато количеството данни се увеличава и става огромно, тъй като намалява количеството на последователността, която трябва да се направи. Това е първият път, когато произволният достъп е показан в такъв голям мащаб. Изследователите също са разработили алгоритъм за по-ефективно декодиране и възстановяване на данни с по-голяма толерантност към грешки в данните, което прави процедурата по секвениране също по-бърза. Повече от 13 милиона синтетични ДНК олигонуклеотиди бяха кодирани в това проучване, което представляваше данни с размер 200MB, състоящи се от 35 файла (съдържащи видео, аудио, изображения и текст) с размери от 29KB до 44MB. Тези файлове бяха извлечени поотделно без грешки. Освен това авторите са разработили нови алгоритми, които са по-стабилни и толерантни към грешки при писане и четене на ДНК последователности. Това проучване, публикувано в Nature Biotechnology в голям напредък, показващ жизнеспособна, широкомащабна система за съхранение и извличане на ДНК.

Системата за съхранение на ДНК изглежда много привлекателна, защото има висока плътност на данните, висока стабилност и е лесна за съхранение, но очевидно има много предизвикателства, преди да може да бъде приета универсално. Няколко фактора са време и трудоемко декодиране на ДНК (последователността), а също и синтез на ДНК. Техниката изисква по-голяма точност и по-широко покритие. Въпреки че е постигнат напредък в тази област, точният формат, в който ще се съхраняват данните в дългосрочен план, тъй като ДНК все още се развива. Microsoft обеща да подобри производството на синтетична ДНК и да отговори на предизвикателствата за проектиране на напълно работещ ДНК система за съхранение до 2020 г.

***

{Можете да прочетете оригиналната изследователска статия, като щракнете върху връзката DOI, дадена по-долу в списъка с цитирани източници}

Източник (и)

1. Erlich Y и Zielinski D 2017. DNA Fountain позволява здрава и ефективна архитектура за съхранение. наука. 355 (6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Произволен достъп в мащабно съхранение на ДНК данни. Природна биотехнология. 36 https://doi.org/10.1038/nbt.4079

Екип на SCIEU
Екип на SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Значителен напредък в науката. Въздействие върху човечеството. Вдъхновяващи умове.

Абонирай се за нашия бюлетин

Да се ​​актуализира с всички най-нови новини, оферти и специални съобщения.

- Реклама -

Най-популярни статии

Разбиране на животозастрашаващата пневмония COVID-19

Какво причинява тежки симптоми на COVID-19? Доказателствата сочат вродени грешки...

Широката гама от потенциални терапевтични ефекти на Selegiline

Селегилинът е необратим инхибитор на моноаминоксидаза (МАО) В1.
- Реклама -
99,636Феновекато
66,080последователиСледвай ни
6,297последователиСледвай ни
31АбонатиЗапиши се