РЕКЛАМА

ДНК като среда за съхранение на огромни компютърни данни: реалност много скоро?

Пробивно проучване прави значителна крачка напред в стремежа да се разработи a ДНКбазирана система за съхранение на цифрови данни.

Цифров данни днес нараства с експоненциална скорост поради зависимостта ни от джаджи и изисква стабилно дългосрочно съхранение. Съхранението на данни бавно става предизвикателство, тъй като настоящите цифрови технологии не могат да предоставят решение. Пример е, че през последните две години са били създадени повече цифрови данни, отколкото през цялата история на компютрите, всъщност се създават 2.5 квинтилиона байта {1 квинтилион байт = 2,500,000 2,500,000,000 XNUMX терабайта (TB) = XNUMX XNUMX XNUMX XNUMX гигабайта (GB)} данни всеки ден в света. Това включва данни за сайтове за социални мрежи, транзакции за онлайн банкиране, записи на компании и организации, данни от сателити, наблюдение, изследвания, разработки и т.н. Тези данни са огромни и неструктурирани. Ето защо сега е голямо предизвикателство да се справят с огромните изисквания за съхранение на данни и техния експоненциален растеж, особено за организации и корпорации, които изискват стабилно дългосрочно съхранение.

Достъпните опции в момента са твърд диск, оптични дискове (CD), памети, флаш устройства и по-модерните лентови устройства или оптични BluRay дискове, които съхраняват приблизително до 10 терабайта (TB) данни. Такива устройства за съхранение, въпреки че се използват обикновено, имат много недостатъци. Първо, те имат нисък до среден срок на годност и трябва да се съхраняват при идеални условия на температура и влажност, за да могат да издържат много десетилетия и по този начин изискват специално проектирани физически пространства за съхранение. Почти всички те консумират много енергия, обемисти са и непрактични и могат да се повредят при обикновено падане. Някои от тях са много скъпи, често са засегнати от грешки в данните и поради това не са достатъчно стабилни. Опция, която е универсално приета от организацията, се нарича облачни изчисления – споразумение, при което компанията основно наема „външен“ сървър за обработка на всичките си изисквания за ИТ и съхранение на данни, наричан „облак“. Един от основните недостатъци на облачните изчисления са проблемите със сигурността и поверителността и уязвимостта към атаки от хакери. Има и други проблеми, като високи разходи, ограничен контрол от страна на родителската организация и зависимост от платформата. Облачните изчисления все още се считат за добра алтернатива за дългосрочно съхранение. Изглежда обаче, че цифровата информация, която се генерира в световен мащаб, със сигурност изпреварва способността ни да я съхраняваме и са необходими още по-стабилни решения, за да се погрижим за този потоп от данни, като същевременно осигуряваме мащабируемост, за да вземем предвид и бъдещите нужди за съхранение.

Може ли ДНК да помогне в компютърното съхранение?

Нашата ДНК (Дезоксирибонуклеинова киселина) се разглежда като вълнуваща алтернативна среда за съхранение на цифрови данни. ДНК е самовъзпроизвеждащият се материал, присъстващ в почти всички живи организми и е това, което представлява нашата генетична информация. Изкуствена или синтетична ДНК е издръжлив материал, който може да бъде направен с помощта на налични в търговската мрежа машини за синтез на олигонуклеотиди. Основното предимство на ДНК е нейната дълготрайност като ДНК издържа 1000 пъти по-дълго от силиция (силициев чип – материалът, използван за изграждане компютри). Удивително, само един кубичен милиметър от ДНК може да побере квинтилиони байтове данни! ДНК също така е ултракомпактен материал, който никога не се разгражда и може да се съхранява на хладно и сухо място в продължение на стотици векове. Идеята за използване на ДНК за съхранение съществува от дълго време, още през 1994 г. Основната причина е сходният начин, по който информацията се съхранява в компютъра и в нашия ДНК – тъй като и двете съхраняват плановете на информацията. Компютърът съхранява всички данни като 0 и 1, а ДНК съхранява всички данни на жив организъм, използвайки четирите бази – тимин (T), гуанин (G), аденин (A) и цитозин (C). Следователно ДНК може да се нарече стандартно устройство за съхранение, точно като компютър, ако тези бази могат да бъдат представени като 0s (бази A и C) и 1s (бази T и G). ДНК е здрава и дълготрайна, като най-простото отражение е, че нашият генетичен код – планът на цялата ни информация, съхранена в ДНК – се предава ефективно от едно поколение на следващо по повтарящ се начин. Всички софтуерни и хардуерни гиганти са склонни да използват синтетична ДНК за съхраняване на огромни количества, за да постигнат целта си за решаване на дългосрочно архивиране на данни. Идеята е първо да се преобразуват компютърните кодове 0s и 1s в ДНК код (A, C, T, G), преобразувания ДНК код след това се използва за производство на синтетични вериги на ДНК, които след това могат да бъдат поставени в хладилно съхранение. Винаги, когато е необходимо, ДНК нишките могат да бъдат извадени от хладилно хранилище и тяхната информация да бъде декодирана с помощта на машина за секвениране на ДНК и ДНК последователността накрая се превежда обратно в двоичен компютърен формат от 1s и 0s, за да бъде прочетен на компютъра.

Показано е1 че само няколко грама ДНК могат да съхраняват квинтилиони байтове данни и да ги запазят непокътнати до 2000 години. Това просто разбиране обаче е изправено пред някои предизвикателства. Първо, доста скъпо е и също така болезнено бавно е да се записват данни в ДНК, т.е. действителното преобразуване на нули и единици в ДНК бази (A, T, C, G). Второ, след като данните са „записани“ върху ДНК, намирането и извличането на файлове е предизвикателство и изисква техника, наречена ДНК секвениране – процес на определяне на точния ред на базите в a ДНК молекула - след което данните се декодират обратно до 0s и 1s.

Едно скорошно проучване2 от учени от Microsoft Research и Университета на Вашингтон са постигнали „произволен достъп“ до съхранението на ДНК. Аспектът на „произволен достъп“ е много важен, защото означава, че информацията може да бъде прехвърлена към или от място (обикновено памет), в което всяко място, независимо къде в последователността, и може да бъде достъпно директно. Използвайки тази техника на произволен достъп, файловете могат да бъдат извлечени от съхранението на ДНК по селективен начин в сравнение с по-рано, когато такова извличане изисква необходимостта от секвениране и декодиране на цял набор от ДНК данни, за да се намерят и извличат няколкото търсени файлове. Значението на „произволния достъп“ се повишава още повече, когато количеството данни се увеличава и става огромно, тъй като намалява количеството на последователността, която трябва да се направи. Това е първият път, когато произволният достъп е показан в такъв голям мащаб. Изследователите също са разработили алгоритъм за по-ефективно декодиране и възстановяване на данни с по-голяма толерантност към грешки в данните, което прави процедурата по секвениране също по-бърза. Повече от 13 милиона синтетични ДНК олигонуклеотиди бяха кодирани в това проучване, което представляваше данни с размер 200MB, състоящи се от 35 файла (съдържащи видео, аудио, изображения и текст) с размери от 29KB до 44MB. Тези файлове бяха извлечени поотделно без грешки. Освен това авторите са разработили нови алгоритми, които са по-стабилни и толерантни към грешки при писане и четене на ДНК последователности. Това проучване, публикувано в Nature Biotechnology в голям напредък, показващ жизнеспособна, широкомащабна система за съхранение и извличане на ДНК.

Системата за съхранение на ДНК изглежда много привлекателна, защото има висока плътност на данните, висока стабилност и е лесна за съхранение, но очевидно има много предизвикателства, преди да бъде универсално приета. Няколко фактора са време и трудоемко декодиране на ДНК (секвенирането), а също и синтез на ДНК. Техниката изисква повече точност и по-широко покритие. Въпреки че е постигнат напредък в тази област, точният формат, в който данните ще се съхраняват в дългосрочен план като ДНК все още се развива. Microsoft се зарече да подобри производството на синтетична ДНК и да се справи с предизвикателствата, за да създаде напълно работещ ДНК система за съхранение до 2020 г.

***

{Можете да прочетете оригиналната изследователска статия, като щракнете върху връзката DOI, дадена по-долу в списъка с цитирани източници}

Източник (и)

1. Erlich Y и Zielinski D 2017. DNA Fountain позволява здрава и ефективна архитектура за съхранение. наука. 355 (6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Произволен достъп в мащабно съхранение на ДНК данни. Природна биотехнология. 36 https://doi.org/10.1038/nbt.4079

Екип на SCIEU
Екип на SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Значителен напредък в науката. Въздействие върху човечеството. Вдъхновяващи умове.

Искам да получавам известия за нови колекции

Да се ​​актуализира с всички най-нови новини, оферти и специални съобщения.

Най-популярни статии

- Реклама -
94,492Вентилаторикато
47,677последователиСледвай ни
1,772последователиСледвай ни
30АбонатиЗапиши се