Количество информации, производимой человечеством, постоянно растет. Причем в последние годы – быстрее, чем когда-либо в истории. Считается, что 90% существующих сегодня данных были созданы за последние два года. По прогнозам, в 2025 году объем хранимой информации превысит 180 зеттабайтов – это 18 плюс еще 22 нуля.
В этой связи вопрос хранения данных особенно актуален для бизнеса, ведь любая компания создает в тысячи раз больше информации, чем среднестатистический пользователь. Сложность хранения информации в локальном хранилище, быстрое развитие технологий и относительная дешевизна привели к популярности облачного хранения данных. Оно появилось в 2006 году и начало активно развиваться с 2010-х. Расскажем о нем подробнее.
Серверы облачного хранилища принадлежат конкретной компании (их может быть множество). Каждая из них выступает облачным провайдером и резервирует какое-то количество пространства под данные своих клиентов. В этом случае серверов у провайдера может быть много, а иногда они разбросаны по миру, находятся в разных регионах и даже странах. Поскольку достоинства значительно перевешивают недостатки облачных хранилищ, бизнес всё чаще выбирает этот вариант – по статистике, более 60% корпоративных данных хранится в облаке.
На особенностях облачных хранилищ и их подбора мы хотели бы остановиться немного подробнее. В этой статье мы расскажем, для чего необходимы облачные хранилища, и разберем возможности объектного хранилища S3. В первую очередь наш материал будет полезен владельцам проектов и тем, кто работает с Big Data.
Для начала – буквально несколько слов о том, что вообще такое облачное хранилище – для бизнеса, личных нужд и других задач.
Облачное хранилище – это онлайн-хранилище на удаленном сервере, с помощью которого можно хранить, отправлять и получать данные.
При использовании облачного хранилища его поставщик обеспечивает безопасность, надежность, доступность данных 24/7, а пользователь оплачивает конкретный объем информации по мере использования.
При этом если в случае с локальным сервером все аспекты хранения данных находятся под полным контролем пользователя, то при хранении в облаке их берет на себя провайдер. Это значит, что пространство, безопасность, доступность данных, вычислительные ресурсы и доставку данных по сети контролирует поставщик облачных хранилищ. Цель использования, функции, даже то, как выглядит облачное хранение данных для бизнеса или любой другой сферы, зависит от типа облачного хранилища. Всего их три – расскажем о них в следующем пункте.
Таким сервисом удобно пользоваться, файлы хранятся в системе каталогов и подкаталогов – примерно так же вы храните данные на вашем компьютере. Сервис подходит для мини-команды или личного использования, чтобы хранить и управлять небольшими объемами корпоративной информации. При этом файловое хранилище редко выбирают для “чувствительных” данных, например, финансовой отчетности – она требует большего внимания к безопасности. Примеры таких сервисов – бизнес- или личное облачное хранилище Google Диск, Dropbox, Яндекс Диск, Nextcloud, Amazon Cloud Drive и т. д.
В блочных облачных хранилищах данные разбиваются на блоки одинакового размера. При этом блок – это какой-то объем информации. Один файл, если он большой, может разбиваться и храниться сразу в нескольких блоках, но, если последний блок не заполнен до конца, он всё равно будет таким же по размеру, как и остальные блоки. Сервер получает доступ к блокам через SAN – сеть хранения данных, а операционная система сервера подключается к блокам данных через высокоскоростные интерфейсы Fiber Channel (FC) или iSCSI и присваивает каждому блоку простой идентификатор расположения (location ID), по которому его можно быстро найти в SAN. Поэтому блочное облачное хранилище считается одним из самых быстрых и производительных.
Объектное облачное хранилище – такая система облачного хранения данных, при которой информация представлена в качестве объектов и хранится в бакетах или, по-простому, в контейнерах. При этом данные неструктурированные – то есть не имеют единого формата хранения. Их тип может быть любым: документы, изображения, видеофайлы, аудио и т. д.
Но если в таком хранилище данные не структурированы, как тогда система найдет нужную информацию? Всё просто: объекты в хранилище можно пометить метаданными. Они служат простым идентификатором для данных, описывая их содержимое, помогают системе быстро найти и извлечь нужный объект. С точки зрения иерархии, в отличие от файлового хранилища, в объектном все данные равнозначны, так что хранить разнородную информацию и быстро получать к ней доступ здесь удобнее.
Объектные сервисы отлично подходят для хранения большого объема данных – их можно масштабировать до объема целого петабайта (1024 терабайта!) в одном домене без потери в производительности. Вот для чего еще подходит объектное хранилище:
Так что если ваш интернет-проект нагружен большим количеством данных на сайте или самом проекте в целом, вы можете выгрузить их в объектное хранилище, сэкономив на хранении и обеспечив безопасность. Всё потому, что объектные хранилища защищены тройной репликацией, шифрованием и версионированием, а хранение больших объемов данных в S3-подобных сервисах часто выгоднее за счет гибкой тарификации.
Сегодня объектное хранилище – бизнес-тренд, а в США он уже обогнал по популярности блочное хранилище. Объем рынка cloud storage в 2024 году превысил 8 млрд долларов, а с 2025 по 2029 год, по прогнозам, вырастет почти в два раза – с 9,49 до 17,43 млрд долларов.
В качестве примера мы не могли обойти самого яркого представителя этого рынка – S3, лидера отрасли. Остановимся на нем чуточку подробнее.
Мы не можем сказать точно, когда появилась технология объектного хранения данных, но популярной и общедоступной ее сделали в 2006 году в Amazon. Компания представила хранилище S3 – API для простого доступа к объектам с помощью уникальных адресов по HTTP или HTTPS. Ее назвали Simple Storage Services (отсюда и сокращенное “S3”). Технология позволяет надежно хранить гигабайты информации и быстро масштабироваться. Затем другие IT-компании начали выпускать свои решения, совместимые с S3 API, чтобы пользователи могли применять те же инструменты и приложения, что и S3, но на другой платформе. А сам Amazon S3 стал эталоном для всех последующих объектных хранилищ.
Что же в нем такого уникального и как работает хранилище S3?
Веб-интерфейс S3 позволяет просто и удобно хранить информацию и масштабироваться. Сама платформа отличается надежностью, доступностью и гибкостью. Хранилище поддерживает разные протоколы доступа (в частности – REST API), интегрируется с другими решениями AWS: EC2, Lambda и RDS. API S3 оказался довольно простым и понятным даже для неэкспертов в IT, поэтому технология быстро получила распространение.
S3 гарантирует доступность, целостность и защиту данных, а его архитектура позволяет хранить условно бесконечное количество данных. Помните, в начале статьи мы говорили о том, как быстро растет объем информации в мире? Так вот, возможно, уже через пару лет объектные хранилища станут нашим спасением 🙂. А поскольку в S3 нет иерархии данных, проще говоря, все они одинаково “важны”, то алгоритм и время доступа к данным почти не меняются по мере роста объема хранилища.
По умолчанию в S3 можно создавать до 2 тысяч контейнеров, а также хранить данные в трех экземплярах. Объектное хранилище S3 бывает двух типов в зависимости от того, насколько часто будут использоваться данные:
Этот тип хранения используют, если данные нужны редко и пользователь готов смириться с тем, что скорость их извлечения будет ниже. При этом холодное хранилище отлично подходит для архивной информации, которая может потребоваться раз-два в год. Такой тип хранения дешевле, но запросы и трафик обходятся дороже.
Такой тип данных нужен для хранения важной информации, к которой требуется постоянный доступ. Чтобы быстро извлекать данные, системе нужны скоростные диски, много оперативной памяти, а также мощный сетевой канал. Всё это оборудование складывается в высокую цену хранения. Поэтому горячее хранилище обычно используют для самого необходимого, а всё остальное складывают в холодное.
Главные преимущества S3 – это масштабируемость, гибкость, простота управления, доступность и надежность. Однако с недавних пор оплата Amazon S3 картами, выпущенными в России, стала невозможна, что в числе прочего вынудило пользователей обращаться к S3-совместимым решениям, а провайдеров – запускать их 🙂
В прошлом году мы тоже запустили объектное хранилище в Бегете. Хранилище основано на технологии Ceph, поддерживает разные классы хранения и API от AWS, что делает его совместимым с множеством приложений, работающих с Amazon S3. Тарифы объектного хранения начинаются от 1,96 рублей в день (20 Гб), при этом число бакетов неограниченно. Если для развития проекта вам требуется хранить большое количество информации, S3-совместимое хранилище станет отличным выбором.
Мы уже обсуждали, зачем нужно хранение в объектах, для чего его можно использовать и чем оно отличается от других типов облачных хранилищ данных, теперь разберем подробнее его достоинства и недостатки. Начнем с достоинств.
S3 позволяет масштабировать инфраструктуру за счет обмена данными между микросервисами и использовать его как промежуточное хранилище.
Все логи и отчеты хранятся в платформе, поэтому вы можете отслеживать работу хранилища, анализировать информацию и принимать обоснованные бизнес-решения.
Данные в объектном хранилище реплицируются автоматически на разных узлах, составляя единую децентрализованную систему. Поэтому если один или несколько узлов откажут, система всё равно продолжит работать. Всё это подкрепляется надежными механизмами безопасности (например, шифрованием и версионированием), так что за конфиденциальную информацию можно не беспокоиться.
В S3 можно хранить резервные копии любых размеров, управлять версиями, а также доступом к данным. Классы хранения позволяют приоритизировать данные, что открывает еще больше возможностей для контроля. Наконец, объектное хранилище доступно из любой точки мира, с любого браузера.
Есть у S3 и свои минусы. Например, оно плохо подходит там, где требуется высокая скорость операций или работа с большим количеством маленьких файлов.
Нетрудно догадаться, почему облачное хранилище сегодня используется в более чем 90% организаций. Это удобно, выгодно, позволяет быстрее масштабироваться, гибко управлять информацией, подключая к ней кого угодно и откуда угодно. Даже обычные пользователи всё чаще выбирают не устаревший жесткий диск, а персональное облачное хранилище. Таких сегодня уже 2,3 миллиарда человек.
Быстрое развитие облачных технологий позволяет бизнесу выбирать нужный вариант облачного хранилища: от файлового для базовых задач до блочного или объектного бизнес-хранилища для хранения больших объемов данных компании.
У каждого из них есть свои плюсы и минусы, однако финальный выбор зависит от потребностей проекта. Например, объектное хранилище для бизнеса подходит, если данных много, они не требуются ежедневно, но их объем постоянно растет. А вот хранение в блоках идеально для высокопроизводительных приложений – например, баз данных и виртуальных машин, где требуются низкая задержка и быстрое чтение.
Если у вас возникли какие-либо вопросы, свяжитесь с нами удобным для вас способом – и мы обязательно ответим. Также ждем вас в нашем официальном Telegram-канале, а обсудить статью или просто пообщаться на любую тему с коллегами по цеху и сотрудниками Бегета вы можете в нашем чате.