СХД: сохраняем преимущества в облаках

27.04.2021


Переход в облако в большинстве случаев предполагает миграцию данных. В случае с гибридным облаком или гибридным мультиоблаком разовой операцией не обойтись. Речь идет как минимум об эпизодических синхронизациях, а для бизнес-критичных данных и приложений требуется постоянная репликация.

В гибридных облачных и мультиоблачных инфраструктурах часть данных хранится и обрабатывается «на земле». Какие преимущества в такой архитектуре можно получить от вложений в системы хранения данных, расположенные on-premise? Рассмотрим различные возможности, предлагаемые производителями систем хранения для интеграции с облаками.

Два варианта реализации

В облаках можно найти два варианта реализации «классических» СХД: программно определяемые версии систем хранения (Software-Defined Storage, SDS) и «железные» системы хранения, установленные в ЦОДах облачных провайдеров или в непосредственной близости к ним. Как правило, SDS запускается на одной или нескольких арендуемых заказчиком виртуальных машинах и полностью им управляется. При этом провайдер предоставляет разделяемые вычислительные ресурсы и виртуализуемые SDS ресурсы хранения. 

Если же используется физическая система хранения, то провайдер обычно создает на ней виртуальную СХД, которой и управляет заказчик или сам провайдер. Выбор между этими двумя вариантами основан на требованиях, предъявляемых к объему и производительности облачной СХД. Функционал, как правило, одинаков.

«Привычка – вторая натура». Привычный функционал в облаке (снимки, клоны)

Если локальная СХД предоставляет возможность создавать мгновенные снимки и клоны, ваша команда определенно этими возможностями пользуется. От них зависят процессы резервного копирования, тестирования, разработки. 
Однако при переходе в облако могут потребоваться не только перенос данных, но и сложные процедуры изменения и оптимизации бизнес-процессов. А в случае гибридного облака может понадобиться поддержка разных бизнес-процессов для решения одной и той же задачи как «на земле», так и в облаке, что вызовет дополнительные затраты. 
 
«Дедуплицируй это». Экономия на хранении данных в облаке (дедупликаця, сжатие, уплотнение)

Облачные провайдеры предоставляют ресурсы для хранения данных и выставляют счет заказчикам за потребленный ими объем. При этом если провайдер использует в своих системах хранения технологии дедупликации или сжатия, он получает возможность экономить на ресурсах хранения.

Если же заказчик будет использовать виртуальную СХД в облаке с таким функционалом, то эффект от дедупликации и сжатия данных будет давать экономию уже заказчику, а не провайдеру. Безусловно, за виртуальную СХД с таким функционалом придется платить больше, поэтому нужно хорошо понимать, какие данные будут храниться, чтобы стоимость СХД в облаке не перевесила возможную экономию.

«Побег из курятника»

Как известно, в облако легко «зайти», но тяжело и дорого выйти. Передача данных в облако почти всегда бесплатна, зато исходящий трафик может потребовать немалых средств. За возможность «бесконечного» увеличения объема данных, хранимых в облаке, приходится платить не только в процессе хранения, но и в случае смены провайдера или переноса данных «на землю».

В этом случае экономически целесообразным может оказаться функционал репликации данных между облаками и «землей» без оплаты исходящего трафика. Ряд производителей систем хранения данных предоставляют такие опции. Репликация может осуществляться между программно определяемыми и физическими СХД в разных сочетаниях. Это значительно упрощает миграцию данных между провайдерами и собственными ЦОДами, поскольку не требует при каждом переносе учитывать стоимость трафика. Такая гибкость в переносе данных между площадками позволит оптимизировать стоимость вычислительных ресурсов, ведь она дает возможность проще переносить данные туда, где их дешевле обрабатывать.

Какие решения есть на рынке

На рынке сегодня доступны решения минимум трех производителей: NetApp, HPE и IBM.

NetApp предлагает несколько продуктов и услуг, которые можно найти в AWS, Microsoft Azure и Google Cloud.

Cloud Volumes дает возможность получить высокопроизводительную распределенную файловую систему в облаках. Приложения, которые написаны для работы с POSIX-совместимыми файловыми системами NFS и SMB, могут быть перенесены в облако без изменений. Сервис NetApp Cloud Sync позволяет данным мигрировать между облачной и локальной средами. За управление и работу сервиса отвечает производитель, заказчику достаточно указать нужную емкость и выбрать нужные уровни производительности, доступности и защиты.

Тем, кому требуется полный контроль, пригодится продукт NetApp Cloud Volumes ONTAP. Это программно определяемая система хранения, построенная на базе программного обеспечения NetApp ONTAP и вычислительных ресурсов, которые предоставляются облачными провайдерами. Пользователь сам управляет системой хранения и может организовать файловый и блочный доступ для своих приложений в облаках. Можно реплицировать данные между регионами и облаками, можно создавать уникальные политики защиты данных, а также получать преимущества в стоимости владения и производительности по сравнению со стандартными сервисами хранения в облаках.

Оба продукта органично дополняются сервисами для репликации данных между облаками и «землей» для автоматизированного переноса «холодных» данных на более дешевые уровни хранения, для мониторинга, управления и защиты данных в сложной гибридной среде.

HPE Cloud Volumes — это мультиоблачные сервисы хранения данных, базирующиеся на двух продуктах компании HPE: Nibmle Storage и InfoSight. Оба продукта теперь доступны в Azure, Google Cloud Services и AWS, а также в гибридных инфраструктурах.

Сервис Cloud Volumes Block предназначен для приложений в облаках, которым необходимы производительность, доступность и функционал блочных систем хранения корпоративного класса. Репликация с on-premise-системами Nimble, глобальный мониторинг мультиоблачной среды хранения через Infosight, поддержка от производителя — вот далеко не полный перечень возможностей.

Для тех, кто использует системы хранения HPE Nimble, 3PAR и Primera и задумывается о резервном копировании в облако, будет интересен сервис Cloud Volumes Backup. Помимо возможности задействовать существующие системы резервного копирования Veeam и Commvault, сервис приумножит выгоду от вложений в функционал эффективного хранения, а именно — в дедупликацию и компрессию.

Компания IBM предлагает облачную версию своей программно определяемой системы хранения IBM Spectrum Virtualize. Продукт IBM Spectrum Virtualize for Public Cloud доступен в IBM Cloud и AWS. В сочетании со Spectrum Virtualize облачная версия позволяет зеркалировать данные между «землей» и облаком или между облачными площадками. Это, в свою очередь, может использоваться для миграции данных в облако или между облаками для реализации системы защиты от катастроф и для применения DevOps-практик с репликацией данных из локальных источников.

Тем, кто эксплуатирует в своих ЦОДах такие системы IBM, как SAN Volume Controller и FlashSystem, работающие на базе программного обеспечения IBM Spectrum Virtualize, описанные выше возможности доступны при использовании облачного сервиса. Хорошо зарекомендовавшая себя виртуализация систем хранения позволит расширить функционал интеграции с облаком на локальных СХД других производителей.

Все перечисленные вендоры предлагают API и CLI для управления такими гибридными мультиоблачными средами. Это важно для автоматизированного управления и контроля.

Ложка дегтя

Не каждый провайдер предоставляет облачные версии физических СХД. Чаще всего это делают гиперскейлеры – Google, AWS, Azure. Если вам ближе российские провайдеры, то выбор сильно сужается.

Стоит обратить внимание и на системы управления такими распределенными СХД. Крупным компаниям нужно задуматься над созданием озера данных, объединяющего различные ресурсы хранения в облаках и «на земле».

В завершение отмечу, что сложность системы может свести на нет ее возможные преимущества.
Автор: Юрий Барабанщиков
Источник: ИКС Медиа, 27.04.2021

Другие статьи по теме

Чек-лист: Что такое гибридное облако и почему оно полезно бизнесу Современный бизнес всё больше уходит в облако, чему особенно поспособствовала ситуация с пандемией COVID-19, из-за которой во многих предприятиях значительная часть сотрудников была переведена на удалённую работу и по разным причинам не могла получать полноценный доступ к локальной ИТ-инфраструктуре. Однако далеко не все организации готовы полностью перейти в общедоступное облако, в частности, по соображениям безопасности и надёжности, а также в связи с требованиями регуляторов. При этом многие желали бы пользоваться преимуществами гибкости и масштабируемости, предлагаемыми облачными сервисами. В таких случаях оптимальным решением может стать гибридное облако, объединяющее частное и общедоступное облака в единую инфраструктуру. В каких кейсах имеет смысл выбрать гибридное облако и какие решения лучше использовать, нам помогал разобраться Олег Головко, первый заместитель управляющего директора компании «ЛАНИТ-Интеграция» (входит в группу ЛАНИТ). Олег Головко TAdviser, 19.04.2021