AWS представила Graviton-версии RG-инстансов Redshift для снижения затрат на аналитику
Новые инстансы объединяют запросы к хранилищу и data lake в одном движке, снижая сложность и устраняя непредсказуемые charges Spectrum.
AWS выпустила новые RG-инстансы на базе Graviton для сервиса хранилища данных Amazon Redshift, рассчитывая помочь компаниям снизить как растущие расходы на аналитику, так и операционную сложность современных lakehouse-архитектур.
В основе новых инстансов лежит интегрированный движок запросов к data lake, который, по словам AWS, способен выполнять SQL-аналитику одновременно по данным хранилища Redshift и озёр данных Amazon S3, обеспечивая более высокую скорость запросов и более низкие затраты на аналитику.
«Ранее системы Amazon Redshift RA3 работали как два отдельных движка: Redshift обрабатывал данные хранилища, а Spectrum — запросы к data lake в S3. Когда запрос затрагивал оба источника, AWS приходилось координировать работу между двумя системами, что добавляло сложность, замедляло выполнение и делало расходы на сканирование Spectrum непредсказуемыми», — сказал Pareekh Jain, главный аналитик Pareekh Consulting.
«Новые RG-инстансы объединяют эти два мира в один интегрированный движок, работающий прямо внутри Redshift. Это означает, что Iceberg, Parquet и данные S3 data lake теперь можно запрашивать нативно вместе с данными хранилища, с меньшим перемещением данных, меньшими накладными расходами и лучшей оптимизацией производительности, а также без отдельных сборов Spectrum за каждое сканирование», — добавил Jain.
По словам аналитика, отдельные charges Spectrum все сильнее становились проблемой для предприятий, поскольку AI-нагрузки увеличивали число запросов, объем машинно-генерируемой аналитики и потребность в обработке данных. Многие клиенты недовольны отдельной моделью оплаты Spectrum, основанной на сканировании, из-за риска внезапных скачков счетов.
Новые инстансы могут быть ответом AWS на растущий спрос предприятий на аналитические платформы масштаба AI, которые не добавляют архитектурной сложности, отметил Jain. При этом Databricks, Snowflake, Google Cloud с BigQuery и Microsoft через Microsoft Fabric продвигают унифицированные lakehouse-платформы, чтобы сократить операционную разрозненность.
«RG-инстансы действительно усиливают конкурентные позиции Amazon Redshift, но в основном это оборонительный шаг, а не прорывная деструкция», — сказал Jain.
Если Databricks делает ставку на возможности AI и data science, Snowflake — на простоту multicloud, Google Cloud — на AI-native аналитику через BigLake, а Microsoft — на тесную интеграцию Fabric, Power BI и Microsoft Copilot, то AWS рассчитывает на масштаб Amazon S3 и более тонкую оптимизацию Redshift, чтобы удержать корпоративные аналитические нагрузки внутри своего облачного стека, добавил Jain.
На что стоит обратить внимание предприятиям
По словам главного аналитика Greyhound Research Sanchit Vir Gogia, именно это различие в стратегии CIO и корпоративные команды должны учитывать при оценке новых инстансов.
«Лучший вариант — не для каждой нагрузки. Лучший вариант — это болезненное пересечение. Именно там сходятся Redshift, S3, open formats, BI, повторяющаяся аналитика, давление на затраты и AI-assisted querying. Именно там RG может заметно снизить трение», — сказал Gogia.
«CIO следует инвентаризировать внешние схемы, выявить lake-запросы с высоким числом сканов и высокой частотой, протестировать нагрузки Iceberg и Parquet при реальной конкуренции, проверить поведение при month-end reporting, смоделировать паттерны запросов AI-agents и оценить, остаётся ли экономия реальной после учета compute, S3, Glue, KMS, мониторинга и операционных издержек», — добавил Gogia.
Наибольшую выгоду от новых RG-инстансов получат компании, которые уже хранят большие объемы данных в S3 в форматах вроде Iceberg и Parquet, особенно в банковском секторе, телекоме, ритейле, производстве, медиа, рекламе и IoT, сказал Jain. «Эти компании часто работают с огромными наборами данных, дорогой дубликацией данных между озерами и хранилищами, непредсказуемыми счетами и несколькими системами, которыми трудно управлять», — отметил он.
AWS также предупредила компании, что не стоит ожидать одинаковой экономии для всех рабочих нагрузок, и рекомендовала использовать AWS Pricing Calculator со своими собственными паттернами нагрузки для оценки потенциального снижения затрат. Сейчас новые RG-инстансы доступны в регионах US East, US West, Canada, São Paulo, Frankfurt, Ireland, Milan, London, Paris, Spain, Stockholm, Mumbai, Hyderabad, Singapore, Sydney, Seoul, Tokyo и Hong Kong.
Материал — перевод статьи с английского.
Оригинал: AWS debuts Graviton-powered Redshift RG instances to cut analytics costs