Благодаря оптимизации и кэшированию в памяти, сервис способен обрабатывать аналитические запросы к данным любого объема
Cloud Spark, предоставляемый VK Cloud, представляет собой сервис, который обеспечивает распределенную обработку неструктурированных и слабоструктурированных данных из различных источников, таких как S3, ClickHouse, Kafka и другие. Благодаря оптимизации и кэшированию в памяти, сервис способен обрабатывать аналитические запросы к данным любого объема. Cloud Spark позволяет решать задачи Data Science и аналитики оперативно и с минимальными затратами на инфраструктуру. Пользователи могут получать быстрый доступ к необходимым данным из разных источников при помощи SQL-запросов, а также использовать встроенную библиотеку MLlib для работы с машинным обучением.
«Облачный сервис Cloud Spark делает технологии корпоративного уровня доступными для компаний любого размера. Бизнес получает масштабируемый инструмент для работы с большими данными без необходимости самостоятельно запускать, настраивать и администрировать Spark или Kubernetes. Платформа VK Cloud обеспечивает гибкое масштабирование ресурсов, безопасность и соответствие требованиям 152-ФЗ, в то время как специалисты компании могут сосредоточиться на аналитических и исследовательских задачах, работе с машинным обучением, то есть на извлечении из данных пользы для бизнеса», — отмечает Александр Волынский, технический менеджер продукта, VK Cloud.
Сервис развернут на базе управляемого сервиса Kubernetes от VK Cloud, что позволяет гибко масштабировать и оптимизировать затраты на вычислительные ресурсы, сокращая стоимость инфраструктуры до 60%. Поддержку и администрирование Cloud Spark предоставляет платформа VK Cloud, что позволяет сэкономить время и ресурсы на рутинных задачах. VK Cloud предоставляет доступ к Cloud Spark, сервису для работы с большими данными на базе Apache Spark и Kubernetes. Благодаря Cloud Spark, бизнес может структурировать данные из разных источников для создания аналитических и предиктивных систем, а также моделей машинного обучения. С автоматическим масштабированием Kubernetes в зависимости от нагрузки, сервис Cloud Spark позволяет сократить затраты на вычислительные ресурсы до 60%.
Источник: https://ixbt.pro/