Многим клиентам Amazon Web Services (AWS) требуется решение для хранения и анализа данных, которое обеспечивает большую гибкость и оперативность, чем традиционные системы управления данными. Озеро данных - это новый и все более популярный способ хранения и анализа данных, поскольку он позволяет компаниям управлять несколькими типами данных из самых разных источников и хранить эти данные, структурированные и неструктурированные, в централизованном хранилище.

AWS предоставляет сервисы, необходимые для того, чтобы помочь клиентам реализовать безопасное, гибкое и экономически эффективное озеро данных. К ним относятся управляемые сервисы AWS, которые помогают получать, хранить, находить, обрабатывать и анализировать структурированные и неструктурированные данные.


Data Lake на AWS автоматически настраивает основные сервисы AWS, необходимые для удобного тегирования, поиска, обмена, преобразования, анализа и управления определенными подмножествами данных в компании или с другими внешними пользователями.
На схеме выше представлена архитектура озера данных