Вопросы и ответы по Amazon CloudWatch

Общие вопросы

Amazon CloudWatch – это сервис мониторинга облачных ресурсов AWS и приложений, работающих на AWS. Можно использовать Amazon CloudWatch для сбора и отслеживания метрик, накопления и анализа логов, а также для создания предупреждений. Amazon CloudWatch может вести мониторинг ресурсов AWS (таких как инстансы Amazon EC2, таблицы Amazon DynamoDB, инстансы БД Amazon RDS), пользовательских метрик приложений и сервисов, а также мониторинг любых журналов приложений, размещенных на локальных, гибридных или других облаках. Amazon CloudWatch можно использовать для получения сводной информации о системе, включая информацию об используемых ресурсах, производительности приложений и общей работоспособности системы. Эти данные применяются для оперативного реагирования и обеспечения стабильной работы приложений.

Для начала мониторинга можно использовать Automatic Dashboards со встроенными рекомендациями AWS, изучить представление метрик и оповещений на основе аккаунта и ресурсов, а также легко провести подробное исследование, чтобы выяснить первопричину проблем с производительностью.

Сервис Amazon CloudWatch доступен посредством API, интерфейса командной строки, AWS SDK или Консоли управления AWS.

Сервис Amazon CloudWatch получает и предоставляет показатели для всех инстансов Amazon EC2 и должна работать со всеми операционными системами, которые на данный момент поддерживает сервис Amazon EC2.

Благодаря интеграции Amazon CloudWatch с сервисом AWS Identity and Access Management (IAM) можно указывать, какие действия CloudWatch пользователь может выполнять в рамках аккаунта AWS. Например, можно создать политику IAM, которая позволит только определенным пользователям организации использовать API GetMetricStatistics. Тогда они смогут выполнять действие для извлечения данных по облачным ресурсам.

IAM невозможно использовать для управления доступом к данным CloudWatch отдельных ресурсов. Например, нельзя предоставить пользовательский доступ к данным CloudWatch только для определенного набора инстансов или определенного балансировщика нагрузки. Полномочия, предоставленные с помощью IAM, распространяются на все облачные ресурсы, работающие с CloudWatch. Кроме того, невозможно использовать роли IAM с инструментами командной строки Amazon CloudWatch.

Возможность Amazon CloudWatch Logs позволяет следить за работой систем и приложений и решать возникающие в них проблемы, используя файлы журналов соответствующих систем и приложений, а также пользовательские файлы журналов.

С помощью CloudWatch Logs можно проверять свои журналы на наличие определенных фраз, значений или шаблонов в режиме, близком к реальному времени. Например, можно настроить выдачу предупреждений о количестве ошибок, зарегистрированных в системных журналах, или отображение графиков задержки веб‑запросов, зарегистрированных в журналах приложений. Затем можно просмотреть данные исходного журнала, чтобы определить источник проблемы. Данные журналов можно неограниченное время хранить с возможностью доступа к ним, используя для этого недорогое хранилище с высокой степенью надежности, что исключает проблему нехватки места на жестком диске.
Amazon CloudWatch Logs позволяет следить за работой систем и приложений и решать возникающие в них проблемы, используя файлы журналов соответствующих систем и приложений, а также пользовательские файлы журналов.

CloudWatch Logs позволяет отслеживать и сохранять журналы для анализа работы систем и приложений, а также для управления ими. Использовать CloudWatch Logs можно разными способами.

Журналы CloudWatch можно использовать для мониторинга приложений и систем в режиме реального времени с помощью данных журналов. Например, CloudWatch Logs может отслеживать количество ошибок в журналах приложений и отправлять оповещения, когда оно превышает заданное пороговое значение. Поскольку при работе с CloudWatch Logs для мониторинга используются данные существующих журналов, никаких изменений в код вносить не требуется.

Благодаря им соответствующие данные можно хранить бессрочно, используя для этого недорогое хранилище с высокой степенью надежности. Это устраняет проблему нехватки места на жестком диске. Агент CloudWatch Logs позволяет быстро и просто переместить ротируемые и неротируемые файлы журнала с хоста в сервис журналов. Затем при необходимости можно получить доступ к необработанным данным событий журналов.

Агент CloudWatch Logs поддерживает Amazon Linux, Ubuntu, CentOS, Red Hat Enterprise Linux и Windows. Такой агент поддерживает возможность отслеживания отдельных файлов журналов на узлах.

Да. Агент CloudWatch Logs интегрирован с сервисом Identity and Access Management (IAM) и поддерживает как ключи доступа, так и роли IAM.

Amazon CloudWatch Logs Insights – это интерактивный сервис для анализа журналов для CloudWatch Logs с оплатой по факту использования. Он помогает разработчикам, операторам и системным инженерам понимать, улучшать и отлаживать свои приложения, позволяя искать и визуализировать свои журналы. Logs Insights полностью интегрирован в CloudWatch, что позволяет управлять журналами, изучать их и анализировать. Вы можете также использовать метрики, оповещения и панели управления с журналами CloudWatch, чтобы полностью видеть операционные данные приложений. Это дает возможность оперативно разобраться в приложениях, внести улучшения, найти и устранить проблемы, продолжив быстро внедрять инновации. Можно записывать вопросы с совокупностями, фильтрами и регулярными выражениями, чтобы получить из журналов сведения, на основе которых можно предпринимать дальнейшие действия. Можно также визуализировать данные временных рядов, глубоко изучить отдельные события журнала и экспортировать результаты запросов на панели управления CloudWatch.

Можно мгновенно начать использовать Logs Insights для выполнения запросов по всем журналам, отправляемым в CloudWatch Logs. Управление инфраструктурой и настройка не требуются. Доступ к Logs Insights можно получить из Консоли управления AWS или программно через приложения с помощью AWS SDK.

Сервис Amazon CloudWatch Anomaly Detection применяет алгоритмы машинного обучения для непрерывного анализа отдельных временных рядов систем и приложений, определения базового уровня нормы и выявления поверхностных аномалий с минимальным вмешательством пользователя. С его помощью можно создавать предупреждения, пороговые значения для которых автоматически изменяются в отношении шаблонов естественных метрик, например сезонных колебаний в зависимости от времени, дня недели или изменения тенденций. Кроме того, на панелях управления можно визуализировать метрики в виде полос обнаружения аномалий, отслеживая и изолируя их изменения и устраняя проблемы.

Начать работу с Anomaly Detection совсем не сложно. В консоли CloudWatch на панели навигации перейдите к разделу Alarms (Предупреждения), чтобы создать предупреждение, или к разделу Metrics (Метрики), чтобы наложить на график ожидаемые значения метрики в виде полосы. Включить сервис Anomaly Detection можно и с помощью интерфейса командной строки AWS, различных AWS SDK и шаблонов AWS CloudFormation. Дополнительные сведения см. в документации по CloudWatch Anomaly Detection и на странице цен.

Теперь сервис Amazon CloudWatch включает сервис Contributor Insights, который анализирует данные временных рядов и создает представления со сведениями об элементах, которые сильнее всего влияют на производительность системы. После настройки сервиса Contributor Insights он работает непрерывно, не требуя вмешательства пользователя. Благодаря этому разработчики и операторы могут быстрее выявлять, диагностировать и устранять проблемы во время эксплуатационных мероприятий.

В консоли CloudWatch на панели навигации перейдите в раздел Contributor Insights и создайте правило Contributor Insights. Кроме того, сервис Contributor Insights можно включить с помощью интерфейса командной строки AWS, различных AWS SDK и шаблонов AWS CloudFormation. Сервис Contributor Insights доступен во всех коммерческих регионах AWS. Дополнительные сведения см. в документации по CloudWatch Contributor Insights.

Сервис Amazon CloudWatch ServiceLens дает возможность из единого центра визуализировать данные о работоспособности, производительности и доступности ваших приложений. Сервис CloudWatch ServiceLens работает совместно с метриками и журналами CloudWatch, а также с маршрутами из сервиса AWS X-Ray, позволяя вам получать полную картину своих приложений и их зависимостей. Благодаря этому вы можете быстро обнаруживать элементы, ухудшающие производительность, выявлять первопричины проблем, связанных с приложениями, и определять затронутых пользователей. С помощью сервиса CloudWatch ServiceLens можно получить полную картину ваших приложений в трех основных областях: мониторинг инфраструктуры (с использованием метрик и журналов, чтобы понимать, какие ресурсы используются для поддержки ваших приложений), мониторинг транзакций (использование маршрутов для понимания зависимостей между вашими ресурсами) и мониторинг конечных пользователей (использование программ-осведомителей для мониторинга конечных точек и уведомления вас в случае ухудшения условий работы для конечных пользователей).

Если вы уже используете сервис AWS X-Ray, то вы по умолчанию можете получить доступ к сервису CloudWatch ServiceLens в консоли CloudWatch. Если вы еще не используете сервис AWS X-Ray, то чтобы начать работу, вы можете включить сервис AWS X-Ray в своих приложениях с помощью X-Ray SDK. Сервис Amazon CloudWatch ServiceLens можно использовать во всех общедоступных регионах AWS, в которых доступен сервис AWS-X-Ray. Дополнительные сведения см. в документации по сервису Amazon CloudWatch ServiceLens.

Сервис Amazon CloudWatch Synthetics упрощает мониторинг конечных точек приложений. Он круглосуточно каждую минуту выполняет тесты для ваших конечных точек и предупреждает вас, когда конечные точки приложений ведут себя не так, как ожидается. Эти тесты можно настроить для проверки доступности, задержек, транзакций, испорченных или неработоспособных ссылок, пошагового выполнения задач, ошибок загрузки страниц, задержек нагрузки для активов пользовательских интерфейсов, потоков сложных мастеров или потоков проверки в ваших приложениях. Вы также можете использовать сервис CloudWatch Synthetics, чтобы выявлять конечные точки приложений, для которых получены аварийные сигналы, и сопоставлять их с проблемами базовой инфраструктуры, что позволяет уменьшить среднее время устранения неисправностей.

Начать работу с сервисом CloudWatch Synthetics просто. Вы за считанные минуты можете написать собственную программу-осведомитель. Дополнительные сведения см. в документации по сервису Amazon CloudWatch Synthetics.

Цены

См. актуальные тарифы на странице цен.

Инстансы Amazon EC2 всех типов автоматически отправляют важнейшие метрики состояния и производительности в сервис CloudWatch бесплатно. При использовании подробного мониторинга EC2 с вас будет взиматься оплата в зависимости от количества пользовательских метрик каждого инстанса, отправленных в CloudWatch. Количество отправляемых метрик инстанса зависит от типа инстанса. Подробные сведения см. в разделе Метрики CloudWatch для ваших инстансов.

Если не указано иное, представленные здесь цены не включают применимые налоги и сборы, в том числе НДС и применимый налог с продаж. Подробнее.

До июля 2017 года начисления за использование сервиса CloudWatch разбивались на две части как в счетах AWS, так и в отчетах об использовании. Исторически сложилось так, что начисления за использование предупреждений, метрик и API сервиса CloudWatch приводились в счетах в разделе сведений об использовании Elastic Compute Cloud (EC2), а начисления за использование CloudWatch Logs и панелей управления CloudWatch приводились в разделе сведений об использовании CloudWatch. Чтобы объединить сведения и упростить для пользователей оценку ежемесячного использования AWS CloudWatch и связанных расходов, мы переместили данные об использовании метрик, предупреждений и API сервиса CloudWatch из раздела «EC2» в раздел «CloudWatch». Таким образом, все расходы на мониторинг с использованием CloudWatch теперь логично собраны в разделе «CloudWatch». Обратите внимание: это никак не отражается на общей сумме счета AWS. Просто теперь в счетах и отчетах об использовании все расходы на CloudWatch отражаются в одном разделе.

Дополнительно в CloudWatch можно воспользоваться метрикой Estimated Charges, позволяющей просматривать как совокупные расходы (Total Estimated Charge), так и расходы по отдельным сервисам (By Service). Значение метрики «Total Estimated Charge» не изменится. Однако при использовании метрики EstimatedCharges с разбивкой по отдельным сервисам изменятся значения для параметра ServiceName, равного «AmazonEC2» или «AmazonCloudWatch». За счет изменения в компоновке счета будет заметно, что метрики расходов на Amazon EC2 стали ниже, а метрики расходов на Amazon CloudWatch возросли за счет того, что в эту группу перемещена часть расходов из EC2.

Плата за сервис Logs Insights взимается за каждый запрос и зависит от объема данных, обработанных при этом запросе. Чтобы получить дополнительные сведения, см. раздел Цены на CloudWatch.

Да, если вы сделаете это вручную, будет удержана плата за количество данных журнала, обработанных сервисом до момента отмены запроса.

Нет, плата за неудачные запросы не взимается.

Наблюдение за многочисленными аккаунтами

Благодаря наблюдению за многочисленными аккаунтами в CloudWatch можно отслеживать работу приложений в большом количестве аккаунтов региона и устранять возникающие проблемы. Наблюдая за событиями в многочисленных аккаунтах, можно беспрепятственно искать, визуализировать и анализировать показатели, журналы и записи, не беспокоясь о границах аккаунтов. Можно начать с объединенного представления вашего приложения в различных аккаунтах для визуального определения ресурсов, в которых возникают ошибки, и углубиться в соответствующие показатели, журналы и записи, чтобы выявить первопричину проблемы. Беспрепятственный доступ к данным и навигация в многочисленных аккаунтах, проводимые в рамках мониторинга, помогают снизить объем работ, выполняемых вручную для устранения проблем, а также сэкономить ценное время. Наблюдение за многочисленными аккаунтами служит дополнением к возможности унифицированного наблюдения в CloudWatch.

Наблюдение за многочисленными аккаунтами вводит две новые концепции для них. «Аккаунт мониторинга» – это центральный аккаунт AWS, в котором можно просматривать данные наблюдения, сгенерированные в других аккаунтах, а также выполнять действия с такими данными. «Исходный аккаунт» – это отдельный аккаунт AWS, который генерирует данные наблюдения для находящихся в нем ресурсов. После идентификации аккаунта мониторинга и исходного аккаунта нужно создать конфигурацию для мониторинга многочисленных аккаунтов, выбрав телеметрические данные, которые будут использоваться в аккаунте мониторинга. За несколько минут вы легко настроите центральные аккаунты мониторинга, из которых будете полностью видеть состояние и производительность своих приложений, развернутых в многочисленных связанных аккаунтах или во всей организации AWS. Используя функцию наблюдения за многочисленными аккаунтами в CloudWatch, вы можете «с высоты птичьего полета» видеть взаимосвязи между различными приложениями, влияющие на доступность сервиса, а также заранее выявить и устранить проблемы, снизив среднее время, затрачиваемое на их решение.

Осуществляя наблюдение за многочисленными аккаунтами, можно искать хранящиеся в них группы журналов из центрального представления, выполнять запросы Logs Insights и аналитику Live Tail, а также создавать правила Contributor Insights для разных аккаунтов, чтобы определить участников, создающих наибольшее количество записей журнала. С помощью функции поиска можно визуализировать показатели многих аккаунтов в консолидированном представлении, создавать сигналы тревоги, которые оценивают показатели из других аккаунтов, чтобы узнавать об отклонениях и проблемных тенденциях, а также визуализировать их на централизованных панелях управления. Вы также можете использовать эту возможность для настройки единого потока метрик, охватывающего несколько аккаунтов AWS в регионе AWS. Наблюдая за многочисленными аккаунтами, можно также просматривать интерактивную карту приложений в различных аккаунтах с помощью ServiceLens. Достаточно одного действия, чтобы углубиться в соответствующие показатели, журналы и записи.

Функции мониторинга в различных аккаунтах и регионах в CloudWatch будут доступны в консоли CloudWatch. После настройки наблюдения за многочисленными аккаунтами в CloudWatch из консоли будут удалены выпадающие меню для нескольких аккаунтов и регионов. Обратите внимание, что наблюдение в CloudWatch доступно только в одном регионе за один раз. Благодаря работе с многочисленными аккаунтами и регионами можно получать доступ к телеметрическим показателям всей организации через роли IAM. Наблюдение за многочисленными аккаунтами в CloudWatch выполняется с помощью API Observability Access Manager для определения политик доступа. Подробнее см. в нашей документации.

Мониторинг производительности приложений (APM)

Amazon CloudWatch обеспечивает полный контроль интервалов транзакций приложений, предоставляя разработчикам новые мощные инструменты поиска и аналитики независимо от масштаба. Это комплексное решение выходит за рамки выборочной проверки и позволяет быстро установить связь между воздействием транзакций на бизнес и производительностью приложений. Благодаря готовым функциям аналитики и визуализации CloudWatch мгновенно анализирует общее состояние и производительность транзакций, выполняемых приложениями. Эта функция, органично интегрированная с возможностями отслеживания состояния приложений в CloudWatch, позволяет эффективно и без труда отслеживать и оптимизировать приложения, а также устранять неполадки.

Сигналы приложений можно включить в Консоли управления AWS для CloudWatch или при включении CloudWatch для ресурсов AWS, таких как кластеры Amazon EKS. Инструменты для приложений включены в агент Amazon CloudWatch. Сервисы приложений, их API и зависимости обнаруживаются и визуализируются в сводном представлении и на карте сервисов. Чтобы отразить влияние и значимость для бизнеса, вы можете быстро создать цели уровня обслуживания (SLO) на основе стандартных метрик приложений, мониторинга данных реальных пользователей или синтетических данных. В режиме «Больше APM» в консоли отображаются отслеживаемые и неотслеживаемые ресурсы, что позволяет клиентам постепенно улучшать контроль над приложениями. Настройки CloudWatch можно использовать для увеличения частоты отслеживания критически важных сервисов и сбора большего количества примеров ответственных транзакций, таких как платежные поручения. Чтобы добавить внешний мониторинг доступности или рабочие процессы пользовательского интерфейса, можно добавить синтетические программы-осведомители, а для улучшения контроля над клиентами включить телеметрию RUM в веб-приложениях. Чтобы начать работу с функцией отслеживания состояния приложений с полным контролем интервалов транзакций приложения, см. документацию.

Функция отслеживания состояния приложений Amazon CloudWatch обнаруживает сервисы приложений, такие как обработчик платежей по ипотечным кредитам, работающий в EKS, и формирует стандартный набор метрик приложений, учитывающих объем, задержку, ошибки и сбои в API (например, при добавлении пользователей, размещении заказов, оплате и т. д.) и зависимости (например, вызовы между сервисами приложений, сервисами AWS или внешними адресами). Клиенты могут отразить влияние на бизнес и значимость сервисов приложений, их API и зависимости, задав цели уровня обслуживания. Новые представления наблюдаемости, ориентированные на приложения, в Консоли управления AWS для CloudWatch позволят затем обобщить состояние приложений относительно SLO и вывести подробный анализ для оперативного выявления основной причины.

Используйте сигналы приложений для встроенного мониторинга производительности приложений. Благодаря встроенному мониторингу можно автоматически собирать и сопоставлять телеметрию приложений, одновременно определяя приоритеты для ответственных приложений. Кроме того, данные предупреждений, отслеживаний и событий можно использовать для автоматического выполнения действий и сокращения времени устранения проблем (MTTR). Вам требуется проводить мониторинг приложений, работающих в Amazon EKS, Amazon EC2, Amazon ECS, базах данных, компонентах или локальных ресурсах. Просто укажите ресурсы для мониторинга и включите сигналы приложений для Amazon EKS в консоли CloudWatch без ручной настройки. Во всех других средах приложений можно быстро развернуть агент CloudWatch и начать мониторинг приложений. С помощью сигналов приложений вы можете создавать, измерять и отслеживать SLO в соответствии с нужными ключевыми показателями эффективности. SLO играют важную роль в управлении ответственными приложениями, повышении доступности, сокращении времени простоя и обеспечении стабильного обслуживания клиентов. Вам требуется доступ к полному представлению всех приложений и возможность управлять их производительностью. Используйте автоматические, готовые и стандартизированные панели управления для всех ваших приложений, сервисов и данных телеметрии. Эти возможности визуализации помогают быстро выполнять проверку и получать доступ к таким метрикам, как объем, доступность, задержки и ошибки, влияющие на ваши приложения. Карты сервисов в сигналах приложений позволяют подробно изучить отслеживания, API и вычислительные ресурсы, чтобы получить полное представление об основных причинах проблем с приложениями. Благодаря интеграции Amazon CloudWatch RUM и Amazon CloudWatch Synthetics в сигналы приложений можно получать данные пользователей в режиме реального времени и просматривать данные программ-осведомителей в одном представлении. Это важно, если вам нужно быстро определить основную причину в коде, зависимостях или среде хостинга, прежде чем она повлияет на конечных пользователей.

Аналитика приложений CloudWatch помогает отслеживать приложения, использующие инстансы Amazon EC2, а также другие ресурсы приложений. Этот сервис выявляет и задает основные метрики и журналы для всех ваших ресурсов приложений и наборов технологий (например, в базе данных Microsoft SQL Server, веб-серверах (IIS) и серверах приложений, операционной системе, балансировщиках нагрузки и очередях). Он проводит постоянный мониторинг метрик и журналов для выявления и корреляции аномалий и ошибок. При обнаружении ошибок и аномалий Аналитика приложений генерирует события CloudWatch, которые можно использовать для настройки уведомлений или принятия мер. Сервис помогает эффективно диагностировать неполадки за счет автоматизированных панелей управления для обнаруженных проблем со связанными метрическими аномалиями и ошибками в журналах, а также с дополнительной аналитической информацией об их вероятной основной причине.

Функция отслеживания состояния приложений Amazon CloudWatch дополняет Amazon CloudWatch стандартизированными метриками приложений и ориентированными на приложения представлениями наблюдаемости в Консоли управления AWS для CloudWatch. Вы можете начать работу без написания пользовательских инструментов. В новых представлениях содержится сводная информация о состоянии приложений, позволяющая определить влияние на бизнес и определить приоритеты, а затем подробно проанализировать основные причины.
Подключив отслеживание состояния приложений с полным контролем интервалов транзакций приложений, вы получаете доступ к новым мощным инструментам поиска и аналитики независимо от масштаба. Это комплексное решение выходит за рамки выборочной проверки и позволяет быстро установить связь между воздействием транзакций на бизнес и производительностью приложений. Благодаря готовым функциям аналитики и визуализации CloudWatch мгновенно анализирует общее состояние и производительность транзакций, выполняемых приложениями. Эта функция позволяет эффективно и без труда отслеживать и оптимизировать приложения, а также устранять неполадки.

Отслеживания X-Ray

Отслеживания X-Ray помогают разработчикам анализировать и исправлять ошибки в производственных распределенных приложениях, обеспечивая комплексное представление о запросах в процессе их прохождения через приложение.

X-Ray помогает выполнять следующие задачи.

  1. Создание карты сервисов: X-Ray отслеживает запросы для составления карты используемых сервисов, на которой показаны подключения, деревья зависимостей и проблемы в разных зонах или регионах доступности.

  2. Выявление ошибок и дефектов: X-Ray анализирует коды ответов, чтобы автоматически выявлять ошибки. Это позволяет с легкостью выполнять отладку без воспроизведения ошибок.

  3. Создание собственных приложений для анализа и визуализации: API запросов X-Ray позволяют создавать приложения, эффективно использующие данные, регистрируемые этим сервисом.

Набор точек данных, имеющих тот же идентификатор отслеживания, что и запрос, передается через сервисы приложений.

  • Сегмент: данные, в которые инкапсулирован один компонент распределенного приложения, в том числе данные, задаваемые системой и пользователем.

  • Аннотация: заданные системой или пользователем метаданные, связанные с сегментом.

  • Ошибки: системные аннотации к сегментам для вызовов, которые приводят к возникновению ошибок, включая сообщения, отслеживания стека и сведения об источнике.

  • Выборочная проверка: в целях повышения производительности и экономичности X-Ray собирает данные по статистически значимому количеству запросов, а не по каждому из них.

  • Демон X-Ray: сервис, который собирает результаты отслеживаний и отправляет их в X-Ray. Это позволяет упростить процесс работы по сравнению с непосредственным использованием API.

Чтобы начать работу с X-Ray, подключите языковой пакет SDK X-Ray к приложению и установите демон X-Ray. Подробнее см. в руководстве пользователя X-Ray.

X-Ray можно использовать для отслеживания и отладки синхронных запросов и асинхронных событий в распределенных приложениях любого размера. Например, с помощью X-Ray можно отслеживать сетевые запросы к интернет-приложению или асинхронные события, использующие очереди Amazon SQS.

X-Ray можно использовать с приложениями, работающими на EC2, ECS, в Lambda, Amazon SQS, Amazon SNS и Elastic Beanstalk. Кроме того, SDK X-Ray автоматически отслеживает метаданные API-запросов к сервисам AWS, выполненных с помощью SDK AWS. В SDK X-Ray входят дополнения для драйверов MySQL и PostgreSQL.

При использовании Elastic Beanstalk следует включить в код приложения соответствующие языковые библиотеки X-Ray. Для приложений, работающих в других сервисах AWS, таких как EC2 и ECS, необходимо установить демон X-Ray и обработать код приложения.

Да, у сервиса X-Ray есть набор API для обработки данных о запросах, сбора маршрутов и настройки сервиса. С помощью API X-Ray можно дополнительно разработать собственные приложения для анализа и визуализации.

Да. X-Ray регистрирует все вызовы API как события управления. Сервис также регистрирует вызовы трассировок как события данных, в том числе в PutTraceSegments и GetTimeSeriesServiceStatistics и других API. По умолчанию данные о событиях не регистрируются. Чтобы их зарегистрировать, необходимо настроить отслеживание событий CloudTrail или хранилище данных о событиях для их сбора.

Мониторинг контейнеров

Аналитика контейнеров CloudWatch собирает, агрегирует и обобщает метрики и журналы ваших контейнерных приложений и микросервисов, работающих в Amazon ECS, Amazon EKS, на платформах Kubernetes в Amazon EC2 и AWS Fargate (для Amazon ECS и Amazon EKS). Аналитика контейнеров собирает метрики контейнеров (процессора, памяти, диска и сети) и сетевые метрики по умолчанию. Сервис предоставляет более подробную диагностическую информацию (например, о сбоях при перезапуске контейнера), чтобы помочь выявить проблемы и быстро их устранить. Аналитика контейнеров обеспечивает наблюдение за ними на автоматических информационных панелях, что позволяет легко отслеживать состояние и производительность приложений. Также в метриках Аналитики контейнеров можно настроить оповещения CloudWatch, чтобы получать уведомления об аномалиях до того, как это повлияет на производительность приложения.

Аналитика контейнеров с улучшенной наблюдаемостью теперь доступна для Эластичного сервиса Amazon Kubernetes (Amazon EKS) на EC2, Amazon Elastic Container Service (Amazon ECS) на EC2 и ECS на Fargate. Улучшенная наблюдаемость предоставляет подробные метрики, такие как показатели производительности ECS и EKS на уровне контейнера, метрики состояния EKS Kube и метрики плоскости управления EKS, позволяя визуально детализировать различные уровни контейнеров и легко выявлять такие проблемы, как потеря доступа к памяти в отдельных контейнерах. Также данный сервис показывает список уровней контейнеров, потребляющих большое количество ресурсов, что позволяет выявлять риски в своей среде, даже если вы еще не настроили предупреждения, а также принимать упреждающие меры до того, как это повлияет на работу конечного пользователя. Аналитика контейнеров с улучшенной наблюдаемостью имеет простой интерфейс, позволяющий автоматически настраивать кластеры с помощью дополнения CloudWatch Observability для EKS или с переключением на ECS, чтобы сразу приступить к обработке данных телеметрии.

Аналитика контейнеров с улучшенной наблюдаемостью позволяет визуально детализировать различные уровни контейнеров Amazon EKS и Amazon ECS и легко выявлять такие проблемы, как утечки в памяти в отдельных контейнерах, сокращая среднее время устранения. Контроль на уровне контейнера — это готовая функция при подключении улучшенной наблюдаемости. Чтобы включить улучшенную наблюдаемость, выполните шаги, описанные в документации по Аналитике контейнеров Amazon CloudWatch.

Да. Используя Аналитику контейнеров с улучшенной наблюдаемостью для эластичного сервиса Amazon Kubernetes (EKS), вы можете отслеживать состояние плоскости управления. Ее можно использовать, например, для анализа состояния автомасштабирования и планирования жизненных циклов тестового кластера с помощью функций автоматического тестирования.

Аналитика контейнеров с улучшенной наблюдаемостью — это дополнительная функция, которая предоставляет готовые подробные метрики работоспособности и производительности, включая метрики производительности ECS и EKS на уровне контейнера, метрики состояния EKS Kube и метрики плоскости управления EKS для оперативного выявления проблем и устранения неполадок.  Аналитика контейнеров без улучшенной наблюдаемости предоставляет агрегированные метрики на уровне кластера и сервиса.

Да. Вы можете выбирать, использовать или не использовать Аналитику контейнеров с улучшенной наблюдаемостью, для каждого кластера отдельно. Для EKS вы можете включить улучшенную наблюдаемость для кластеров, установив дополнение CloudWatch Observability в кластерах после их создания. Для этого перейдите на вкладку «Дополнения» в окне информации о кластере. Что касается ECS, вы можете установить переключатель «Улучшенная» на вкладке «Мониторинг» в процессе создания кластера или обновить существующие кластеры, чтобы сделать то же самое, для подключения Аналитики контейнеров с улучшенной наблюдаемостью. Кроме того, в ECS можно включить улучшенную наблюдаемость на уровне аккаунта. Это позволит любым новым кластерам под этим аккаунтом сразу же использовать Аналитику контейнеров с улучшенной наблюдаемостью. Дополнительные сведения см. в документации по Аналитике контейнеров CloudWatch.

Вы можете начать собирать подробные метрики производительности, журналы и метаданные из контейнеров и кластеров, установив дополнение CloudWatch Observability в свои кластеры EKS или выбрав ECS на уровне кластера или учетной записи. Чтобы начать использовать Аналитику контейнеров Amazon CloudWatch, выполните шаги, описанные в документации.

Аналитика контейнеров с улучшенной наблюдаемостью поддерживает Amazon EKS на EC2, Amazon ECS на EC2 и AWS Fargate.

Более подробная информация о ценах на сервис Аналитика контейнеров доступна на странице цен CloudWatch.

Нет. В настоящее время используются такие типы метрик, как «Датчик» и «Счетчик». Со следующего выпуска планируется поддержка метрик «Гистограмма» и «Сводка».

Prometheus — это популярный проект мониторинга с открытым исходным кодом, действующий под эгидой Cloud Native Compute Foundation (CNCF). Сообщество разработчиков открытого исходного кода создало более 150 плагинов и определило платформу, которую команды DevOps могут использовать для передачи пользовательских метрик, собранных при извлечении из приложений. С помощью этой новой функции команды DevOps могут автоматически находить сервисы для рабочих нагрузок в контейнерах, такие как AWS App Mesh, NGINX и Java/JMX. Затем они могут передавать пользовательские метрики в эти сервисы и использовать их в CloudWatch. Сбор и агрегации метрик Prometheus CloudWatch позволяют пользователям быстрее выполнять мониторинг, устранять проблемы и оповещать о снижении производительности и сбоях приложений, задействовав при этом меньшее количество инструментов мониторинга.

Метрики Prometheus автоматически рассматриваются как пользовательские метрики CloudWatch. Для метрической точки данных с автоматическим сворачиванием срок хранения составляет 15 месяцев (доступны с интервалом менее 60 секунд в течение 3 часов, в одну минуту – в течение 15 дней, в 5 минут – в течение 63 дней, в один час – в течение 15 месяцев). Дополнительные сведения о сроках хранения метрик CloudWatch см. в документации.

Да. У каждого кластера Kubernetes (k8s) есть группа журналов для событий (например, /aws/containerinsights//prometheus) с отдельно настраиваемым сроком хранения. Дополнительные сведения о сроках хранения групп журналов см. в документации.

Нет. Все метрики рассматриваются как события CloudWatch Logs и могут запрашиваться с использованием CloudWatch Logs Insights. Дополнительные сведения о синтаксисе языка поиска в Журналах CloudWatch см. в документации.

Плата начисляется за такие потребленные ресурсы: (1) журналы CloudWatch Logs переданные в Gigabyte (ГБ), (2) сохраненные журналы CloudWatch, а также (3) пользовательские метрики CloudWatch. Чтобы получить подробную информацию о ценах в вашем регионе AWS, см. страницу цен на CloudWatch.

Аналитика баз данных

Аналитика баз данных CloudWatch — это решение для наблюдения за базами данных, обеспечивающее удобную среду работы для инженеров DevOps, разработчиков приложений и администраторов баз данных (DBA) для ускорения устранения неполадок в базах данных и получения целостного представления о состоянии парка баз данных. Этот сервис доступен для Amazon Aurora, MySQL и PostgreSQL.

Аналитика журналов Amazon CloudWatch объединяет журналы и метрики приложений, баз данных и операционных систем, в которых они работают, в едином представлении в консоли. Готовые панели управления, рекомендуемые оповещения и автоматический сбор данных телеметрии дают инженерам DevOps и администраторам баз данных возможность отслеживать состояние парка баз данных и использовать пошаговые инструкции по устранению неполадок для углубленного анализа исходных причин на уровне конкретных инстансов. Разработчики приложений могут сопоставлять влияние зависимостей баз данных с производительностью и доступностью ответственных бизнес-приложений. Это обеспечивается переходом от контекста обзора производительности приложений в решении для отслеживания состояния приложений CloudWatch на уровень конкретной зависимой базы данных в Аналитике баз данных.

Вы можете начать работу с Аналитикой баз данных в CloudWatch, включив ее в кластерах Aurora. Аналитика баз данных обеспечивает общее представление о состоянии и производительности парка баз данных на главной странице, где можно перейти к панелям управления на уровне инстансов для подробного анализа баз данных и SQL-запросов.

Аналитика баз данных доступна во всех общедоступных регионах AWS. К Аналитике баз данных применяется новая схема ценообразования на основе виртуальных процессоров — подробности см. на странице цен. Дополнительные сведения см. в документации по Аналитике баз данных.

  • Аналитики производительности RDS — это стандартный компонент для настройки и мониторинга производительности баз данных, который позволяет клиентам оценивать нагрузку на свои базы данных по одному инстансу за раз с помощью встроенной панели управления.
  • Аналитика баз данных, включающая все возможности Аналитики производительности, представляет собой усовершенствованную комплексную функцию наблюдения за базами данных, предназначенную для инженеров DevOps и администраторов баз данных (DBA) и служащую для устранения неполадок в базах данных и вспомогательных приложениях в нужных масштабах. Она обеспечивает представления на уровне парка, интеграцию с функцией мониторинга производительности приложений (APM) через Отслеживание состояния приложений, корреляцию метрик базы данных с журналами и событиями и визуализацию статистики SQL-запросов.

Интернет-мониторинг

Интернет-монитор Amazon CloudWatch поможет вам постоянно контролировать доступность интернета и показатели производительности между вашими приложениями, размещенными на AWS, и конечными пользователями приложений. С помощью Интернет-монитора можно быстро увидеть последствия проблем, определить затронутые местонахождения и провайдеров, а также принять меры для улучшения работы конечных пользователей в сети. Вы можете увидеть глобальный обзор моделей трафика и событий, связанных с работоспособностью, а также детализировать информацию о событиях с различной географической детализацией. Если проблема вызвана сетью AWS, на панель работоспособности AWS придет уведомление, в котором будут указаны шаги, предпринимаемые AWS для устранения проблемы. Интернет-монитор также предоставляет сведения и рекомендации, которые могут помочь вам улучшить качество обслуживания пользователей с помощью других сервисов AWS.

Чтобы использовать Интернет-монитор, вы создаете монитор и связываете с ним ресурсы вашего приложения, виртуальные частные облака Amazon (VPC), дистрибутивы CloudFront или каталоги WorkSpaces, чтобы Интернет-монитор мог знать, где проходит интернет-трафик вашего приложения. Интернет монитор предоставляет измерения Интернета от AWS, которые относятся к конкретным местам и сетям, взаимодействующим с вашим приложением.

Затем вы можете использовать панель CloudWatch, чтобы узнать о событиях работоспособности, просмотреть показатели производительности и доступности, изучить исторические данные вашего приложения с различной географической детализацией и получить представление о том, как настроить ваше приложение для повышения производительности ваших конечных пользователей.

Интернет-монитор публикует измерения интернета в журналы и метрики CloudWatch, поэтому вы можете легко использовать инструменты CloudWatch для лучшего понимания состояния приложений в географических регионах и сетях, характерных для вашего приложения. Интернет-монитор также отправляет сведения о связанных с работоспособностью событиях на Amazon EventBridge, поэтому вы можете настроить оповещения.

При изучении Интернет-монитора целесообразно ознакомиться с компонентами и концепциями, указанными в сервисе. Интернет-монитор использует следующие данные или ссылается на них: монитор, журналы CloudWatch, метрики CloudWatch, городские сети, события работоспособности, номера автономных систем (ASN), контролируемый ресурс, интернет-измерения, время в пути, переданные байты, а также показатели производительности и доступности.

Подробнее об этих компонентах см. в документации.

Ценообразование интернет-монитора состоит из следующих компонентов: плата за каждый контролируемый ресурс, плата за городскую сеть и плата за диагностические журналы, публикуемые в журналах CloudWatch. Подробнее см. на странице цен на Интернет-монитор Amazon CloudWatch.

Поддержка Интернет-монитора в регионе зависит от типа ресурсов, которые вы добавляете к своему монитору. Для дистрибутивов Amazon CloudFront и каталогов Amazon WorkSpaces Интернет-монитор доступен во всех поддерживаемых регионах. Виртуальные частные облака (VPC) Amazon из регионов без автоматического выбора можно добавлять только к монитору, созданному в том же регионе. Полный список поддерживаемых регионов AWS см. на странице адресов Интернет-монитора Amazon CloudWatch.

Мониторинг Lambda

CloudWatch Lambda Insights — предоставляет возможности мониторинга, устранения неполадок и оптимизации производительности и расходов для функций Lambda. Lambda Insights упрощает изоляцию и анализ проблем производительности, влияющих на среду Lambda. Специалисты по DevOps и информационным системам получают автоматизированные панели управления на консоли CloudWatch, которые предоставляют им полную операционную видимость благодаря метрикам, журналам и трассировкам с полными данными о производительности и состоянии используемых функций AWS Lambda.

Сбор подробных метрик производительности, журналов и метаданных из функций Lambda можно быстро начать, выполнив шаги из документации по Аналитике CloudWatch Lambda.

CloudWatch Lambda Insights автоматически собирает пользовательские метрики из событий производительности, которые поступают от функций Lambda в формате журналов CloudWatch Logs. Подробные сведения о стоимости сервиса доступны на странице цен на CloudWatch.

состояния сети;

Сетевой монитор обеспечивает визуализацию работы и прозрачность сети, соединяющей приложения, размещенные на AWS, с локальными адресами. Сетевой монитор позволяет быстро визуализировать потерю пакетов и задержку гибридных сетевых подключений, устанавливать предупреждения и пороговые значения, а затем принимать меры по улучшению работы сети конечных пользователей. Если ваши гибридные сетевые подключения осуществляются через AWS Direct Connect, сетевой монитор позволяет определить источник любого снижения производительности сети в течение нескольких минут.

Сетевой монитор предоставляет данные о задержках и потерях пакетов в оба конца для каждого зонда, настроенного в мониторе. Кроме того, для гибридных сетевых подключений через AWS Direct Connect сетевой монитор предоставляет метрику индикатора работоспособности сети AWS. Эти метрики агрегируются по подсети VPC и конечной адресу назначения и публикуются в Amazon CloudWatch. После этого можно получить доступ к панелям управления CloudWatch из консоли сетевого монитора, чтобы просмотреть эти метрики, настроить оповещения и посмотреть статус работоспособности сети AWS, чтобы узнать, повлияли ли проблемы с сетью на показатели работы. Вы также можете оценивать потери пакетов и задержку, анализируя 30-дневную историю сохраненных метрик или настраивая предупреждения для уведомления о сетевых событиях.

В стоимость сетевого монитора входят следующие компоненты: плата за отслеживаемый ресурс и плата за метрики, опубликованные в CloudWatch. Дополнительные сведения см. в ценах на Amazon CloudWatch, перейдите на вкладку «Сетевой монитор».

Чтобы использовать сетевой монитор, вы создаете монитор и связываете с ним ресурсы приложения. Вы выбираете исходные подсети, принадлежащие вашему виртуальному частному облаку Amazon (VPC), а затем выбираете целевые IP-адреса в локальной сети. Сетевой монитор создает сетку возможных комбинаций источника и места назначения, каждая из которых называется зондом, на одном мониторе. AWS полностью управляет созданием сетевого монитора, и вы сможете просматривать метрики в реальном времени уже через несколько минут после настройки мониторов. Сетевой монитор передает эти метрики в реальном времени в метрики CloudWatch, поэтому вы можете легко использовать инструменты CloudWatch для лучшего оценки состояния сети в регионах AWS, специфичных для вашей сети. Подробные инструкции по настройке см. в документации CloudWatch.

Digital Experience Monitoring

Amazon CloudWatch DEM позволяет отслеживать, как конечные пользователи работают с вашими приложениями (с точки зрения производительности, доступности и удобства). 

Замечайте временные проблемы, получайте оповещения об отсутствии трафика и отслеживайте адреса и пользовательские интерфейсы приложений с помощью программ-осведомителей CloudWatch Synthetic. Дополните мониторинг Synthetic сервисом CloudWatch RUM, чтобы лучше понять влияние на конечного пользователя и цифровое взаимодействие. Примените CloudWatch Evidently, чтобы улучшить цифровое взаимодействие с пользователем путем экспериментов и проверок нового дизайна и новых возможностей. 

Amazon CloudWatch RUM представляет собой сервис для мониторинга реальных пользователей, который позволяет отслеживать производительность клиентской части приложения и снизить показатель MTTR (среднее время на устранение проблем). CloudWatch RUM позволяет собирать данные о производительности интернет-приложений на стороне клиента в реальном времени, чтобы выявлять и диагностировать проблемы. В сочетании с данными CloudWatch Synthetics он предоставляет еще больше информации о цифровом взаимодействии с пользователем. Вы можете визуализировать аномальные показатели производительности и применять отладочные данные (сообщения об ошибках, трассировки стеков, сеансы пользователей и так далее) для устранения проблем с производительностью (вызванных ошибками JavaScript, сбоями или задержками). Вы можете лучше разобраться в разных аспектах влияния на пользователя, таких как количество подключенных сеансов, географическое расположение и используемые браузеры. CloudWatch RUM агрегирует данные о пути пользователя в вашем приложении, которые помогут вам определить приоритеты при выпуске новых возможностей и исправлении ошибок.

Создайте в CloudWatch RUM монитор приложения и добавьте простой веб-клиент в заголовок страницы HTML вашего приложения. Теперь на панелях управления CloudWatch RUM вы начнете получать данные о пользователях: географические расположения, используемые устройства, платформы и браузеры. 

Amazon CloudWatch Evidently позволяет вам проводить эксперименты и выявлять непреднамеренные воздействия новых возможностей, прежде чем развертывать их для открытого использования. Это позволяет снизить риски, связанные с выпуском новых возможностей. Evidently позволяет оценить влияние обновлений на весь стек приложения еще до выпуска, чтобы этот процесс стал более надежным. При выпуске обновлений вы сможете применить их к ограниченному подмножеству пользователей и отслеживать для них ключевые метрики, например время загрузки страниц или показатели конверсии, а затем постепенно увеличивать трафик для обновленной версии. Также Evidently позволяет разработчикам экспериментировать с дизайном, собирать данные о пользователях и выбирать наиболее эффективные решения. Он помогает оценивать результаты эксперимента и принимать решения по ним, не требуя глубокого понимания методов статистической обработки. Предоставленные подсистемой статистической обработки Evidently результаты (например, p-значения или интервалы достоверности) можно применить для принятия решений прямо в ходе эксперимента.

С помощью фрагмента кода JavaScript для CloudWatch RUM вы можете собирать сведения о пути пользователя и метриках производительности на стороне клиента. При желании можно даже добавить собственные метрики, например параметры конверсии, с помощью API Evidently. Затем тестируемые возможности инструментируются с применением пакета SDK для CloudWatch Evidently, который позволяет контролировать степень предоставления новых возможностей пользователям. Теперь вы можете выполнять запуски и эксперименты с помощью консоли AWS или интерфейса командной строки. 

Сервис Amazon CloudWatch Synthetics упрощает мониторинг конечных точек приложений. Он круглосуточно каждую минуту выполняет тесты для ваших конечных точек и предупреждает вас, когда конечные точки приложений ведут себя не так, как ожидается. Эти тесты можно настроить для проверки доступности, задержек, транзакций, испорченных или неработоспособных ссылок, пошагового выполнения задач, ошибок загрузки страниц, задержек нагрузки для активов пользовательских интерфейсов, потоков сложных мастеров или потоков проверки в ваших приложениях. Вы также можете использовать сервис CloudWatch Synthetics, чтобы выявлять конечные точки приложений, для которых получены аварийные сигналы, и сопоставлять их с проблемами базовой инфраструктуры, что позволяет уменьшить среднее время устранения неисправностей.

Начать работу с сервисом CloudWatch Synthetics просто. Вы за считанные минуты можете написать собственную программу-осведомитель. Дополнительные сведения см. в документации по сервису Amazon CloudWatch Synthetics.

Эти два сервиса можно использовать отдельно, но вместе они эффективнее.

AppConfig является возможностью AWS Systems Manager, с помощью которой вы сможете создавать, администрировать и развертывать флаги возможностей и другие конфигурации приложений. При разработке новых возможностей с помощью AppConfig можно предоставить новую возможность в рабочей версии, скрыв ее за флагом-переключателем. Когда вы будете готовы предоставить эту возможность в открытый доступ, останется лишь сразу или постепенно убрать этот флаг из конфигурации.

Для более детального управления возможностями и экспериментов можно применить сервис Evidently, который недавно добавлен на платформу Amazon CloudWatch. Evidently позволяет выполнять эксперименты с разными версиями новой возможности и сравнить их производительность с базовым уровнем, или выпускать новые версии возможности по заранее заданному графику, отслеживая такие бизнес-метрики, как длительность визита и доходность. Evidently поддерживает интеграцию с CloudWatch RUM, который выполняет мониторинг производительности приложения на стороне клиента, что позволяет применять метрики RUM напрямую в Evidently.

Аналитика метрик

Аналитика метрик CloudWatch — это высокопроизводительная подсистема обработки запросов, которая помогает вам распределять и суммировать операционные метрики в режиме реального времени, агрегируя их с помощью стандартных запросов SQL во время выполнения. Metrics Insights помогает понять состояние работоспособности и производительности вашего приложения, позволяя проанализировать метрики в любом масштабе. Поддерживается интеграция с Панелями управления CloudWatch, что позволяет сохранить созданные запросы на панелях управления для контроля работоспособности и производительности, чтобы быстро выявлять любые проблемы.

Прежде всего щелкните вкладку метрик на консоли CloudWatch, чтобы открыть встроенную подсистему запросов Metrics Insights на вкладке «Запрос», которую можно использовать совершенно бесплатно. Metrics Insights поддерживает стандартный язык SQL, но вы можете применить для работы с Metrics Insights и визуальный конструктор запросов. Чтобы использовать конструктор запросов, просто выберите нужные метрики, пространства имен и измерения на экране визуальной разработки, и консоль автоматически составит подходящий запрос SQL с учетом выбранных элементов. Также в редакторе запросов можно в любой момент ввести или изменить текстовый запрос SQL, чтобы получить больше детализации для анализа проблем. Metrics Insights также содержит набор готовых запросов, которые помогут вам быстро приступить к мониторингу или изучению производительности приложений. Также доступ к Metrics Insights можно осуществлять программным способом через CloudFormation, пакет SDK или интерфейс командной строки AWS.

Мониторинг ресурсов AWS и пользовательских метрик

Amazon CloudWatch позволяет осуществлять мониторинг облачных ресурсов AWS и приложений, работающих на AWS. Сервис автоматически предоставляет метрики для различных продуктов и сервисов AWS, в том числе для инстансов Amazon EC2, томов EBS, балансировщиков нагрузки Elastic Load Balancer, групп Auto Scaling, схем обработки заданий EMR, инстансов БД RDS, таблиц DynamoDB, кластеров ElastiCache, кластеров RedShift, стеков OpsWorks, проверок работоспособности Route 53, тем SNS, очередей SQS, рабочих процессов SWF и шлюзов Storage Gateway. Кроме того, сервис позволяет осуществлять мониторинг метрик, сформированных приложениями и сервисами пользователя.

Вы можете публиковать и сохранять метрики с частотой до одной секунды. 1 ноября 2016 года был введен расширенный срок хранения метрик. Эта возможность позволяет увеличить срок хранения любых метрик с 14 дней до 15 месяцев. Сервис CloudWatch хранит данные метрик следующим образом.

Точки данных с интервалом менее 60 секунд доступны в течение 3 часов. Эти точки данных относятся к высокочастотным пользовательским метрикам.

Точки данных с интервалом 60 секунд (1 минута) доступны в течение 15 дней.

Точки данных с интервалом 300 секунд (5 минут) доступны в течение 63 дней. 

Точки данных с интервалом 3600 секунд (1 час) доступны в течение 455 дней (15 месяцев).

Точки данных, которые изначально были опубликованы с более коротким интервалом, обобщаются для длительного хранения. Например, если данные фиксируются с интервалом в 1 минуту, они будут храниться с исходным интервалом в течение 15 дней. Через 15 дней они по‑прежнему будут доступны, но в обобщенном виде с интервалом в 5 минут. Через 63 дня данные пройдут дальнейшее обобщение и будут доступны с интервалом в 1 час. Если требуется обеспечить доступность метрик в течение более продолжительного времени, можно использовать API GetMetricStatistics для извлечения точек данных и сохранения их офлайн либо в других типах хранилищ.

В настоящее время данная возможность доступна в следующих регионах AWS: Восток США (Сев. Вирджиния), Запад США (Орегон), Запад США (Сев. Калифорния), ЕС (Ирландия), ЕС (Франкфурт), Южная Америка (Сан-Паулу), Азия и Тихий океан (Сингапур), Азия и Тихий океан (Токио), Азия и Тихий океан (Сеул), Азия и Тихий океан (Мумбаи), Азия и Тихий океан (Сидней), ЕС (Лондон), Канада (Центр), Восток США (Огайо) и Китай (Пекин).

Минимальный интервал для точек данных, поддерживаемый сервисом CloudWatch, составляет одну секунду. Такие метрики считаются высокочастотными. Можно также сохранять метрики с интервалом в одну минуту. Иногда данные метрик поступают в CloudWatch через разные интервалы времени, например через три или пять минут. Если метрика не помечена как высокочастотная (для этого необходимо передать соответствующее значение в поле StorageResolution запроса API PutMetricData), по умолчанию CloudWatch будет собирать и сохранять метрики с интервалом в одну минуту.

В зависимости от периода хранения запрашиваемых данных метрика будет доступна с интервалом, указанным в вышеописанных схемах хранения. Например, если запросить ежеминутные данные за сутки, истекшие 10 дней тому назад, на выходе будет получено 1440 точек данных. Однако если запросить ежеминутные данные за пять последних месяцев, степень их детализации уже будет автоматически изменена на ежечасную, и API GetMetricStatistics не выдаст никакого ответа.

CloudWatch не поддерживает удаление метрик. Срок действия метрик истекает на основании вышеописанных схем хранения.

Да, Amazon CloudWatch поддерживает запросы к данным из нескольких источников, что позволяет отслеживать метрики в AWS, локальной среде и других облаках. Теперь вы можете диагностировать критические события за считаные минуты, а не часы, отслеживать состояние приложений и быстрее получать аналитические данные для бесперебойной работы. Получайте централизованный доступ ко всем запросам, возможностям визуализации и предупреждениям для всех инструментов мониторинга.

Нет. Данные метрик можно всегда извлечь для любого инстанса Amazon EC2 на основании вышеописанных схем хранения. При этом консоль CloudWatch не выводит в результатах поиска метрики, давность последнего импорта которых превышает две недели, чтобы в пространстве имен отображались наиболее актуальные инстансы.

Да. Amazon CloudWatch сохраняет метрики прекративших работу инстансов Amazon EC2 и удаленных эластичных балансировщиков нагрузки в течение 15 месяцев.

Для начала перейдите в конструктор запросов метрик в консоли Amazon CloudWatch и откройте список источников данных. В списке можно запустить мастер добавления нового источника данных для запроса и включения предупреждений. Вы выбираете источник данных, который хотите запрашивать, и указываете данные доступа, такие как URL-адрес или путь и мандат. Подробнее см. в документации.

На одном и том же отрезке времени точки данных на графике могут отображаться в разных местах в зависимости от того, какой период времени выбран – 5 минут или 1 минута. Для периода времени, выбранного на графике, Amazon CloudWatch находит все доступные точки данных и вычисляет единую, совокупную точку, представляющую период в целом. В случае периода продолжительностью 5 минут единая точка данных располагается в начале каждого пятиминутного отрезка. В случае периода продолжительностью 1 минуту одна точка данных располагается на минутной отметке. Мы рекомендуем использовать период времени продолжительностью одну минуту для устранения неисправностей и выполнения других действий, требующих максимально точного графического представления периодов времени.

Amazon CloudWatch можно использовать для мониторинга данных, сформированных приложениями, скриптами и сервисами пользователя. Пользовательская метрика – это любая метрика, загруженная пользователем в Amazon CloudWatch. Например, пользовательские метрики можно использовать для мониторинга времени загрузки веб‑страницы, количества ошибок при выполнении запросов, количества процессов или потоков на инстансе или объемов работ, выполненных приложением. Чтобы начать работу со специальными метриками, воспользуйтесь API PutMetricData, образцами скриптов мониторинга для Windows и Linux, подключаемым модулем CloudWatch collectd или одним из множества приложений и инструментов, предлагаемых партнерами AWS.

Для пользовательских метрик можно использовать следующие варианты частоты.

Стандартная частота – данные сохраняются с интервалом в одну минуту.

Высокая частота – данные сохраняются с интервалом в одну секунду.

По умолчанию метрики в CloudWatch сохраняются с интервалом в одну минуту. Чтобы указать, что метрика является высокочастотной, в запросе API PutMetricData необходимо задать значение параметра StorageResolution, равное одному. Если не указать этот необязательный параметр, сервис будет использовать интервал по умолчанию, равный одной минуте.

При публикации высокочастотных метрик CloudWatch сохраняет их с интервалом в одну секунду, а считывать и извлекать их можно за период в одну, пять секунд, 10 секунд, 30 секунд или за любой период, длина которого кратна 60 секундам.

Пользовательские метрики хранятся в соответствии с описанными выше схемами.

В настоящий момент высокочастотными могут быть только пользовательские метрики, публикуемые в CloudWatch. Высокочастотные метрики сохраняются в CloudWatch с интервалом в одну секунду. Указать, что метрика является высокочастотной, можно в запросе API PutMetricData необходимо задать значение параметра StorageResolution, равное одному. Если не указать этот необязательный параметр, CloudWatch будет использовать интервал по умолчанию, равный одной минуте.

Нет, стоимость использования высокочастотных метрик такая же, как и цена на стандартные пользовательские метрики с интервалом в одну минуту.

Мониторинг пользовательских данных можно осуществлять с помощью пользовательских метрик и (или) сервиса CloudWatch Logs. Пользовательские метрики лучше использовать, если данные предоставлены в формате, отличном от формата журнала, например для процессов операционных систем или результатов измерения производительности. Кроме того, пользователи могут написать собственные приложения и скрипты или воспользоваться решениями, предоставленными партнерами AWS. Если требуется хранить отдельные измерения в совокупности с дополнительными сведениями, можно воспользоваться сервисом CloudWatch Logs.

Для извлечения, графического отображения, а также настройки оповещений доступны такие статистические значения метрик Amazon CloudWatch: среднее значение, общее значение, минимальное значение, максимальное значение и подсчет образцов. Статистику можно рассчитать для временных интервалов, кратных одной минуте (60 секундам). Для высокочастотных пользовательских метрик можно получать статистику за периоды продолжительностью от одной секунды до трех часов.

Amazon CloudWatch Application Insights для .NET и SQL Server – это возможность, используемая для мониторинга приложений .NET и SQL Server. Этот сервис позволяет определить и настроить основные метрики и журналы во всех ваших ресурсах приложения и технологических стеках, т. е. базах данных, веб-серверах и серверах приложений, ОС, балансировщиках нагрузки, очередях и т. д. Сервис непрерывно отслеживает эти телеметрические данные для обнаружения и сопоставления аномалий и ошибок, уведомляя вас о проблемах, возникших в приложении. Чтобы устранять неполадки, сервис создает автоматизированные панели управления для визуализации обнаруженных проблем, включающие связанные метрические аномалии и журналы ошибок, а также дополнительную аналитическую информацию об их возможной исходной причине.

Автоматическое распознавание метрик и журналов приложений. Сервис сканирует ресурсы приложения и предоставляет список рекомендованных метрик и журналов для мониторинга, автоматически настраивает их, упрощая последующую настройку мониторинга приложений. 

Интеллектуальное обнаружение проблем. Сервис использует встроенные правила и алгоритмы машинного обучения для динамического мониторинга и анализа симптомов неполадки в стеке приложения и обнаруживает имеющиеся проблемы. Это помогает вам сократить нагрузку, необходимую для обработки отдельных пиков метрик, событий или исключений журналов и вместо этого получать уведомления о реальных проблемах вместе с контекстной информацией о них.

Ускоренное устранение неполадок. Сервис получает доступ к обнаруженным проблемам и предоставляет аналитические данные о них, например их возможные исходные причины, а также список метрик и журналов, которые затронула проблема. Вы можете оставить отзыв о сгенерированной информации, чтобы сфокусировать механизм обнаружения проблем на своем конкретном случае.

Подключите приложение. Укажите приложение, которое хотите отслеживать, выбрав связанную с ним группу ресурсов AWS.

Определите компоненты приложения. Сервис анализирует ресурсы приложения для идентификации его компонентов (автономные ресурсы или группы связанных ресурсов, например «Автомасштабирование» или «Балансировщик нагрузки»). Кроме того, для получения лучшей аналитики и упрощенного подключения можно настраивать компоненты, группируя ресурсы.

Выполните мониторинг. Можно указать уровень технологий для компонентов приложений, например интерфейс IIS, рабочий уровень .NET и т. д. На основе сделанного выбора сервис предоставит рекомендуемый набор метрик и журналов, которые можно настроить в зависимости от потребностей. Как только вы сохраните эти «мониторы», Application Insights для .NET и SQL Server настроит CloudWatch для сбора данных от вашего имени.

При подключении сервис Application Insights для .NET и SQL Server использует набор встроенных правил и модели машинного обучения для идентификации проблем приложения. Он создает в CloudWatch автоматизированные панели управления со списком обнаруженных проблем и обеспечивает подробное представление этих проблем, связанных с ними аномалий и ошибок.

Потоки метрик CloudWatch – это возможность, которая позволяет непрерывно передавать потоки метрик CloudWatch в выбранное местоположение при минимальной установке и настройке. Это полностью управляемое решение, которое не требует от вас написания кода и обслуживания инфраструктуры. Всего за несколько щелчков мышью вы можете настроить поток метрик в такое целевое местоположение, как Amazon Simple Storage Service (S3). Также вы можете отправлять метрики сторонним поставщикам сервисов, чтобы ваши панели управления отражали актуальную информацию.

Потоки метрик – альтернативный способ получения данных из CloudWatch без необходимости опроса API. Вы можете создать поток метрик всего за несколько щелчков мышью, и он направит ваши метрики к вам. Вы без проблем можете направить метрики в озеро данных на AWS, например на Amazon S3, и начать анализировать использование или производительность с помощью таких инструментов, как Amazon Athena. Также потоки метрик упрощают отправку метрик CloudWatch популярным сторонним поставщикам сервисов с использованием HTTP-адреса Amazon Kinesis Data Firehose. Вы можете создать непрерывный масштабируемый поток, включив в него самые актуальные метрики CloudWatch для работы панелей управления, предупреждений и других инструментов, которые зависят от точных и своевременных метрик.

Вы можете создавать потоки метрик CloudWatch и управлять ими с помощью консоли CloudWatch или программно, используя API CloudWatch, SDK AWS, интерфейс командной строки AWS или AWS CloudFormation, чтобы предоставлять и настраивать эти потоки метрик. Также можно использовать шаблоны AWS CloudFormation, предоставленные сторонними поставщиками сервисов, чтобы настроить доставку потоков метрик в целевые местоположения за пределами AWS. Дополнительные сведения см. в документации по потокам метрик CloudWatch.

Да. Можно отправлять по умолчанию все метрики или создать правила фильтрации, чтобы включать и исключать группы метрик по пространству имен, например AWS/EC2. Потоки метрик автоматически обнаруживают новые метрики, отвечающие правилам фильтрации, и включают их обновления в поток. Когда ресурсы исчерпаны, потоки метрик автоматически приостанавливают передачу обновлений неактивных метрик.

Потоки метрик могут передавать информацию в формате OpenTelemetry или JSON. Формат вывода можно выбрать во время создания потоков метрик или при управлении ими.

Да. Для этого откройте страницу консоли потоков метрик и найдите раздел мониторинга. Вы увидите автоматические панели управления с данными об объеме обновления метрик со временем. Также эти метрики можно найти в пространстве имен AWS/CloudWatch и использовать для создания предупреждений для отправки уведомлений в случае появления непредвиденных пиков объемов метрик.

Мониторинг журналов

CloudWatch Logs позволяет следить за работой систем и приложений и решать возникающие в них проблемы, используя файлы журналов соответствующих систем и приложений, а также пользовательские файлы журналов.

С помощью CloudWatch Logs можно проверять свои журналы на наличие определенных фраз, значений или шаблонов в режиме, близком к реальному времени. Например, можно настроить выдачу предупреждений о количестве ошибок, зарегистрированных в системных журналах, или отображение графиков задержки веб‑запросов, зарегистрированных в журналах приложений. Затем можно просмотреть данные исходного журнала, чтобы определить источник проблемы. Данные журналов можно хранить, сколько потребуется, используя для этого недорогое хранилище с высокой степенью надежности, чтобы не занимать место на жестком диске. При этом они остаются полностью доступны.

Предоставленные журналы Amazon CloudWatch – это журналы, которые по умолчанию публикуются сервисами AWS от имени клиента. VPC Flow Logs – первый тип предоставленного журнала, основанный на такой многоуровневой модели. При этом в будущем планируется добавить к предоставленным журналам другие типы журналов различных сервисов AWS.

Подробнее о доступности Журналов CloudWatch по регионам см. на странице Продукты и сервисы по регионам.

См. актуальные тарифы на странице цен.

CloudWatch Logs позволяет отслеживать и сохранять журналы для анализа работы систем и приложений, а также для управления ими. При использовании CloudWatch Logs с журналами мониторинг ведется на основании данных существующих журналов, поэтому код изменять не требуется. Далее приведены два примера, иллюстрирующие возможности Amazon CloudWatch.

Мониторинг приложений и систем в реальном времени. Функцию CloudWatch Logs можно использовать для мониторинга приложений и систем с помощью данных журналов в режиме, близком к режиму реального времени. Например, CloudWatch Logs может отслеживать количество ошибок в журналах приложений и отправлять оповещения, когда оно превышает заданное пороговое значение. Amazon CloudWatch использует для мониторинга данные журналов, поэтому никаких изменений в код вносить не требуется.

Долгосрочное хранение журналов. Журналы CloudWatch позволяют хранить данные журналов столько, сколько потребуется, используя для этого чрезвычайно надежное и недорогое хранилище, которое позволяет не беспокоиться о нехватке места на жестких дисках. Агент CloudWatch Logs позволяет быстро и просто переместить ротируемые и неротируемые файлы журнала с хоста в сервис журналов. Затем при необходимости можно получить доступ к необработанным данным событий журналов.

Сервис EC2Config можно настроить на отправку различных данных и файлов журналов в CloudWatch, в том числе пользовательских текстовых журналов, журналов событий (приложений, безопасности, пользовательских, системных), журналов трассировки событий (ETW) и данных счетчиков производительности (PCW). Подробнее о сервисе EC2Config см. здесь.

По умолчанию агент CloudWatch Logs отправляет данные журналов каждые пять секунд. Пользователь может задать другой промежуток времени.

CloudWatch Logs может импортировать, агрегировать и отслеживать данные журналов в любых стандартных текстовых форматах или в формате JSON.

Агент CloudWatch Logs вернет ошибку, если событие будет настроено на отправку данных журналов не в текстовом формате. Эта ошибка будет записана в журнал /var/logs/awslogs.log.

События журналов можно отслеживать по мере их отправки в CloudWatch Logs с помощью фильтров метрик. Фильтры метрик преобразуют данные журналов в метрики Amazon CloudWatch для отправки предупреждений и построения графиков. Фильтры метрик можно создать с помощью консоли или интерфейса командной строки. Фильтры метрик осуществляют поиск и подстановку ключевых слов, фраз или значений в событиях журналов. Когда фильтр метрик находит термин, фразу или значение в событиях журналов, он учитывает это в выбранной метрике Amazon CloudWatch. Например, можно создать фильтр метрики для поиска и подсчета количества слов «Error» (Ошибка) в событиях журналов. Фильтры метрик также могут извлекать значения из событий журналов с разделителями‑пробелами, например задержки веб‑запросов. Можно использовать условные операторы и шаблоны подстановки для создания точных совпадений. Консоль Amazon CloudWatch позволяет протестировать пользовательские схемы перед созданием фильтров метрик.

Шаблон фильтра метрик может содержать ключевые слова для поиска или спецификацию общего журнала или формата события JSON.

Например, если нужно найти ключевое слово «Error» (Ошибка), шаблон фильтра метрик будет состоять из одного слова – Error. Для поиска нескольких слов можно использовать несколько ключевых слов. Например, если нужно подсчитать события, в которых содержатся ключевые слова «Error» (Ошибка) и «Exception» (Исключение), используйте шаблон Error Exception. Если нужно найти точное совпадение для ключевых слов «Error Exception», поместите их в кавычки – "Error Exception". Можно задавать любое количество ключевых слов для поиска.

CloudWatch Logs также можно использовать для извлечения значений из событий журналов в общем журнальном формате или формате JSON. Например, можно отслеживать объемы информации, передаваемые из журналов доступа Apache. Можно также использовать условные операторы и шаблоны подстановки для поиска совпадений и извлечения необходимых данных. Чтобы использовать функцию извлечения фильтров метрик, события журналов должны быть разделены пробелами, а для разграничения полей должны использоваться двойные прямые кавычки «"» или открывающая квадратная скобка «[» и закрывающая квадратная скобка «]». Другой вариант – использовать события журналов в формате JSON. Дополнительные сведения о синтаксисе и примеры см. в Руководстве для разработчиков фильтров метрик.

CloudWatch Logs позволяет протестировать шаблоны фильтров метрик перед их созданием. Шаблоны можно протестировать на данных журналов, уже находящихся в CloudWatch Logs, или же загрузить собственные события журналов для тестирования. Тестирование покажет совпадения событий журналов с шаблоном фильтра метрики и извлеченное значение данных тестирования (если применимо). Тестирование фильтров метрик можно запустить из консоли или интерфейса командной строки.

Фильтры метрик Amazon CloudWatch не поддерживают регулярные выражения. Обрабатывайте данные журналов с использованием регулярных выражений с помощью Amazon Kinesis. Для этого подключите поток с механизмом обработки регулярных выражений.

Управление журналами

Данные журнала можно извлечь с помощью консоли CloudWatch Logs или интерфейса командной строки CloudWatch Logs. События журналов извлекаются на основании группы журналов, потока журналов и времени, с которыми они связаны. Для извлечения событий журнала в CloudWatch Logs используется API GetLogEvents.

Для извлечения событий журнала и выполнения поиска по ним с помощью команды grep или аналогичных поисковых функций можно использовать интерфейс командной строки.

Данные журналов в сервисе CloudWatch Logs можно хранить столько, сколько это необходимо. По умолчанию срок хранения данных журналов в CloudWatch Logs не ограничен. Срок хранения можно задавать когда угодно для любой группы журналов.

Стандарт журналов Amazon CloudWatch — это один из двух классов журналов в рамках CloudWatch. Стандарт журналов обеспечивает комплексное управление журналами для мониторинга в реальном времени и реализации расширенных аналитических возможностей, таких как Live Tail, извлечение метрик, оповещение и защита данных. Можно проверять журналы на наличие определенных фраз, значений или шаблонов в режиме, близком к реальному времени. Например, можно настроить выдачу предупреждений о количестве ошибок, зарегистрированных в системных журналах, или отображение графиков задержки веб‑запросов, зарегистрированных в журналах приложений. Затем можно просмотреть данные исходного журнала, чтобы определить источник проблемы.

Нечастый доступ к журналам Amazon CloudWatch (Logs-IA) — это один из двух классов журналов в рамках CloudWatch. Logs-IA специально создан для консолидации всех ваших журналов в AWS. Он обеспечивает управляемое получение данных, анализ журналов для разных аккаунтов и шифрование по Стандарту журналов CloudWatch, при этом цена устанавливается за гигабайт полученных данных. Такое сочетание специализированных возможностей и низкой стоимости делает CloudWatch Logs-IA идеальным решением для быстрых запросов и экспертного анализа произошедших событий. Данные журналов можно неограниченное время хранить с возможностью доступа к ним, используя для этого недорогое хранилище с высокой степенью надежности, что исключает проблему нехватки места на жестком диске.

Нечастый доступ к журналам Amazon CloudWatch (Logs-IA) доступен во всех регионах AWS, где есть Журналы CloudWatch. Начать работу можно в консоли или программно с помощью интерфейса командной строки или API AWS.

Анализ журналов

Для доступа к Logs Insights ваша политика IAM должна включать разрешения для logs:DescribeLogGroups и logs:FilterLogEvents.

Logs Insights можно использовать для запросов ко всем журналам, отправляемым в CloudWatch. Logs Insights автоматически обнаруживает поля журналов от таких сервисов AWS, как Lambda, CloudTrail, Route53 и VPC Flow Logs, а также от любого журнала приложения, генерирующего события журналов в формате JSON. Кроме того, он генерирует 3 системных поля – @message, @logStream и @timestamp – для всех типов журналов, отправляемых в CloudWatch. @message содержит необработанное и непроанализированное событие журнала, @logStream – имя источника, который сгенерировал событие журнала, а @timestamp – время добавления события журнала в CloudWatch.

С помощью Аналитики журналов CloudWatch можно интерактивно находить и анализировать данные журналов в сервисе «Журналы Amazon CloudWatch». Вы можете выполнять запросы, помогающие быстрее и эффективнее реагировать на неполадки.

Аналитика журналов CloudWatch поддерживает три языка, которые можно использовать для создания запросов:

  • Специализированный язык запросов Аналитики журналов (Logs Insights QL) с небольшим числом удобных и полезных команд. Вы можете создавать команды для получения одного или нескольких полей журналов, поиска событий журналов по одному или нескольким критериям, объединения данных журнала и извлечения эфемерных полей из текстовых журналов.
  • Язык конвейерной обработки сервисов OpenSearch (PPL). OpenSearch PPL позволяет анализировать журналы с помощью набора команд, разделенных каналами (|). Используя PPL, можно запрашивать и анализировать данные с помощью объединенных команд, что упрощает понимание и составление сложных запросов, и использовать команды для фильтрации и агрегирования данных, а также применять богатый набор математических, строковых, условных функций и функций работы с датами для анализа.
  • Язык структурированных запросов сервиса OpenSearch (SQL). С помощью SQL-запросов OpenSearch вы можете анализировать журналы декларативным образом. В OpenSearch SQL можно использовать такие команды, как SELECT, FROM, WHERE, GROUP BY, HAVING и различные другие команды и функции Spark SQL. Можно выполнять объединения (JOIN) между группами журналов, сопоставлять данные с помощью подзапросов и использовать богатый набор функций JSON, математических, строковых, условных и других функций Spark SQL для анализа журналов.

Аналитика журналов содержит справку в виде примеров запросов, описания команд и автозаполнения запросов. Это поможет быстрее приступить к работе. Дополнительные сведения о языке запросов см. здесь.

Ограничения в работе сервисов приведены здесь.

Язык запросов Аналитики журналов (Logs Insights QL) доступен во всех регионах, где доступен сервис Журналы CloudWatch. OpenSearch PPL и OpenSearch SQL доступны в регионах, где доступен сервис Прямые запросы к OpenSearch.

Можно писать запросы, содержащие совокупности, фильтры, регулярные выражения и текст. Вы можете также извлекать данные из событий журналов, чтобы создавать эфемерные поля, которые можно в дальнейшем обработать с помощью языка запроса, что поможет получить доступ к нужной информации. Язык запросов поддерживает текстовые строки, числа и математические функции, например concat, strlen, trim, log и sqrt и др. Вы можете также использовать булевы и логические выражения и агрегирующие функции, например min, max, sum, average, percentile и др. Дополнительные сведения о языке запросов и поддерживаемых функциях см. здесь.

Список команд запроса см. здесь. Список поддерживаемых функций см. здесь.

Визуализации можно использовать для определения трендов и закономерностей, возникающих в журналах с течением времени. Аналитика журналов поддерживает визуализацию данных с использованием линейных графиков, диаграмм с областями и накоплением, столбчатых и круговых диаграмм. Визуализации генерируются для всех запросов, содержащих одну или несколько функций объединения, в которых данные группируются за временной интервал или по конкретным полям. Дополнительные сведения о визуализации данных см. здесь.

Помимо визуализации результатов запроса Аналитики журналов, клиенты могут создавать готовые панели управления OpenSearch для предоставленных журналов, таких как VPC, CloudTrail и WAF. Эти панели управления основаны на индексах OpenSearch и требуют от клиентов явного согласия, поскольку в рамках этой интеграции создаются инстансы Бессерверного OpenSearch, которые необходимо оплачивать.
Панель управления журналов потоков VPC — эта панель собирает данные о сетевых потоках для виртуального частного облака. Она призвана помочь клиентам анализировать трафик, выявлять необычные закономерности и отслеживать использование ресурсов. В настоящее время поддерживаются только поля VPC v2 (формат по умолчанию). Поля с произвольным форматированием не поддерживаются. Панель управления CloudTrail — эта панель предоставляет обзор активности API в среде AWS, используя данные журналов CloudTrail. Она удобна для мониторинга активности API, аудита действий и выявления потенциальных проблем безопасности или соблюдения требований. Панель управления WAF — эта панель предоставляет информацию о веб-трафике, отслеживаемом брандмауэром веб-приложений AWS (WAF). Эта панель управления помогает выявлять закономерности трафика, заблокированные запросы и потенциальные угрозы из определенных регионов или IP-адресов. Цены на OpenSearch и сведения о бесплатной пробной версии см. в разделе цен на журналы CloudWatch.

Вместе с Logs Insights можно использовать регулярные выражения в стиле Java. Регулярные выражения можно использовать в команде фильтра. Примеры запросов с регулярными выражениями см. в справке продукта или здесь.

Чтобы изолировать специальные символы, можно использовать обратные галочки. Имена полей журналов, содержащие символы, отличные от буквенно-цифровых, «@» и «.», необходимо изолировать с помощью обратных галочек.

Системные поля, сгенерированные с помощью Logs Insights, начинаются с символа «@». В настоящее время Logs Insights генерирует 3 системных поля: @message, @logStream и @timestamp. @message содержит необработанное и непроанализированное событие журнала, отправленное в CloudWatch, @logStream – имя источника, который сгенерировал событие журнала, а @timestamp – время добавления события журнала в CloudWatch.

Logs Insights дает возможность отправлять запрос на данные журнала, добавленные в CloudWatch Logs 5 ноября 2018 года или позже.

События журнала в определенном потоке можно искать, добавив фильтр с командой @logStream = "log_stream_name" в запрос журнала.

CloudWatch Logs уже поддерживает варианты интеграции с другими сервисами AWS, в частности Amazon Kinesis, Amazon Kinesis Data Firehose, Amazon Elasticsearch и такими решениями AWS Partner ISV, как Splunk, Sumo Logic, DataDog и многие другие, предоставляя богатый выбор и гибкие возможности для всех сред. Вы сможете настраивать обработку журналов, получать дополнительную информацию, выполнять аналитику и визуализацию. Кроме того, возможности запросов CloudWatch Logs Insights доступны для программного доступа через AWS SDK, упрощая партнерам AWS ISV углубление интеграции, расширенную аналитику и повышение ценности CloudWatch Logs Insights.

Интеграция ISV Partner c CloudWatch Logs Insights дает возможность централизованно разместить данные журнала и анализировать их с помощью инструментов и платформ по собственному выбору. Такие действия будут выполняться с высокой производительностью и экономически эффективно. Перемещать большие объемы данных не придется. Кроме того, вы будете быстрее получать доступ к своим журналам, поскольку устранятся задержки, связанные с переносом данных, а также сложности настройки и поддержания определенных переносов данных.

Обнаружение аномалий в журналах

Обнаружение аномалий в журналах Amazon CloudWatch, основанное на искусственном интеллекте и машинном обучении, — это функция автоматического анализа журналов, которая позволяет создать группы связанных журналов для ускорения их анализа, сопоставляет журналы за определенный период для получения ключевой информации, отслеживает журналы и уведомляет вас о необычном поведении для оперативного решения проблем. Используя расширенные алгоритмы, CloudWatch может автоматически обнаруживать необычные закономерности и изменения в журналах приложений, предупреждая вас о потенциальных проблемах. Вам больше не нужно обновлять запросы или фильтры при каждом изменении журналов. С помощью сервиса обнаружения аномалий в журналах вы можете выявлять новые ошибки и повышение частоты сообщений в журналах до того, как они повлияют на работу, обнаруживать новые проблемы без необходимости заранее знать подробности, получать уведомления о необычной активности без необходимости настраивать параметры и постоянно отслеживать наиболее важные журналы. Заблаговременно выявляя потенциальные проблемы, сервис обнаружения аномалий в журналах CloudWatch помогает предупреждать возможные проблемы и обеспечивать надежную производительность.
 

Сервис обнаружения аномалий в журналах Amazon CloudWatch помогает автоматически обнаруживать необычное поведение в журналах приложений. Тогда как такие инструменты, как фильтры метрик, позволяют отслеживать определенные известные переменные, функция обнаружения аномалий позволяет выявлять ранее неизвестные состояния, такие как новый код ошибки в журналах или внезапное увеличение частоты определенных сообщений в журнале. Обнаружение аномалий в журналах постепенно адаптируется к журналам приложений и не требует задания сложных параметров конфигурации, таких как синтаксис запросов или фильтров. Обнаружение аномалий в журналах обеспечивает дополнительную степень надежности для наиболее важных групп журналов приложений.

Для работы сервиса обнаружения аномалий в журналах Amazon CloudWatch не требуется конкретный формат журналов. Этот сервис использует возможности машинного обучения для гибкого анализа журналов. Обнаружение аномалий в журналах CloudWatch лучше всего подходит для журналов приложений, например созданных на основе кода приложения, запущенного в EC2, EKS, ECS, Lambda и других ресурсах для выполнения кода приложений.

Amazon DevOps Guru включает функцию обнаружения аномалий, специально разработанную для конкретных источников приложений, таких как Lambda. Обнаружение аномалий в журналах Amazon CloudWatch — это решение, которое работает с любыми журналами любых приложений. Обнаружение аномалий в журналах CloudWatch доступно в консоли CloudWatch.

Logs Live Tail

Amazon CloudWatch Logs Live Tail – это новая интерактивная аналитическая функция, которая позволяет просматривать входящие журналы в реальном времени. С помощью Live Tail можно быстро устранять неполадки: разработчики могут использовать потоковый просмотр своих журналов для отладки кода, а ИТ-инженеры – отслеживать статус развертываний. Live Tail обеспечивает интерактивный просмотр журналов в контексте связанных событий в режиме реального времени, что помогает сократить среднее время обнаружения и, в свою очередь, среднее время устранения неполадок.

Используйте интерактивную функцию CloudWatch Live Tail для оперативного обнаружения проблем приложений или развертывания в собственных инструментах AWS Observability. Live Tail позволяет командам DevOps получить полное представление о журналах критически важных приложений и отладке кода из среды разработки без необходимости переключаться между несколькими инструментами. Используя Live Tail для мониторинга состояния и работоспособности развертываний, ИТ-инженеры, операционная поддержка и центральные команды безопасности могут эффективно контролировать свои сервисы и приложения для ускорения анализа первопричин, а также сокращения среднего времени устранения неполадок.

Помимо предоставления возможностей Live Tail для журналов пользовательских приложений, эта функция также помогает клиентам получить глубокое понимание журналов сервисов AWS, например Виртуального частного облака Amazon (Amazon VPC), Amazon Route53, AWS Lambda, Эластичного сервиса Amazon Kubernetes (Amazon EKS), Эластичного контейнерного сервиса Amazon (Amazon ECS) и других. Используя виджет Live Tail, сервисы AWS могут внедрять в свои консоли такие же интерактивные возможности использования. Кроме того, прямую интеграцию могут реализовывать и другие сервисы (например, Управляемая Amazon Grafana, AWS Thinkbox), чтобы предоставить вам те же возможности глубокой аналитики в собственной консоли и в любом журнале приложения, генерирующем события журнала.

Чтобы эта функция работала должным образом, пользователям должны быть разрешены следующие операции. При запуске сеанса Live Tail, если вы не обладаете правами администратора или у вас есть политика, включающая logs:*, убедитесь, что вы добавили следующие действия в заявление политики: logs:StartLiveTail и logs:StopLiveTail.

Подробнее об ограничениях на обслуживание Live Tail.

Доступ к Live Tail предоставляется в следующих регионах: Восток США (Огайо), Восток США (Северная Вирджиния), Запад США (Северная Калифорния), Запад США (Орегон), Азиатско-Тихоокеанский регион (Мумбаи), Азиатско-Тихоокеанский регион (Сеул), Азиатско-Тихоокеанский регион (Сингапур), Азиатско-Тихоокеанский регион (Сидней), Азиатско-Тихоокеанский регион (Токио), Канада (Центральная), ЕС (Франкфурт), ЕС (Ирландия), ЕС (Лондон), ЕС (Париж) и Южная Америка (Сан-Паулу).

Вы можете выполнять фильтрацию на основе групп (Log Groups) и потоков журналов (Log Streams), а также по ключевым словам. Для групп журналов поддерживается множественный выбор в нескольких аккаунтах из аккаунта мониторинга (для наблюдения за многочисленными аккаунтами). Для потоков журнала поддерживается выбор нескольких вариантов в зависимости от имени или префикса. Фильтр по ключевым словам учитывает регистр. Можно ввести одно или несколько ключевых слов (например, ошибка, исключение или неисправность), чтобы еще больше сузить фокус поиска. Можно ввести ключевые слова или скопировать и вставить образцы, представленные на информационной панели. Узнайте больше о шаблонах фильтров.

Нет, Live Tail обеспечивает просмотр данных журналов, которые CloudWatch собирает в режиме реального времени. Информацию об исторических журналах см. в разделах, посвященных функциям Logs Insights и Log Groups.

Защита данных журналов

Защита данных – это функция журналов CloudWatch, с помощью которой можно определить собственные правила и политики для автоматического выявления и маскирования конфиденциальных данных в журналах, собранных из ваших систем и приложений. Это выполняется с помощью машинного обучения (МО) и сопоставления шаблонов. При наличии высоких привилегий в Identity and Access Management (IAM) можно просматривать незамаскированные данные.

Чтобы в журнал не вносились конфиденциальные данные, клиенты иногда проводят расследования вручную или настраивают политики хранения журналов в течение короткого времени, чтобы журналы быстро удалялись, но из-за этого возникает риск потери ценных операционных журналов. Защита данных в журналах CloudWatch автоматически идентифицирует и маскирует конфиденциальную информацию в ваших журналах с помощью сопоставления шаблонов и МО без необходимости доступа к ним со стороны кого-либо. Эта функция полезна для отраслей с высоким уровнем регулирования, где нужно не допускать сохранения персональной информации. Кроме того, клиенты, создающие сервисы для оплаты или аутентификации, для которых требуются большие объемы персональной и конфиденциальной информации, могут с помощью этой новой функции снизить вероятность хранения ненужной информации в журналах.

Создав политику защиты данных в журналах CloudWatch, вы можете указать данные, которые требуется защищать. Вы можете выбирать из множества идентификаторов данных, в частности адреса электронной почты, водительские права из многих стран, номера кредитных карт, почтовые адреса и другое. Это разнообразие целевых идентификаторов данных дает возможность выбирать, какие именно конфиденциальные данные будут использоваться вашими приложениями, и маскировать те конфиденциальные данные, которые не должны быть легкодоступными. Важно, чтобы вы решили, какая информация конфиденциальна для вашего приложения, и выбрали соответствующие идентификаторы для своих вариантов использования.

Предупреждения

Можно создать предупреждение для мониторинга любых метрик Amazon CloudWatch в своей учетной записи. Например, можно создать предупреждение о нагрузке на ЦП инстанса Amazon EC2, задержке запросов Amazon ELB, пропускной способности таблиц Amazon DynamoDB, длине очередей Amazon SQS или даже расходах по счету AWS.

Для пользовательских метрик можно создавать предупреждения с учетом особенностей приложений или инфраструктуры. Для высокочастотных пользовательских метрик можно создавать предупреждения, которые будут отправляться в течение 10 или 30 секунд.

Составные предупреждения позволяют объединять несколько предупреждений и устанавливать их иерархию. Это избавляет от избыточного шума при активации нескольких предупреждений одновременно – вместо них запускается лишь одно предупреждение. Можно указать общее состояние для группировки таких ресурсов, как приложение, Регион AWS или зона доступности.

Дополнительную информацию можно найти на странице цен на CloudWatch.

При создании предупреждения его можно настроить таким образом, чтобы оно выполняло одно или несколько автоматизированных действий, когда отслеживаемая метрика превысит заданное пороговое значение. Например, можно задать предупреждение, которое отправляет электронное письмо, делает публикацию в очередь SQS, останавливает или прекращает работу инстанса Amazon EC2 или запускает политику Auto Scaling. Так как предупреждения Amazon CloudWatch интегрированы с Amazon Simple Notification Service, можно использовать любой тип оповещений из поддерживаемых сервисом SNS. С помощью действия OpsCenter в AWS Systems Manager можно автоматически создавать событие OpsItem, когда состояние предупреждения меняется на ALARM. Это позволяет быстро диагностировать и устранять проблемы с ресурсами AWS в пределах одной консоли.

При создании предупреждения сначала нужно выбрать отслеживаемую метрику Amazon CloudWatch. Затем нужно выбрать период оценки (например, 5 минут или 1 час) и измеряемое статистическое значение (например, среднее или максимальное). Чтобы установить порог, задайте целевое значение и укажите, в каком случае должно срабатывать предупреждение: когда значение по сравнению с целевым больше (>), больше или равно ему (>=), меньше (<) либо меньше или равно ему (<=).

Предупреждения продолжают сравнивать метрики с выбранным пороговым значением даже после срабатывания. Благодаря этому можно видеть их текущее состояние в любой момент времени. Иногда некоторые предупреждения могут пребывать в состоянии ALARM продолжительное время. Если значение метрики превышает заданный порог, предупреждение будет находиться в состоянии ALARM до тех пор, пока значение не опустится ниже порогового. Это нормальное поведение. Если нужно, чтобы предупреждения воспринимали этот новый уровень как корректный, задайте для них соответствующее пороговое значение.

История предупреждений хранится в течение 14 дней. Чтобы просмотреть историю предупреждений, войдите в CloudWatch в Консоли управления AWS, выберите в меню слева пункт «Alarms» (Предупреждения), выберите предупреждение и нажмите вкладку «History» (История) на панели снизу. На ней находится история всех изменений состояния и конфигурации предупреждений.

Панели управления

Панели управления Amazon CloudWatch позволяют создавать, настраивать и сохранять диаграммы ресурсов AWS и пользовательские метрики, а также осуществлять взаимодействие с ними.

Чтобы начать работу, откройте консоль Amazon CloudWatch и выберите Dashboards (Панели управления). Нажмите кнопку «Create Dashboard». Желаемое представление можно копировать из Automatic Dashboards. Для этого следует выбрать Options -> Add to Dashboard («Параметры» -> «Добавить на панель управления»).

Automatic Dashboards – это предварительно встроенные в сервис AWS рекомендации, которые учитывают остающиеся ресурсы и динамически обновляют их для отображения самого последнего состояния важных метрик производительности. Теперь можно фильтровать и устранять проблемы в специальном представлении без добавления кода для отражения самого последнего состояния ресурсов AWS. После выявления первопричины проблем с производительностью можно оперативно приступать к действиям, перейдя непосредственно к ресурсу AWS.

Да. Данные на панелях управления будут автоматически обновляться, пока панели открыты.

Да, панель управления доступна любому пользователю, у которого есть все необходимые разрешения для доступа к аккаунту, содержащему эту панель управления.

События

Amazon CloudWatch Events (CWE) – это поток системных событий, описывающих изменения в ресурсах AWS. Поток событий дополняет существующие потоки метрик и журналов CloudWatch и дает более полное представление о работоспособности и состоянии приложений. Пользователь пишет декларативные правила, связывая нужные события с автоматическими действиями, которые следует выполнить.

В настоящее время поддерживаются события сервисов Amazon EC2, Auto Scaling и AWS CloudTrail. С помощью сервиса AWS CloudTrail модифицирующие вызовы API (то есть все вызовы, кроме Describe*, List* и Get*) отображаются в потоке CloudWatch Events.

Если событие соответствует условиям правила, созданного в системе, можно автоматически вызывать функцию AWS Lambda, переправлять событие в поток Amazon Kinesis, отправлять оповещение в тему Amazon SNS или запускать встроенный рабочий процесс.

Да. С помощью API PutEvents приложение может отправлять собственные события с полезными данными, которые соответствуют вашим специальным потребностям.

Сервис CloudWatch Events способен генерировать события по графику, установленному с помощью стандартного синтаксиса планировщика cron для Unix. Осуществляя мониторинг этих событий, можно выполнять приложения по графику.

CloudWatch Events – это поток системных событий с описаниями изменений в ресурсах AWS в режиме, близком к реальному времени. С помощью CloudWatch Events можно формулировать правила для мониторинга конкретных событий и автоматического выполнения ответных действий. Сервис AWS CloudTrail регистрирует вызовы API для аккаунта AWS и доставляет файлы журналов с этими вызовами API в корзину Amazon S3 или в группу журналов CloudWatch Logs. AWS CloudTrail позволяет просматривать историю активности API по созданию, удалению и модификации ресурсов AWS, а также выявлять и устранять неисправности и уязвимости.

AWS Config – это полностью управляемый сервис, который ведет учет ресурсов в AWS, предоставляет оповещения об изменениях конфигурации и ведет журнал таких изменений для обеспечения безопасности и организации управления. Правила Config Rules помогают определять, соответствуют ли требованиям изменения в конфигурации. Сервис CloudWatch Events позволяет реагировать на изменения состояния ресурсов в режиме, близком к реальному времени. В отличие от Config и Config Rules, он не оценивает соответствие изменений политикам и не позволяет просматривать подробную историю. Он представляет собой поток событий общего назначения.