본문 바로가기
카테고리 없음

AWS CloudWatch 메트릭,로그,이벤트

by jranke 2025. 3. 9.

AWS CloudWatch는 AWS 환경에서 서비스의 성능을 모니터링하고, 로그 데이터를 분석하며, 이벤트를 기반으로 자동화된 작업을 실행할 수 있는 강력한 도구입니다. 본 글에서는 CloudWatch의 주요 기능인 메트릭(Metrics), 로그(Logs), 이벤트(Events)에 대해 상세히 설명하고, 실무에서 이를 어떻게 활용할 수 있는지 알아보겠습니다.

 

CloudWatch 구성요소
CloudWatch 구성요소(출처: https://velog.io/@dongvelop/AWS-CloudWatch)

 

AWS CloudWatch 메트릭

AWS CloudWatch 메트릭은 AWS 리소스와 애플리케이션에서 발생하는 성능 데이터를 실시간으로 수집하고 분석하는 기능입니다. 이를 통해 사용자는 시스템 성능, 리소스 사용량, 트래픽 변화 등을 시각화하고 이상 감지 및 대응이 가능합니다.

CloudWatch는 리소스에 대한 무료 메트릭을 제공하고 있습니다. 또한 기본 모니터링과 상세 모니터링의 두가지 모니터링 범주를 제공하고 있습니다. 

 

주요 기능 및 활용 사례

  • AWS 기본 메트릭 제공: EC2(CPU 사용량, 네트워크 인/아웃 대역폭), Lambda(동시사용자수, Duration, Billed duration, Memory size), RDS 등 다양한 서비스에서 자동 수집
  • 사용자 정의 메트릭(Custom Metrics): 애플리케이션 내부에서 특정 데이터를 직접 CloudWatch로 전송
  • 대시보드(Dashboards) 활용: 실시간 데이터를 그래프로 표시하여 쉽게 모니터링 가능
  • Auto Scaling과 연계한 운영 자동화: EC2의 CPU 사용량이 80% 이상일 경우 자동으로 인스턴스 추가

메트릭 설정 방법

  1. AWS 콘솔에서 CloudWatch → 메트릭(Metrics)으로 이동
  2. 원하는 서비스 선택 후 모니터링할 항목 지정
  3. 필요시 사용자 정의 메트릭을 설정하여 맞춤 모니터링 가능

 

AWS CloudWatch 로그

CloudWatch Logs는 AWS 서비스 및 애플리케이션에서 발생하는 로그 데이터를 중앙에서 수집하고 분석하는 기능을 제공합니다. 수집되는 로그는 S3, Kibana Firehose등을 이용하여 통합할 수 있고 OpenSearch 등을 활용하면 애플리케이션 오류 분석, 성능 튜닝, 보안 로그 모니터링 등이 가능합니다.

 

주요 기능

  • 로그 스트림 생성: EC2 인스턴스, Lambda 함수, CloudTrail 등 다양한 AWS 서비스에서 생성되는 로그 데이터 수집 및 로그 스트림으로 구성
  • 로그 그룹 관리: 관련된 로그 스트림을 하나의 로그 그룹으로 구성
  • 로그 데이터 검색 및 필터링: 특정 패턴이나 키워드를 기반으로 원하는 로그 데이터 필터링 및 검색
  • 로그 데이터 모니터링: 로그 데이터에 대한 지표를 생성하고 모니터링
  • 로그 데이터 보존 및 저장: 로그 데이터를 CloudWatch Logs에 저장
  • 로그 데이터 스트리밍:  로그 데이터를 실시간으로 모니터링하거나 다른 서비스로 전송
  • 로그 데이터 분석: CloudWatch Logs Insights를 사용하여 로그 데이터를 쿼리 및 분석

활용 사례

  • AWS 서비스 로그 저장 및 분석: Lambda, ECS, RDS 등 다양한 서비스에서 로그 수집
  • 로그 필터링 및 검색 기능: 특정 키워드를 포함한 로그만 검색하여 신속한 문제 해결
  • 알람(Alert) 설정: 특정 로그 패턴 감지 시 SNS로 관리자에게 알림 발송
  • AWS Lambda, S3와 연계한 자동화: 특정 이벤트 발생 시 자동 대응 가능

로그 설정 방법

  1. AWS 콘솔에서 CloudWatch → 로그 그룹(Log Groups)으로 이동
  2. 로그 그룹 생성 후 데이터 저장할 리소스 연결
  3. 필요시 필터 및 알람 설정하여 실시간 모니터링 가능

 

AWS CloudWatch 이벤트

CloudWatch 이벤트는 AWS 서비스에서 발생하는 이벤트를 감지하고, 특정 조건에 따라 자동으로 작업을 실행하는 기능입니다. 이를 활용하면 운영 자동화 및 장애 대응을 효과적으로 수행할 수 있습니다.

주요 기능 및 활용 사례

  • AWS 리소스 상태 변경 감지: EC2 인스턴스 종료 감지 후 관리자에게 알림 전송
  • 스케줄링 기능: 특정 시간마다 Lambda 실행 (예: 매일 밤 12시에 백업 스크립트 실행)
  • AWS 서비스와 연계한 자동화: 이벤트 감지 시 AWS Lambda, SNS, SQS와 연동 가능
  • 실시간 대응 시스템 구축: CloudWatch 경보(Alarm)와 연계하여 이상 징후 감지 시 자동 복구 조치 수행

이벤트 설정 방법

  1. AWS 콘솔에서 CloudWatch → 이벤트(EventBridge) → 규칙 생성(Create Rule) 이동
  2. 감지할 이벤트 소스(예: EC2 상태 변경) 선택
  3. 이벤트 발생 시 수행할 액션(Lambda, SNS, SQS 등) 설정

AWS CloudWatch는 클라우드 환경에서 서비스 성능을 모니터링하고, 로그를 분석하며, 이벤트 기반 자동화를 수행하는 필수적인 도구입니다.

  • 메트릭(Metrics): 성능 데이터를 실시간으로 수집하여 모니터링
  • 로그(Logs): 다양한 서비스 및 애플리케이션의 로그 데이터를 중앙에서 관리
  • 이벤트(Events): 특정 조건이 충족될 경우 자동으로 작업 실행

CloudWatch를 효과적으로 활용하면 시스템 운영 비용 절감, 장애 대응 시간 단축, 클라우드 자원 최적화가 가능합니다. AWS 환경을 운영하는 모든 개발자와 엔지니어들에게 CloudWatch는 반드시 익혀야 할 필수 도구입니다.