로그 데이터 통합 관리: ELK 스택 구축 및 Kibana 시각화로 로그 지옥 탈출하기

JavaScript AWS Database 로그 데이터 통합 관리: ELK 스택 구축 및 Kibana 시각화로 로그 지옥 탈출하기 ⏱️ 읽는 시간: 약 8분 | 📊 3,807자 📑 목차 1. 개발자의 악몽, 분산된 로그의 늪에서 우아하게 탈출하기 2. 1. ELK Stack: 왜 하필 이 조합인가? (아키텍처의 미학) 3. 2. 로그스태시(Logstash) 심층 분석: 비정형 로그를 정복하라 개발자의 악몽, 분산된 로그의 늪에서 우아하게 탈출하기 안녕하세요. 15년 차 백엔드 개발자이자, 여러분과 함께 밤새워 코드를 고민하는 멘토입니다. 오늘은 조금 무거운 주제일 수도 있지만, 실무에서 가장 중요한 '생존 기술' 중 하나인 로그 관리에 대해 깊이 있게 이야기해 보려 합니다. 혹시 이런 경험 없으신가요? 금요일 오후 5시, 퇴근을 준비하는데 고객센터에서 "결제가 안 돼요!"라는 긴급 클레임이 들어옵니다. 식은땀을 흘리며 서버에 접속합니다. 그런데 서버가 10대네요? 터미널 창을 10개 띄워놓고 tail -f catalina.out 을 치며 눈이 빠져라 에러 로그를 찾습니다. 텍스트가 폭포수처럼 흘러가고, "이 서버가 아닌가? 저 서버인가?" 하다가 결국 30분이 지나서야 겨우 로그 한 줄을 발견합니다. "NullPointerException". 허탈하죠. 원인을 찾았을 때는 이미 고객들의 불만이 폭주한 뒤입니다. 저는 주니어 시절, 이 '로그 찾아 삼만리' 때문에 여자친구와의 기념일 저녁 약속을 세 번이나 어겼던 뼈아픈 기억이 있습니다. ☕ 커피를 아무리 마셔도 해결되지 않는 피로감과 자괴감은 덤이었...

도커 컨테이너 로그 용량 계속 늘어날 때 제한 설정 및 파일 정리 방법 디스크 100% 방지 가이드

JavaScriptNode.jsDocker

도커 컨테이너 로그 용량 계속 늘어날 때 제한 설정 및 파일 정리 방법 디스크 100% 방지 가이드

도커 컨테이너 로그 용량 계속 늘어날 때 제한 설정 및 파일 정리 방법 디스크 100% 방지 가이드

⏱️ 읽는 시간: 약 7분 | 📊 3,442자

안녕하세요, 15년 차 서버 사이드 개발자이자 기술 서적을 집필하고 있는 여러분의 멘토입니다. 오늘은 서버 운영을 하다 보면 누구나 한 번쯤, 아니 꽤 자주 겪게 되는 '악몽' 같은 상황에 대해 이야기해보려 합니다. 바로 Docker 컨테이너 로그가 디스크를 잠식하는 현상입니다.

솔직히 고백하자면, 저도 주니어 시절에 이 문제로 새벽 3시에 전화를 받은 적이 있습니다. "서버가 죽었어요!"라는 다급한 연락을 받고 접속해보니, /var/lib/docker 경로가 디스크 용량의 100%를 차지하고 있었죠. 원인은 단순했습니다. 별생각 없이 띄워둔 컨테이너 하나가 몇 달 동안 수십 기가바이트(GB)의 로그를 뱉어내고 있었던 겁니다. 그때의 등골 서늘함이란... 😅 아마 여러분 중에도 지금 No space left on device 에러를 보고 급하게 이 글을 찾아오신 분들이 계실 겁니다.

오늘은 단순히 "로그 지우는 법"을 넘어서, 왜 이런 일이 발생하는지 그 원리를 파헤치고, 다시는 이런 일이 발생하지 않도록 시스템 레벨에서 제한을 거는 방법, 그리고 운영 중인 서비스 중단 없이 로그를 정리하는 프로들의 비법까지 꽉 채워 알려드리겠습니다. 커피 한 잔 타 오세요. 이제 시작합니다.

1. 도커 로그, 대체 왜 이렇게 무거워질까요? (원리 이해)

해결책을 적용하기 전에 원리를 알아야 응용할 수 있습니다. 많은 분들이 Docker가 알아서 로그를 관리해 줄 것이라 믿지만, 사실 Docker의 기본 설정은 '무제한(Unlimited)'입니다. 이게 무슨 뜻이냐고요? 여러분이 설정을 건드리지 않았다면, 컨테이너는 디스크가 꽉 찰 때까지 영원히 로그를 기록한다는 뜻입니다.

Docker는 기본적으로 json-file이라는 로깅 드라이버를 사용합니다. 컨테이너 내부에서 애플리케이션이 stdout(표준 출력)이나 stderr(표준 에러)로 내뱉는 모든 텍스트를 낚아채서, 호스트 머신의 특정 경로(/var/lib/docker/containers/...)에 JSON 파일 형태로 저장합니다.

💡 데이터로 보는 심각성
"로그 파일 텍스트 쪼가리가 커봤자 얼마나 크겠어?"라고 생각하시나요? 간단한 계산을 해봅시다.
  • 초당 100개의 요청을 받는 웹 서버가 요청당 1KB의 로그를 남긴다고 가정합시다.
  • 1초 = 100KB, 1분 = 6MB, 1시간 = 360MB
  • 하루 = 약 8.6GB
  • 한 달 = 약 258GB
디스크 용량이 50GB인 클라우드 인스턴스라면, 아무리 아껴 써도 6일 만에 서버가 멈춥니다. 특히 문제가 되는 것은 로그 로테이션(Log Rotation)이 기본적으로 꺼져 있다는 점입니다. 영수증 프린터가 종이를 자르지 않고 무한히 출력하는 것과 같습니다.

2. 긴급 처방: 서비스 중단 없이 로그 비우기 (rm 금지!)

지금 당장 디스크가 100%라서 서버가 멈출 위기라면, 설정을 바꾸고 재시작할 여유가 없겠죠. 일단 급한 불부터 꺼봅시다. 여기서 초보 개발자들이 가장 많이 하는 치명적인 실수가 있습니다.

⚠️ 절대 rm 명령어로 로그 파일을 지우지 마세요!

급한 마음에 rm -rf /var/lib/docker/containers/.../*.log 명령어를 날리고 싶으실 겁니다. 하지만 이건 최악의 선택입니다. 왜냐고요?

  • 리눅스 파일 시스템은 inode라는 식별자로 파일을 관리합니다.
  • 실행 중인 Docker 프로세스는 이미 그 로그 파일의 inode를 잡고(Open) 있습니다.
  • 여러분이 rm으로 파일 경로를 지워도, 프로세스가 파일을 놓아주지 않았기 때문에 디스크 용량은 확보되지 않습니다. (Deleted 상태로 용량만 차지함)
  • 결국 컨테이너를 재시작해야만 용량이 돌아옵니다. 무중단 운영이 깨지는 것이죠.

✅ 올바른 해결책: truncate 명령어 사용

파일 자체를 삭제하는 게 아니라, 파일의 내용만 0으로 비워버리는 방식을 써야 합니다. 이렇게 하면 Docker 프로세스는 파일이 바뀐 줄 모르고 계속 로그를 쓸 수 있고, 디스크 용량은 즉시 확보됩니다.

터미널에서 다음과 같이 입력해보세요 (root 권한 필요):

truncate -s 0 /var/lib/docker/containers/*/*-json.log

이 명령어는 모든 컨테이너의 JSON 로그 파일 크기를 0바이트로 만들어버립니다. 제 경험상 이 명령어 한 줄로 50GB를 1초 만에 확보하고, 장애 상황을 모면한 적이 한두 번이 아닙니다. 이 방법은 서비스 다운타임 없이 즉시 효과를 봅니다.

3. 근본적인 해결: 로그 용량 제한 설정하기

급한 불을 껐다면, 이제 다시는 불이 나지 않도록 방화벽을 세워야겠죠. Docker에서 로그 용량을 제한하는 방법은 크게 세 가지가 있습니다. 상황에 맞게 선택하세요.

방법 1: 모든 컨테이너에 적용 (daemon.json) - 강력 추천

가장 추천하는 방법입니다. 개발자가 깜빡하고 설정을 안 해도 서버 전체에 안전장치를 거는 것이니까요. /etc/docker/daemon.json 파일을 수정(없으면 생성)하여 기본 설정을 변경합니다.

{
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "10m",
    "max-file": "3"
  }
}

  • max-size: "10m": 로그 파일 하나당 최대 10MB까지만 저장합니다.
  • max-file: "3": 로그 파일이 10MB가 되면 기존 파일을 백업하고 새 파일을 만듭니다. 최대 3개까지만 유지합니다. (즉, 총 30MB까지만 보관)

설정 후에는 반드시 Docker 데몬을 재시작해야 합니다 (systemctl restart docker).

방법 2: 특정 컨테이너만 적용 (docker-compose.yml)

특정 서비스만 로그를 많이 남겨야 하거나, 반대로 줄여야 할 때 유용합니다. docker-compose.yml 파일에 다음과 같이 작성합니다.

version: '3.8'
services:
  app:
    image: my-app:latest
    logging:
      driver: "json-file"
      options:
        max-size: "10m"
        max-file: "3"

4. 설정 방법 비교 및 요약

어떤 방법을 써야 할지 고민되시나요? 한눈에 비교해 드립니다.

설정 방법

💬 여러분의 경험을 들려주세요!

✨ 이 방법을 시도해보셨나요? 댓글로 공유해주세요!
📌 도움이 되셨다면 저장하고 주변에도 알려주세요.
🔔 더 많은 개발 팁을 받고 싶다면 구독해주세요!

이 글이 도움되셨나요? 공유해주세요!

🔎 관련 상품 추천

아래 링크를 통해 구매 시 운영자에게 일정 수수료가 발생할 수 있습니다.

도커 컨테이너 로그 용량 계속 늘어날 때 제한 설정 및 파일 정리 방법

'도커 컨테이너 로그 용량 계속 늘어날 때 제한 설정 및 파일 정리 방법' 관련 상품을 쿠팡에서 확인해 보세요.

상품 보러가기 →

댓글

이 블로그의 인기 게시물

VS Code에 GitHub Copilot 연동해서 코딩 생산성 높이는 설정 가이드 완벽 정복

Kubernetes란 무엇인가?

해외여행 이심 데이터 안 터질 때 데이터 로밍 차단과 APN 설정 점검으로 네트워크 연결 완벽 해결