기존에 사용하던 데이터 수집기, '트레저데이터' 의 비용 증가로 다른 방안을 모색하게 됐다.
기존의 워크플로우를 보자면,
서버 어플리케이션 사용자 이벤트가 발생하면
-> td-logger (트레저데이터 SDK) 라이브러리를 통해
-> 트레저데이터의 테이블에 기록
-> 쿼리 끝!
이 간단한 프로세스를 다음처럼 바꿔야 한다.
서버 어플리케이션 사용자 이벤트가 발생하면
-> fluent-logger 를 통해
-> fluentd 서버로 메시지 전달
-> 수집된 로그를 가공하여 S3 로 전달
-> AWS Athena 에서 S3 데이터 쿼리.
중간에 fluentd 서버도 구축해야 하고, fluentd 서버에서 S3 로 데이터 전송하는 스케줄도 설정해야 하고, Athena 테이블도 생성해야 하고...
이러면 EC2 + query 비용으로 절감하는 장점이 있고, 단점은 내가 매우 피곤해지고 장애 발생시 책임은...
비용 절감 치고는 할게 너무 많다 ㅡ.ㅡ;;
이 모든 원흉이 Athena 출시 때문!
WRITTEN BY
- 손가락귀신
정신 못차리면, 벌 받는다.
,