소개
강점
신속한 업무 파악 및 적응
새로운 환경·도구에 대한 빠른 적응력을 바탕으로 다양한 프로젝트에 즉시 기여
체계적인 문서화와 지식 공유
모든 작업 과정을 문서로 정리하고 팀과 공유하여 조직의 지식 자산 구축에 기여
기록 기반의 지속적 개선
장애 대응, 인프라 변경, 트러블슈팅 등 모든 작업을 기록 기반으로 관리하여 재발 방지 및 개선 추구
풀스택 인프라 경험
클라우드(AWS, GCP), 온프레미스, 네트워크, CI/CD, 모니터링을 아우르는 엔드투엔드 인프라 경험 보유
기술 스택
클라우드
컨테이너 오케스트레이션
Infrastructure as Code
CI/CD
모니터링 & 로깅
자동화
OS & 서버
핵심 역량 (Core Competencies)
클라우드 인프라 설계 및 운영
AWS, GCP 기반 멀티·하이브리드 클라우드 아키텍처 설계 및 운영 경험
- AWS EKS, GCP GKE 프로덕션 환경 운영 및 비용 최적화 (월 $60,000 → $48,000, 50% 절감 등 실 성과)
- Terraform을 활용한 IaC 기반 인프라 자동화 및 버전 관리 (GCP 리소스 100% 코드화)
- 온프레미스-클라우드 하이브리드 아키텍처 설계 및 마이그레이션 경험
CI/CD 파이프라인 구축 및 GitOps
GitOps 기반 배포 자동화를 통한 개발 생산성 극대화
- GitHub Actions, GitLab CI, ArgoCD를 활용한 CI/CD 파이프라인 설계 및 고도화
- 배포 시간 50~67% 단축, 롤백 시간 95% 감소 (30분 → 1~2분) 달성
- Jenkins 기반 Unity Android/iOS 빌드 자동화 및 Slack 연동 배포 알림 구축
모니터링 및 옵저버빌리티 시스템 구축
장애 사전 감지 및 신속한 대응 체계 수립
- PLG Stack (Prometheus, Loki, Grafana) 기반 메트릭·로그 통합 모니터링 구축
- ELK Stack (Elasticsearch, Logstash, Kibana, Filebeat) 기반 중앙 집중식 로깅 시스템 구축
- 장애 대응 시간 60~70% 감소, 서비스 가용성 99.9% 달성
자동화 및 효율화
Python, Bash를 활용한 운영 업무 자동화 및 개발 생산성 도구 구축
- 데이터 수집, 배포 프로세스, 문서 관리 자동화로 수동 작업 90% 이상 감소
- 내부 LLM 서비스(Ollama + Open WebUI) 구축을 통한 개발팀 생산성 향상
- GitLab Webhook 기반 문서 자동 동기화, Slack Bot 기반 APK 배포 알림 등 사내 도구 개발
주요 경력 상세 (Professional Experience)
팬텀(콘크릿트 스튜디오)
DevOps Engineer
2024.10 ~ 현재
게임 개발사의 DevOps 인프라 전담 엔지니어로, AWS 기반 클라우드와 온프레미스 서버를 설계·구축·운영하고 있습니다. 개발 서버와 테스트 서버는 온프레미스에, QA와 Production 서버는 AWS에 구축하여 하이브리드 아키텍처를 운영 중입니다.
현재 서비스 중인 게임 '소울즈'에 대해 퍼블리셔와 협업하여 2차 기술지원 및 운영을 담당하고 있으며, 개발 중인 신규 게임 프로젝트의 개발 생산성 향상을 위해 온프레미스·AWS 인프라를 구축하고 있습니다.
현재 서비스 중인 게임 '소울즈'에 대해 퍼블리셔와 협업하여 2차 기술지원 및 운영을 담당하고 있으며, 개발 중인 신규 게임 프로젝트의 개발 생산성 향상을 위해 온프레미스·AWS 인프라를 구축하고 있습니다.
프로젝트 1: AWS-온프레미스 하이브리드 클라우드 아키텍처 구축
문제
전체 인프라를 AWS에서 운영하던 중 월 $60,000의 높은 클라우드 비용이 발생하여 비용 최적화가 필요했습니다.
접근 전략
워크로드별 비용 분석을 수행한 결과, 개발·테스트 환경은 트래픽 변동이 적어 클라우드의 탄력성이 불필요했고, QA·Production 환경만 확장성과 안정성이 요구되는 상황이었습니다. 이에 개발·테스트 환경은 온프레미스로 전환하고, QA·Production 환경은 AWS에 유지하는 하이브리드 아키텍처를 설계했습니다.
트러블슈팅
- EKS 환경에서 ALB Ingress 구성 시, 게임 클라이언트 버전별로 다른 백엔드로 라우팅해야 하는 요구사항 발생. ALB의 조건부 라우팅 규칙에서 커스텀 헤더 기반 라우팅과 Target Group을 조합하여 해결
- Kubernetes IPVS 모드에서 ClusterIP 서비스 간 통신 시 간헐적 타임아웃 발생. Cilium eBPF 패킷 흐름을 분석하고 IPVS 커넥션 트래킹 테이블 설정을 조정하여 해결
- EFS 마운트 시 Pod 스케줄링이 지연되는 문제 발생. EFS CSI Driver의 마운트 옵션 최적화 및 StorageClass 설정을 조정하여 해결
성과
- 월 인프라 비용 20% 절감 ($60,000 → $48,000), 연간 약 $144,000 비용 절약
- 개발·테스트 환경의 온프레미스 마이그레이션 완료로 AWS 리소스 사용량 최적화
- 환경별 역할 분리를 통해 운영 안정성 확보 및 장애 전파 방지
기술 스택
AWS (EKS, EC2, ALB, Route53, ACM, EFS, Aurora MySQL, ElastiCache, CloudFront)
Kubernetes
Terraform
Helm
프로젝트 2: 온프레미스 CI/CD 파이프라인 구축 및 고도화
문제
개발자가 수동으로 빌드 후 서버에 배포하는 방식으로, 배포 시 평균 30분이 소요되었으며 휴먼 에러로 인한 장애가 빈번하게 발생했습니다.
접근 전략
GitLab CI와 ArgoCD를 조합한 GitOps 기반 자동 배포 환경을 구축했습니다. Kaniko를 활용한 Docker 이미지 빌드로 Docker-in-Docker 의존성을 제거하고, 멀티 환경(alpha/review/dev/staging) 배포를 단일 파이프라인에서 관리하도록 구성했습니다.
트러블슈팅
- GitLab CI에서 Alpine 기반 컨테이너의 OpenSSL 버전 불일치로 Harbor 레지스트리와의 TLS 핸드셰이크 실패. 베이스 이미지를 OpenSSL 3.x 호환 버전으로 교체하여 해결
- GitLab 업그레이드 후 GPG 키 만료로 CI Runner에서 패키지 설치 실패. GPG 키 갱신 프로세스를 자동화하여 재발 방지
- Kaniko 빌드 시 캐시 무효화로 빌드 시간 급증. -cache=true --cache-ttl=24h --snapshot-mode=redo 옵션 조합으로 해결
성과
- 배포 시간 67% 단축 (30분 → 10분), 수동 작업 자동화 90% 달성
- 주간 배포 횟수 3배 이상 증가 (1~2회 → 5~7회)
기술 스택
GitLab CI/CD
ArgoCD
Jenkins
Kaniko
Kubernetes
Docker
Harbor
프로젝트 3: ELK 기반 통합 모니터링 및 로깅 시스템 구축
문제
온프레미스 환경에서 서버 및 컨테이너 로그가 분산되어 있어 장애 발생 시 원인 파악에 많은 시간이 소요되었습니다.
트러블슈팅
- 게임 서버 로그의 null 바이트(\x00)로 Logstash 파싱 실패. mutate 필터 gsub으로 사전 제거하여 해결
- Elasticsearch 필드 매핑 충돌(mapper_parsing_exception). 인덱스 템플릿 명시적 매핑 및 타입 변환 필터 적용으로 해결
- 디스크 워터마크 초과로 인덱스 read-only 전환. ILM 정책으로 7일 초과 인덱스 자동 삭제하여 안정화
성과
- 로그 검색 시간 90% 단축, 장애 원인 파악 시간 70% 감소
- 일 평균 20GB 로그 데이터 실시간 처리 및 7일간 보관
기술 스택
Elasticsearch
Logstash
Kibana
Filebeat
Kubernetes
프로젝트 4: 개발 생산성 도구 구축 (문서 자동화 · LLM 서비스 · APK 배포 봇)
4-1. GitLab-Google Drive 문서 자동화 시스템 (2주, 2025.08)
GitLab Webhook + Google Drive API로 Push 시 자동 동기화. 문서 관리 시간 80% 감소
4-2. 내부 LLM 서비스 구축 (4주, 2026.01)
온프레미스 GPU 서버(RTX 3060)에 Ollama + Open WebUI를 Kubernetes에 배포. 외부 LLM 비용 절감 및 데이터 유출 리스크 제거
4-3. Slack APK 배포 자동화 봇 (4주, 2025.02)
Jenkins 빌드 완료 시 Slack에 QR 코드와 함께 자동 알림. QA팀 전달 시간 90% 단축
너디스타
DevOps Engineer
2023.03 ~ 2024.07
게임 및 블록체인 기반 스타트업에서 DevOps 엔지니어로 근무하며, AWS에서 GCP로의 대규모 클라우드 마이그레이션 프로젝트를 총괄했습니다.
프로젝트 1: AWS → GCP 대규모 클라우드 마이그레이션 및 CI/CD 재구축
트러블슈팅
- AWS ALB → GCP 글로벌 LB 전환 시 헬스체크/백엔드 구성 차이로 라우팅 이슈. GCP NEG 구조 분석 후 재구성
- RDS → Cloud SQL 마이그레이션 시 캐릭터셋 차이로 데이터 깨짐. 사전 검증 스크립트 및 단계별 정합성 체크로 해결
- AWS/GCP 서브넷 모델 차이(AZ vs 리전)로 네트워크 설계 이슈. CIDR 재설계 및 GCP 태그 기반 방화벽 전환
성과
- 클라우드 비용 50% 절감 (월 $10,000 → $5,000), 배포 시간 50% 단축, 롤백 95% 감소
- 전체 GCP 인프라 Terraform IaC화, Git 커밋 기반 배포 이력 100% 추적
기술 스택
GCP (GKE, Cloud SQL, Cloud Storage, VPC, Global LB)
Terraform
GitLab CI
ArgoCD
GitHub Actions
Helm
프로젝트 2: 게임 데이터 수집 자동화 시스템 개발
성과
- 데이터 수집 자동화 95% 달성, 데이터 누락률 0%, 처리량 10배 증가
기술 스택
Python
Cloud Functions
Cloud Scheduler
Google Sheets API
프로젝트 3: PLG Stack 기반 모니터링 시스템 구축
성과
- 장애 사전 감지율 80%, 장애 대응 시간 60% 감소, 서비스 가용성 99.5% → 99.9%
기술 스택
Prometheus
Loki
Grafana
Promtail
Fluent-bit
Slack API
아이오차드
Infra Engineer
2022.04 ~ 2023.03
PaaS(Kubernetes + OpenStack + Ceph) 기반 인프라 솔루션을 고객사에 구축하고 기술 지원을 제공. 금융권 및 공공기관 대상 온프레미스 클라우드 인프라 설계·구축 및 운영 교육을 수행했습니다.
주요 프로젝트: PaaS 솔루션 구축 · DP사 교육 · 인증서 자동화
성과
- 5개 고객사에 PaaS 솔루션 구축, Kubernetes HA 99.9% 가용성
- DP사 운영팀 Kubernetes 자체 운영 체계 확립 (6개월 교육)
- 인증서 갱신 주기 10배 연장 (1년 → 10년), 연간 50시간 운영 부담 절감
기술 스택
Kubernetes
OpenStack
Ceph
Ansible
kubeadm
Rocky Linux/CentOS
이테크시스템
System Engineer
2022.01 ~ 2022.04
Hardware Server 및 SAN 스토리지 구축. DevOps 분야로의 커리어 전환을 위해 이직.
오픈소스 프로젝트
Kubernetes CRD
k8s-namespace-sync
Kubernetes 네임스페이스 리소스를 클러스터 간 자동 동기화
helios-lb
Kubernetes용 커스텀 로드밸런서 컨트롤러
GitHub Actions
Compress Decompress Action
워크플로우 내 파일 압축/해제
Image Tag Updater
YAML/Helm 파일 이미지 태그 자동 업데이트
Go Git Commit Action
Go 기반 Git 커밋 생성 및 푸시
Ansible Galaxy
Ansible K8s IAC Tool
K8s 및 IaC 도구 자동 설치 컬렉션
Ansible User Management
Linux 사용자 및 SSH 키 관리 역할
학력
충남대학교 행정학부 (학사편입)
2018.03 ~ 2020.08
국가평생교육진흥원 경영학사 (학점은행제)
2016.09 ~ 2018.02
자격증
정보처리기사
2021.11
AWS Certified Solution Architect - Associate (만료)
2021.11
네트워크 관리사 2급
2021.10
리눅스 마스터 2급
2021.10
컴퓨터활용능력 1급
2021.04
TOEIC Speaking Test - 130점/Intermediate Mid 3 (만료)
2021.02
스터디
2023.08 ~ 2023.10
2023.04 ~ 2023.06
2023.01 ~ 2023.02
2022.02 ~ 2022.04
보안솔루션 운영 전문가 양성과정 (국비교육)
2021.07 ~ 2021.12