Job Description
합류하게 될 팀에 대해 알려드려요 Infra Engineering Tribe는 토스의 다양한 서비스가 안정적으로 운영될 수 있도록 네트워크, 시스템, 인프라 전반을 설계하고 운영하는 엔지니어 조직이에요. Systems Engineer team은 단순한 유지보수를 넘어 인프라 구조를 본질적으로 개선하고 장애의 근본 원인을 제거하며, 새로운 서비스와 기술 도입에 알맞은 인프라 전략을 수립하고 있어요. 토스의 모든 서비스가 확장성과 안정성을 갖출 수 있도록 만드는 것이 우리의 목표예요.우리가 함께 해결하고 있는 문제들이에요 수백만 금융 트랜잭션을 처리하는 대규모 온프레미스 인프라를 안정적으로 운영해요. 다양한 형태의 워크로드(GPU, 분석, ML 등)를 위한 컴퓨팅 환경을 설계해요. 장애 발생 시 Root Cause를 분석하고, 구조적인 개선을 통해 재발을 방지해요. 고가용성과 확장성을 보장하는 서비스 아키텍처를 설계하고 표준화해요. DW, Data Mart, Data Lake 기반의 데이터 인프라를 안정적으로 운영하고 최적화해요. 운영 도구, 자동화, 모니터링 시스템을 직접 기획하고 내재화해요.합류하면 함께 할 업무에요 온프레미스 기반 인프라를 직접 설계하고 구축하며 안정적으로 운영해요. 복잡한 인프라 환경에서 문제를 정의하고 최적의 해결 방안을 도출해요. 데이터, 플랫폼, 보안 등 다양한 팀과 협업하며 시스템 개선을 주도해요.이런 분과 함께하고 싶어요 대규모 Linux 서버와 네트워크 인프라를 운영해 본 경험이 필요해요. 문제 상황을 빠르게 파악하고, 구조적인 해결 방안을 설계해 본 경험이 필요해요. Python, Bash 등 스크립트를 활용하여 운영 자동화를 해본 경험이 필요해요. 오픈소스 기반의 모니터링과 로깅을 활용하여 장애를 대응해 본 경험이 필요해요. 다양한 이해관계자와 원활하게 소통하며 협업할 수 있는 분이 필요해요.💡 GPU 및 ML 인프라 분야 GPU Cluster(Slurm, Kubernetes 등)를 운영하고 고도화해본 경험이 있다면 더 좋아요. Kubeflow, MLflow, Airflow 등의 ML Ops 환경 구성을 지원해 본 경험이 있다면 좋아요. AI/ML 워크로드를 위한 스케줄링, 모니터링, 자원 최적화를 해본 경험이 있다면 좋아요.💡 데이터 인프라 분야 Data Warehouse, Data Mart, Data Lake를 운영해본 경험이 있다면 더 좋아요. Hadoop과 Spark 기반의 분산 데이터 처리 인프라를 운영해본 경험이 있다면 좋아요. 대규모 데이터 처리 시스템의 하드웨어를 설계하고 운영을 고도화해본 경험이 있다면 좋아요. Kafka 기반 데이터 파이프라인 인프라를 운영하고 장애에 대응해본 경험이 있다면 좋아요.이력서는 이렇게 작성하시는 걸 추천해요 본인이 직접 정의하고 해결한 복잡한 문제 사례를 두 건 이상 구체적으로 작성해 주세요. (문제 원인 분석, 해결 접근 방식, 결과 및 인프라 변화 중심으로 작성해 주세요.) 기여한 프로젝트를 상세히 작성해 주세요. (프로젝트 기간, 역할, 사용한 기술, 인프라 구조, 도입한 개선 사항 등)토스로의 합류여정 서류 접수 > 직무 인터뷰 > 문화적합성 인터뷰 > 레퍼런스 체크 > 처우 협의 > 최종 합격 및 입사함께할 동료를 위한 한마디"System Engineer의 모든 것을 경험할 수 있어요" 복잡한 문제를 직면하고, 명확하게 정의하며, 최적의 방식으로 해결할 수 있는 사람. 그런 사람이 토스에서 인프라를 혁신합니다.우리와 함께 토스의 기술 기반을 설계해 나가고 싶다면, 지금 지원해 주세요!
Job Application Tips
- Tailor your resume to highlight relevant experience for this position
- Write a compelling cover letter that addresses the specific requirements
- Research the company culture and values before applying
- Prepare examples of your work that demonstrate your skills
- Follow up on your application after a reasonable time period