Job Description

About Algorithm Team - Model Compression PartLLM Quantization이 추론 효율성을 극대화할 수 있다는 점은 널리 알려져 있습니다. 그러나 이를 실제 서비스에 적용하는 것은 여전히 어려운 과제입니다. Model Compression Part는 사용자 친화적인 Model Compression 도구를 개발해 이러한 어려움을 해결하고, 고객이 자사 NPU를 최고의 효율로 활용할 수 있도록 지원하는 것을 목표로 합니다.Model Compression 도구가 Hardware-specific 최적화를 포함할 때, 효율성을 극대화할 수 있습니다. 우리는 이러한 요구를 충족하기 위해 자사 NPU에 특화된 최적화 기능을 갖춘 자체 도구를 개발하였으며, 이를 통해 NPU의 성능을 최대로 끌어올릴 수 있는 필수 소프트웨어 스택을 제공합니다.FuriosaAI Model Compression 도구는 자동화, 확장성, 안정성을 지속적으로 개선하면서 점점 더 많은 기능이 요구됩니다. 이에 따라 소프트웨어 엔지니어링 역량이 매우 중요한 상황입니다. 따라서 풍부한 소프트웨어 엔지니어링 경험을 보유하고 있으며, Model Compression 엔지니어로서 커리어를 발전시키고자 하는 인재를 찾고 있습니다.ResponsibilitiesModel Compression 도구 개발다양한 양자화된 모델 확보 및 성능 검증이를 기반으로 더 진보된 Compression Algorithm개발Minimum QualificationsPyTorch 개발 경험이 풍부하신 분상용 소프트웨어 개발 경험이 있으신 분관련 분야에서 3년 이상의 실무 경력을 보유하신 분Preferred QualificationsDevOps 및 MLOps에 대한 경험과 지식vLLM, TensorRT-LLM 등의 LLM inference tool을 사용한 경험Deep Learning Quantization 경험과 지식Deep Learning 가속과 관련된 회사에서의 근무 경험Contactrecruit@furiosa.ai

Software Engineer (Quantization Engineer)

Job Description

Job Application Tips

Related Jobs

Chef de Partie – Pastry

Sous Chef - Main Kitchen

Server Developer [Staff] (Commerce)

Server Developer (Product)

Job Description

Job Application Tips

Share this job

Apply for this Job

Related Jobs

Chef de Partie – Pastry

Sous Chef - Main Kitchen

Server Developer [Staff] (Commerce)

Server Developer (Product)