We are looking for the best
42dot 의 AI Model Optimization and Tool Development Engineer (NPU) 는 자율주행 스택 최적화 및 온디바이스(on-device) LLM(대규모 언어 모델) 최적화를 중심으로, NPU 기반 AI 모델 최적화 및 관련 도구를 개발할 엔지니어를 모집합니다. 본 직무는 딥러닝 모델을 하드웨어 가속기에 맞게 최적화하고, 효율적인 실행을 보장하는 툴 체인을 설계하여 자율주행 및 LLM과 같은 AI 기술의 발전을 지원합니다.
Responsibilities
AI 모델 포팅 및 최적화
LLM 및 자율주행 스택을 위한 AI 모델을 NPU 하드웨어에 포팅 및 최적화
모델 압축(양자화, 프루닝 등), 연산자 퓨전, 메모리 최적화 기법 등을 활용하여 추론 속도를 개선
툴 체인 개발
AI 모델을 NPU로 포팅하기 위한 툴체인 설계 및 구현
딥러닝 프레임워크(TensorFlow, PyTorch 등)와의 통합 및 효율적인 워크플로우 제공
NPU 대상 코드 생성 및 프로파일러/디버깅 도구 등의 개발
자율주행 및 LLM 스택 최적화
자율주행에 필요한 AI 모듈(예: 객체 인식, 경로 계획 등)을 최적화하여 호환성 및 실시간 실행 성능 확보
LLM 추론 최적화를 통해 메모리 효율성과 속도 향상
멀티모달 AI 스택에서 모델 병렬화 및 분산 실행 기술 적용
성능 분석 및 개선
AI 모델의 런타임 성능 분석 및 병목현상 파악
하드웨어 utilization을 극대화할 수 있는 기술 구현
리서치 및 신기술 도입
AI 모델 최적화 및 NPU 관련 최신 기술 동향을 연구
NPU 성능을 극대화할 수 있는 새로운 기법 실험 및 도입
Qualifications
컴퓨터 공학, AI 또는 관련 분야 학사/석사 학위
AI 모델 최적화 및 하드웨어 가속기 경험 (3년 이상)
NPU, GPU, 또는 ASIC을 활용한 AI 최적화 경험
TensorFlow Lite, ONNX, PyTorch와 같은 딥러닝 프레임워크 및 모델 변환 도구 사용 경험
양자화, 프루닝, 지연 평가(Lazy Evaluation)와 같은 모델 압축 및 최적화 기술
CUDA/C++/Python과 같은 프로그래밍 언어 및 하드웨어-가속 코드 작성 경험
메모리 관리 및 병렬 컴퓨팅 기술
Preferred Qualifications
자율주행 스택 (예: SLAM, 경로 계획, 객체 인식) 경험
온디바이스 AI/LLM 관련 최적화 경험
LLVM/MLIR 등 컴파일러 기술 활용 경험
임베디드 시스템에서의 AI 최적화 경험
오픈소스 AI 최적화 프로젝트에 기여한 경험
Interview Process
서류전형 - 코딩테스트 - 1차면접 (1시간 내외) - 2차면접 (3시간 내외) - 최종합격
전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.
전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내드립니다.
Additional Information
모든 제출파일은 PDF 양식으로 업로드를 부탁드립니다.
국가보훈대상자 및 취업보호대상자는 관계법령에 따라 우대합니다.
장애인 고용촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.
42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.
※ 지원 전 아래 내용을 꼭 확인해 주세요.
42dot이 일하는 방식, 42dot Way 보러가기 →
42dot만의 업무몰입 프로그램, Employee Engagement Program 보러가기 →