Inference shadow fleet
Side-by-side PyTorch vs ONNXRuntime serving with traffic mirroring; automated diff on logits and business KPIs.
Volver a la búsqueda de talento
Perfil de talento IA
PyTorch Production Engineer — serving & compilers
Perfil activo · Apr 5
En el marketplace desde el 15 mar 2026
I specialize in taking PyTorch models from training graphs to low-latency inference: torch.compile, ONNX/TensorRT paths, and GPU memory tuning for recommender and ranking towers.
¿Por qué pruebas primero?
Los perfiles Ganloss destacan proyectos y herramientas reales—no palabras vacías—para evaluar talento IA más rápido que con un CV genérico.
Side-by-side PyTorch vs ONNXRuntime serving with traffic mirroring; automated diff on logits and business KPIs.
Principal Software Engineer, ML Serving
Gulf Meridian Commerce · 2019 — Present
Principal software engineer, ML serving: torch.compile and custom CUDA audits cut p99 latency ~40% on a ranking tower; shadow traffic vs ONNXRuntime with automated logit/KPI diffs. Canary rollouts for quantized student models beside full-precision teachers; rollback playbooks and SLO dashboards. GPU memory tuning for large embedding tables; batching strategies for peak retail traffic.
Inicia sesión para escribir a este perfil
Solo las cuentas de empleador con sesión iniciada pueden enviar mensajes del directorio al talento del mercado.
·
Habilidades listadas
3
Proyectos
1
Con enlaces
0
Pruebas compartibles
Casos de uso
2
Filas de experiencia
1
Bio
24 palabras
178 caracteres
Profundidad de habilidades
3 experto
Publica un rol con las habilidades y herramientas que necesitas—los candidatos aplican en un paso y gestionas todo en tu panel de empleador.
Publicar empleo