Acerca de la posición.
será parte del equipo de product que incluye usuarios comerciales, administradores de datos, científicos de datos y otros miembros del equipo de tecnología para impulsar iniciativas de productos analíticos.
funciones:
- ejecutar el mejor proceso de data scientists incluido el control de versiones de datos / código / modelo y el seguimiento de experimentos.
- un entorno de tecnología de análisis de producción / ml que admite la implementación de modelos a través de canalizaciones de entrenamiento por lotes y puntos finales de api resistentes.
- implementar y administrar aplicaciones de data scientists en producción mientras cumple con el rendimiento, la seguridad y otros sla / requisitos operativos y garantiza la modularidad del código y la calidad de los datos.
- desarrollar aplicaciones escalables que aprovechen ml, métodos estadísticos y de optimización utilizando computación numérica distribuida y optimizada por hardware, según corresponda.
- desarrolle canales de aprendizaje automático robustos y reproducibles a través de la ingeniería y selección de características, capacitación y validación cruzada.
- despliegue modelos entrenados como api de inferencia / microservicios y trabaje con ingenieros de aplicaciones para construir api de modelo en aplicaciones de producción orientadas al usuario.
- asegurar que las aplicaciones se ejecuten de manera confiable en producción con la integración adecuada de acceso a datos, programación de computación distribuida, pruebas, implementación y tecnología de monitoreo.
- desarrollar,mantener código, plantillas de implementación, construir artefactos e imágenes de infraestructura que admitan bibliotecas de aprendizaje automático reutilizables.
- buscar e implementar las mejores prácticas y tecnologías de aprendizaje automático de vanguardia.
*responsabilidades*:
- 5+ años de experiência con data science y machine learning en un entorno empresarial.
- más de 3 años de experiência con una maestría o un doctorado.
- fundamentos sólidos de la informática, incluido el conocimiento de estructuras de datos y algoritmos, complejidad computacional y patrones de diseño de programación funcional / orientada a objetos.
- fuertes habilidades de ingeniería de software, incluida la experiência con un flujo de trabajo de desarrollo ágil moderno utilizando git, pruebas unitarias / funcionales y ci / cd (por ejemplo, jenkins).
-comprensión profunda y experiência con la familia de sistemas operativos linux; y experiência con linux / infraestructura en la nube y automatización / configuración de seguridad (por ejemplo, ansible, chef, puppet, terraform).
- familiaridad con los procesos de devsecops (por ejemplo, sast, seguridad de la cadena de suministro de software, api y pruebas de seguridad de la infraestructura) aplicados a un ciclo de vida de desarrollo de software moderno.
- experiência implementando una variedad de data scientists y técnicas de aprendizaje automático en producción, como bosques aleatorios, aumento de gradientes y redes neuronales.
- bachillerato, maestría o doctorado.
en ciencias de la computación, aprendizaje automático, matemáticas, estadística, física o un campo cuantitativo relacionado.
- fuerte dominio de python y el ecosistema de pydata, incluidos numpy, pandas, scikit-learn.
- fuerte dominio de java y / o scala dominio de sql.
- buen conocimiento de la computación distribuida y los patrones de diseño para escalar cargas de trabajo intensivas en computación, memoria y e / s en múltiples máquinas con diferentes arquitecturas de hardware; y experiência en la implementación de soluciones de aprendizaje automático con apache spark.
3979