CreAI

Generative AI Engineer

Remote
Python API Bash C# C++ Clojure Cobol Crystal Dart Delphi Elixir Erlang F# Groovy Haskell HTML Java JavaScript Julia Kotlin Lisp Matlab MariaDB Node.js Objective-C Perl PHP PowerShell R Ruby Rust Scala Shell SQL SQL Server Swift TypeScript VBA Angular AngularJS ASP ASP.NET Cordova Django Drupal Ember.js Express.js FastAPI Flask Flutter Gatsby Hadoop Keras Laravel Next.js Nuxt.js NumPy OpenCV Pandas PyTorch Qt React React Native Ruby on Rails Spark Spring Svelte Symfony TensorFlow Torch Vue.js Android Ansible AWS Azure Cassandra Chef Couchbase DigitalOcean Deno Docker DynamoDB Elasticsearch Firebase GCP Git Heroku IBM Cloud Kafka Kubernetes MongoDB MySQL Oracle Oracle Cloud PostgreSQL Puppet Redis SQLite Terraform Unity Unreal Xamarin Yarn AI Deep Learning GraphQL gRPC Machine Learning Microservices Streaming LangChain LlamaIndex OpenAI API Anthropic Claude Google Gemini GPT-4 Claude Gemini Llama Mistral AWS Bedrock AWS SageMaker Azure OpenAI Vertex AI Pinecone Chroma Weaviate pgvector AutoGen CrewAI LangGraph Docker Kubernetes Terraform Apache Spark GDPR CCPA LangFuse LangSmith Weights & Biases Arize Phoenix Llama 3 vLLM TGI Ollama HyDE LoRA QLoRA PEFT GraphRAG GGUF GPTQ GPT-4 Vision Gemini Pro Vision Claude 3
Description

Sobre Creai

En Creai, nos especializamos en aprovechar el poder de la inteligencia artificial y el aprendizaje automático para transformar negocios. Nuestra misión es ayudar a los clientes a reducir costos, aumentar la eficiencia y desbloquear nuevas oportunidades mediante soluciones de IA de vanguardia.

Descripción del puesto


Como Senior Generative AI Software Engineer en Creai, serás responsable de diseñar, implementar y mantener soluciones empresariales complejas basadas en Inteligencia Artificial Generativa, Large Language Models (LLM) y Retrieval-Augmented Generation (RAG). Este rol requiere expertise técnico profundo en el ciclo completo de vida de proyectos GenAI, desde el discovery inicial hasta el despliegue en producción y optimización continua.

Serás el guardián de la calidad y robustez de nuestras soluciones GenAI, liderando la implementación de nuestra metodología estandarizada y asegurando que cada sistema entregue valor real de negocio mientras mantiene los más altos estándares de precisión, seguridad y eficiencia de costos. Trabajarás directamente con clientes enterprise para traducir problemas de negocio complejos en arquitecturas GenAI escalables y confiables.


Este puesto exige

Arquitectura y Diseño de Soluciones GenAI: Diseñar arquitecturas end-to-end para sistemas RAG, agentes conversacionales, sistemas multi-agente y soluciones de generación de contenido. Tomar decisiones críticas sobre approach técnico (prompt engineering, RAG, fine-tuning o combinaciones), selección de modelos LLM, vectorstores, y estrategias de retrieval basándose en requisitos específicos de cada proyecto.

Implementación de Sistemas RAG Complejos: Construir pipelines completos de RAG incluyendo document loaders, estrategias de chunking óptimas, enrichment de metadata, embeddings, vectorstores, hybrid search, re-ranking, y generation con LLMs. Optimizar cada componente para maximizar relevancia, groundedness y performance.

Prompt Engineering Avanzado: Diseñar, iterar y optimizar prompts complejos aplicando técnicas avanzadas como few-shot learning, chain-of-thought, ReAct patterns, y self-consistency. Implementar guardrails robustos para control de alucinaciones, incluyendo grounding explícito, citation enforcement, y post-processing validation.

Gestión y Procesamiento de Conocimiento: Diseñar e implementar pipelines de ingesta, procesamiento y estructuración de fuentes de conocimiento diversas (documentos, bases de datos, APIs). Implementar estrategias avanzadas de chunking, metadata extraction, deduplication, y data governance con control de acceso role-based y protección de PII.

Evaluación y Validación Sistemática: Implementar frameworks de evaluación exhaustivos combinando métricas automáticas (model-based), métricas de retrieval (context precision/recall, MRR, NDCG), benchmarks con referencias, y evaluación humana. Diseñar test datasets representativos y realizar análisis de failure modes para mejora continua.

Integración con LLMs y Plataformas Cloud: Implementar integraciones robustas con modelos como GPT-4, Claude, Gemini, Llama, y Mistral usando APIs, function calling, structured outputs, y output parsing. Gestionar deployments en plataformas cloud (AWS Bedrock, SageMaker, Azure OpenAI, Vertex AI) optimizando para latencia, costo y escalabilidad.

Desarrollo de Agentes Autónomos: Implementar agentes GenAI capaces de razonamiento, toma de decisiones, y ejecución de acciones mediante tool integration (APIs, bases de datos, code interpreters). Diseñar arquitecturas de agentes (ReAct, Plan-and-Execute, Multi-Agent) con memory management, error handling, y retry logic robusto.

Observabilidad y Monitoreo de Producción: Implementar sistemas de monitoreo continuo para métricas de calidad (relevancia, precisión factual, groundedness), experiencia de usuario (satisfacción, task success rate), y eficiencia operacional (latencia, costos de tokens, performance). Configurar alertas, dashboards, y feedback loops para mejora iterativa.

Optimización de Costos y Performance: Analizar y optimizar continuamente el consumo de tokens, estrategias de caching, model routing, y uso de recursos computacionales. Implementar técnicas de cost efficiency como prompt compression, semantic caching, y selección dinámica de modelos según complejidad de query.

Seguridad, Privacidad y Compliance: Implementar medidas de seguridad robustas incluyendo defense contra prompt injection, data leakage prevention, sanitización de inputs, y rate limiting. Asegurar compliance con GDPR y regulaciones locales mediante PII protection, data residency, audit logging, y encryption.

Testing de Robustez y Red Teaming: Realizar testing exhaustivo incluyendo adversarial testing (jailbreak attempts, prompt injection), edge cases, load testing bajo alta concurrencia, y validación de error handling. Ejecutar ejercicios de red teaming regular para identificar vulnerabilidades.

Colaboración con Stakeholders Técnicos y de Negocio: Comunicar decisiones arquitectónicas complejas, trade-offs técnicos, limitaciones de GenAI, y recomendaciones a audiencias diversas desde developers hasta ejecutivos. Liderar sesiones de discovery con clientes para entender requisitos y definir métricas de éxito en dimensiones de calidad, UX, y negocio.

Mejora Continua y Adopción de Emerging Technologies: Mantenerse actualizado con últimos avances en GenAI/LLM, evaluar nuevas técnicas y modelos, y proponer innovaciones que mejoren la efectividad de nuestras soluciones. Contribuir a la evolución de mejores prácticas y metodologías internas.

Documentación Técnica Exhaustiva: Crear documentación arquitectónica detallada, diagramas de sistemas, especificaciones técnicas, guías de implementación, y runbooks operacionales que permitan la ejecución exitosa y mantenimiento sostenible de soluciones GenAI.


Requisitos y competencias

Experiencia Profunda en GenAI/LLM: 3+ años de experiencia práctica diseñando e implementando soluciones de producción basadas en Large Language Models, incluyendo sistemas RAG, agentes conversacionales, y generación de contenido. Experiencia comprobada llevando proyectos GenAI desde discovery hasta producción.

Dominio de Frameworks y Herramientas GenAI: Experiencia avanzada con frameworks como LangChain, LlamaIndex, o similares. Conocimiento profundo de plataformas de LLM (OpenAI API, Anthropic Claude, Google Gemini) y sus capacidades de function calling, structured outputs, y JSON mode.

Expertise en Sistemas RAG: Experiencia sólida implementando arquitecturas RAG completas incluyendo document processing, chunking strategies, embedding models (OpenAI, sentence-transformers), vectorstores (Pinecone, Chroma, Weaviate, pgvector), retrieval strategies (semantic search, hybrid search, re-ranking), y generation patterns.

Prompt Engineering Avanzado: Habilidad comprobada diseñando y optimizando prompts complejos usando técnicas avanzadas (few-shot, chain-of-thought, ReAct). Experiencia implementando guardrails efectivos contra alucinaciones, incluyendo grounding, citation enforcement, y validation post-processing.

Familiaridad con frameworks de agentes multi-agente como AutoGen, CrewAI, o LangGraph para orquestar workflows complejos.

Desarrollo de Software y Arquitectura: Sólidas habilidades de programación en Python con experiencia en desarrollo de aplicaciones escalables. Conocimiento de patrones arquitectónicos (microservicios, event-driven), APIs RESTful, y mejores prácticas de ingeniería de software (testing, CI/CD, version control).

MLOps y Despliegue en Producción: Experiencia implementando pipelines de ML en producción incluyendo model serving, monitoring, logging, y continuous evaluation. Familiaridad con containerización (Docker), orchestration (Kubernetes), e infrastructure as code (Terraform).

Plataformas Cloud y Servicios de IA: Experiencia práctica con servicios cloud de AI/ML en AWS (Bedrock, SageMaker), Google Cloud (Vertex AI), o Azure (OpenAI Service). Conocimiento de compute, storage, networking, y managed services.

Data Engineering y Procesamiento: Experiencia procesando datos no estructurados (PDFs, documentos, HTML), estructurados (bases de datos, APIs), y semi-estructurados. Conocimiento de ETL/ELT, data pipelines, y herramientas de procesamiento (pandas, Apache Spark).

Evaluación y Testing de Sistemas GenAI: Experiencia implementando frameworks de evaluación para sistemas GenAI usando métricas automáticas, evaluación humana, y benchmarking. Conocimiento de métricas de retrieval (precision, recall, MRR, NDCG) y métricas de generación (BLEU, ROUGE, BERTScore).

Seguridad y Compliance: Conocimiento de security best practices en GenAI incluyendo prompt injection defense, PII protection, access control, y audit logging. Familiaridad con regulaciones de privacidad (GDPR, CCPA) y su aplicación en sistemas de IA.

Habilidades de Comunicación Técnica: Capacidad excepcional para comunicar conceptos técnicos complejos a audiencias diversas, presentar arquitecturas y trade-offs a stakeholders ejecutivos, y crear documentación técnica clara y comprensiva.

Mentalidad de Producto y Foco en Negocio: Capacidad para traducir requisitos de negocio en soluciones técnicas, definir métricas de éxito alineadas con objetivos empresariales, y optimizar soluciones para maximizar ROI y valor del cliente.

Experiencia Trabajando con Clientes: Experiencia en consultoría técnica o roles customer-facing, con habilidad para realizar discovery sessions, manejar expectativas, y comunicar riesgos y oportunidades de manera transparente.

Inglés Avanzado: Capacidad para comunicarse efectivamente en inglés técnico, tanto verbal como escrito, para colaboración con equipos internacionales y lectura de documentación técnica.


Habilidades deseables

Experiencia con modelos open-source (Llama 3, Mistral, Falcon) y self-hosted deployments usando vLLM, TGI, o Ollama.

Conocimiento profundo de técnicas avanzadas de RAG como HyDE (Hypothetical Document Embeddings), query decomposition, multi-query retrieval, parent document retrieval, y contextual compression.

Experiencia con fine-tuning de LLMs usando técnicas eficientes como LoRA, QLoRA, o PEFT para adaptar modelos a dominios específicos.

Experiencia implementando GraphRAG o Knowledge Graph-augmented RAG para razonamiento sobre relaciones complejas entre entidades.

Conocimiento de técnicas de model compression, quantization (GGUF, GPTQ), y optimization para reducir latencia y costos.

Experiencia con herramientas de observabilidad especializada para GenAI como LangFuse, LangSmith, Weights & Biases (W&B), Arize, o Phoenix.

Certificaciones en cloud platforms (AWS Solutions Architect, Google Cloud Professional ML Engineer) o certificaciones específicas de GenAI/LLM.

Background en research de NLP/ML con publicaciones o contribuciones a proyectos open-source de GenAI.

Experiencia implementando responsible AI practices incluyendo fairness testing, bias detection, explainability, y AI governance frameworks.

Conocimiento de técnicas avanzadas de prompt optimization como DSPy, automatic prompt engineering, o prompt compression.

Experiencia con multimodal LLMs (GPT-4 Vision, Gemini Pro Vision, Claude 3) para procesar imágenes, audio, o video junto con texto.

Beneficios

  • 💻 Trabajo 100% remoto con horario alineado a CST.
  • 🏖️ PTO ilimitado: Confiamos en que gestionarás tu tiempo de manera efectiva.
  • 🎓 Presupuesto anual para desarrollo: Acceso a cursos, certificaciones y conferencias.
  • 🛠️ Presupuesto para equipamiento: Configura tu espacio de trabajo remoto ideal.
  • 💰 Bonos semestrales por desempeño: Reconocemos y recompensamos tu impacto con incentivos económicos.
  • 🩺 Beneficio de salud: Acceso a cobertura médica privada o subsidios para seguro médico.
  • 🚀 Oportunidades de crecimiento: Plan de carrera y mentoría con expertos en IA y tecnología.
  • 🚀 Ambiente de startup dinámico y flexible: Autonomía para tomar decisiones y proponer ideas, con un enfoque en resultados en lugar de horas trabajadas.
  • ⚖️ Balance vida-trabajo: Cultura que prioriza la flexibilidad y el bienestar, permitiéndote gestionar tu tiempo sin sacrificar tu vida personal.

¡Te invitamos a postularte!

Incluso si no cumples con todos los requisitos, valoramos experiencias y perspectivas diversas. Si te apasiona el reclutamiento y quieres crecer en una empresa enfocada en datos e IA, ¡nos encantaría conocerte!


CreAI
CreAI

0 applies

0 views

There are more than 50,000 engineering jobs:

Subscribe to membership and unlock all jobs

Engineering Jobs

60,000+ jobs from 4,500+ well-funded companies

Updated Daily

New jobs are added every day as companies post them

Refined Search

Use filters like skill, location, etc to narrow results

Become a member

🥳🥳🥳 452 happy customers and counting...

Overall, over 80% of customers chose to renew their subscriptions after the initial sign-up.

To try it out

For active job seekers

For those who are passive looking

Cancel anytime

Frequently Asked Questions

  • We prioritize job seekers as our customers, unlike bigger job sites, by charging a small fee to provide them with curated access to the best companies and up-to-date jobs. This focus allows us to deliver a more personalized and effective job search experience.
  • We've got over 200,000 jobs from 15,000+ vetted companies. No fake or sleazy jobs here!
  • We aggregate jobs from 15,000+ companies' career pages, so you can be sure that you're getting the most up-to-date and relevant jobs.
  • We're the only job board *for* software engineers, *by* software engineers… in case you needed a reminder! We add thousands of new jobs daily and offer powerful search filters just for you. 🛠️
  • Every single hour! We add 2,000-3,000 new jobs daily, so you'll always have fresh opportunities. 🚀
  • Typically, job searches take 3-6 months. EchoJobs helps you spend more time applying and less time hunting. 🎯
  • Check daily! We're always updating with new jobs. Set up job alerts for even quicker access. 📅

What Fellow Engineers Say