Lead Data Engineer (H/F)
Spécialisés dans les solutions médicales connectées, nous développons des technologies de pointe pour améliorer la qualité de vie des patients et faciliter le travail des professionnels de santé.
Reconnue comme l’une des start-ups les plus innovantes dans l’écosystème de la e-santé, Bioserenity développe des dispositifs médicaux connectés, des solutions de coordination des soins et des algorithmes d'IA de pointe. Rejoindre Bioserenity, c'est contribuer à des projets à fort impact, à l’intersection des défis médicaux et des technologies innovantes.
Notre équipe Data Science (plus de 15 membres) développe des algorithmes IA de diagnostic pour la neurologie et la médecine du sommeil. Au sein de cette équipe, vous travaillerez sur un pipeline de dispositifs médicaux marqués CE, faisant le lien entre la recherche et les applications cliniques concrètes.
Missions
En tant que Lead Technique vous collaborerez quotidiennement avec un data ingénieur, des data scientists et des équipes interfonctionnelles (Dev/Ops, IoT…). Votre mission principale : créer, maintenir et optimiser une plateforme de stockage de données qui alimente nos initiatives en matière d'IA.
Gestion et optimisation de la plateforme de données
Normaliser et structurer les données : homogénéiser les formats, concevoir des ontologies et appliquer les meilleures pratiques afin de garantir la qualité et la cohérence des données.
Amélioration continue de la plateforme : mettre l'accent sur la sécurité, l'évolutivité, l'optimisation des coûts et les tableaux de bord (surveillance, traçabilité).
Gestion des versions des données : mettre en place des systèmes permettant de suivre l'évolution des ensembles de données et d'assurer une traçabilité complète (essentiel pour la conformité des dispositifs médicaux).
Développement de pipeline de transfert de données
Conception et maintenance de pipelines ETL automatisés pour l’ingestion, le nettoyage et la transformation des données de santé.
Respect strict des normes RGPD, anonymisation et pseudonymisation des données sensibles, documentation exhaustive des processus.
Collaboration avec les équipes métiers pour intégrer de nouvelles sources de données et répondre aux besoins évolutifs.
Facilitation de l’accès aux données pour les data scientists
Création et gestion de datasets versionnés pour permettre des expérimentations reproductibles.
Assurer un transfert rapide et sécurisé des jeux de données massifs, avec un focus sur la performance et la fiabilité.
Adaptation de la plateforme aux besoins des data scientists : formatage, structuration, enrichissement des métadonnées, et support technique pour faciliter leurs travaux d’analyse et de modélisation.
Automatisation et leadership technique
Maintenance et amélioration des pipelines CI/CD pour garantir des déploiements fluides et sécurisés.
Déployer des outils de surveillance (tableaux de bord, alertes) pour garantir la stabilité de l'ETL.
Industrialiser les déploiements des infrastructures data et des outils associés
Conseil technique : assurer la cohérence entre les différents modules du projet et fournir un accompagnement technique aux collaborateurs plus juniors (révision du code, meilleures pratiques, conseils en matière d'architecture).
L’équipe Data gère les projets de manière end-to-end (besoins utilisateur, architecture, développement, QA, sécurité, déploiement, ops) avec une liberté technologique pour adapter les solutions.
Compétences et expérience
Expertise technique
Programmation : Python (niveau avancé), Git/GitLab CI.
Cloud et Big Data : AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
Orchestration : Airflow, Terraform.
Bases de données : MongoDB ; expérience avec des solutions de stockage à grande échelle.
Standards du web : API REST, protocoles HTTP/ HTTPS.
Compétences relationnelles
Rigueur scientifique et esprit orienté vers la résolution de problèmes.
Capacité à combler les écarts entre la science des données, le développement/les opérations et les ingénieurs logiciels.
Capacité à créer une documentation technique claire et conforme aux normes.
Expérience
Plus de 7 ans d'expérience en tant qu'ingénieur de données, dont plus de 2 ans en tant que responsable technique/senior.
Connaissance des enjeux de cybersécurité et de conformité (essentielle pour les données médicales).
Maîtrise de l'anglais technique (l'équipe et les parties prenantes sont internationales).
Optionnel
MLOps: Expérience pratique de la gestion du cycle de vie complet du ML, y compris l'orchestration, le déploiement et la surveillance des pipelines.
Connaissance des certifications CE/FDA pour les logiciels/algorithmes.
Données de santé: expérience pratique des signaux électrophysiologiques (EEG, ECG, EMG) ou des données cliniques.
Infrastructure : Linux, conteneurisation (Docker, ECR).
Pourquoi nous rejoindre
Impact : Travaillez sur des technologies médicales qui changent la vie et ont des résultats directs sur les patients.
Innovation : façonner l'avenir de la neurologie et du diagnostic du sommeil grâce à l'IA.
Croissance : Prendre des décisions techniques clés au sein d’une entreprise de 200+ collaborateurs, alliant agilité startup et expertise sectorielle.
Stack technique : Outils modernes (voir ci-dessus) avec une flexibilité pour proposer de nouvelles solutions.
Bioserenity is recognized as one of the most innovative startups in the digital health ecosystem, developing connected medical devices, care coordination solutions, and cutting-edge AI algorithms. Joining Bioserenity means contributing to high-impact projects at the intersection of medical challenges and advanced technology.
Our Data Science team (15+ members) drives product development by designing diagnostic algorithms (signal processing, deep learning) for neurology and sleep medicine. As part of this team, you’ll work on a CE-marked medical device pipeline, bridging research and real-world clinical applications.
Key responsabilities
As Lead Data Engineer, you’ll collaborate daily with a Data Engineer, Data Scientists, and cross-functional teams (Dev/Ops, IoT, Hardware). Your core mission: build, maintain, and optimize a data lake platform that powers our AI initiatives.
Data platform management & optimization
Standardize and structure data: homogenize formats, design ontologies, and enforce best practices to ensure data quality and consistency.
Continuous platform improvement: Focus on security, scalability, cost optimization, and metadata/dashboarding (monitoring, traceability).
Data versioning: Implement systems to track dataset evolution and ensure full traceability (critical for medical device compliance).
Data pipeline development
Design and maintain automated ETL pipelines for ingestion, cleaning, and transformation of healthcare data (EEG, clinical records, etc.).
Ensure strict GDPR compliance: anonymize/pseudonymize sensitive data and document all processes.
Partner with business teams to integrate new data sources and adapt to evolving needs.
Enabling Data Science Workflows
Create and manage versioned datasets to support reproducible experiments.
Optimize large-scale data transfers (performance, reliability) for ML modeling.
Adapt the platform to Data Scientists’ needs: formatting, metadata enrichment, and technical support.
Automation & Technical Leadership
Maintain and enhance CI/CD pipelines for seamless, secure deployments.
Deploy monitoring tools (dashboards, alerts) to ensure ETL stability.
Industrialize data platform deployments and associated tools.
Technical guidance: ensure coherence across project modules and provide technical mentorship to junior engineers (code reviews, best practices, architectural guidance).
Our projects are end-to-end owned (user needs → architecture → deployment → ops), with open technological choices to fit evolving challenges.
Skills & Experience
Technical Expertise:
Programming: Python (advanced), Git/GitLab CI.
Cloud & Big Data: AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
Orchestration: Airflow, Terraform.
Databases: MongoDB; experience with large-scale storage solutions.
Web Standards: REST APIs, HTTP.
Soft Skills:
Scientific rigor and problem-solving mindset.
Bridge gaps between Data Science, Dev/Ops, and software engineers.
Ability to create clear, compliance-ready technical documentation.
Experience:
7+ years as a Data Engineer, including 2+ years as a Senior/Tech Lead.
Cybersecurity awareness (critical for medical data).
Fluent technical English (team and stakeholders are international).
Preferred
MLOps: Hands-on experience with end-to-end ML lifecycle management, including pipeline orchestration, deployment, monitoring.
Regulatory Knowledge: Familiarity with CE/FDA certification for software/algorithms.
Healthcare Data: Hands-on experience with electrophysiological signals (EEG, ECG, EMG) or clinical data.
Infrastructure: Linux, containerization (Docker, ECR).
Why Join Us?
Impact: Work on life-changing medical technologies with direct patient outcomes.
Innovation: Shape the future of neurology and sleep diagnostics with AI.
Growth: Lead technical decisions in a multidisciplinary, 200+ person company with a startup mindset.
Tech Stack: Modern tools (see above) with flexibility to propose new solutions.
- Département
- TECHNIQUE
- Poste
- DATA
- Localisations
- Siège Social - Paris
- Statut à distance
- Hybride
- Nombre de poste à pourvoir
- 1
À propos de BIOSerenity
Nous sommes BIOSerenity, une MedTech française fondée en 2014 à l’ICM (Pitié-Salpêtrière) qui développe des solutions innovantes pour améliorer la prise en charge des patients en neurologie, cardiologie et troubles du sommeil. Alliant dispositifs médicaux connectés, intelligence artificielle et coordination des soins, nos produits sont utilisés par plus de 200 hôpitaux et 9 000 professionnels de santé. Nous réunissons des équipes pluridisciplinaires engagées pour une médecine plus accessible et efficace.
Vous travaillez déjà chez BIOSerenity ?
Recrutons ensemble pour trouver votre prochain collègue.