Francisco Sánchez Noguera

Ingeniero Senior de Plataformas de Datos

📍 España (Remoto)

Ingeniero de Software con más de 6 años de experiencia en ingeniería de datos, ingeniería de plataformas y sistemas distribuidos. Experto en Python, Spark, Terraform y Azure — desde la optimización de jobs que ahorraron al cliente más de 100k EUR/año hasta el aprovisionamiento de más de 300 plataformas de datos a escala.

Experiencia Laboral

Ingeniero Senior de Software

BASF

enero de 2025 — Presente

Contratación interna liderando la ingeniería de plataforma para una nueva plataforma de datos combinando Azure, AKS, Databricks e infraestructura como código con CDKTF y Terraform.

Liderando el despliegue de Databricks y Unity Catalog en la nueva plataforma basada en CDKTF, contribuyendo la mayor parte de los constructos de infraestructura
Diseñé un proceso de migración de estado sin downtime permitiendo la importación de recursos en más de 300 plataformas sin impacto en los usuarios
Resolví un incidente crítico en producción en 1 hora auditando tablas de Unity Catalog y revirtiendo cambios de configuración, previniendo la paralización del procesamiento de datos en todas las plataformas
Definí la arquitectura de control de acceso basado en roles mediante ADRs e implementé los permisos en el portal y la infraestructura
Colaboré con arquitectos en el diseño de la topología de red de la nueva plataforma
Implementando la ingesta de logs y métricas en múltiples clústeres usando Grafana OSS, configurando collectors Alloy, receivers y pipelines de scraping

TerraformCDKTFTypeScriptPythonKubernetesAzureDatabricksUnity CatalogGitHub Actions

Ingeniero Senior de Datos

Capitole Consulting (Cliente: BASF)

marzo de 2023 — diciembre de 2024

Consultor liderando dos grandes proyectos en BASF: entrega de una plataforma de datos analíticos de cosmética, y posteriormente desarrollador principal de la infraestructura de aprovisionamiento de plataformas de datos Azure para más de 300 workspaces.

Entregué un release de analítica de cosmética previsto a 12 meses en menos de 6 meses usando arquitectura Medallion con procesamiento Delta Lake
Lideré la refactorización del código de aprovisionamiento de plataformas (Terraform + Python), mejorando la tasa de éxito de los pipelines del 20% al 90% y reduciendo el tiempo de ejecución de 1.5 horas a 30 minutos
Reduje el aprovisionamiento de plataformas de 4 horas a 20 minutos orquestando workflows de GitHub Actions con Terraform para infraestructura y Python para configuración
Construí una API REST con FastAPI y Container App Jobs para operaciones federadas en la Account de Databricks
Orquesté el despliegue de Unity Catalog en más de 300 workspaces de Databricks con solo un 1% de tasa de incidencias
Lideré un equipo de 5 ingenieros, incrementando la cobertura de tests del 10% al 85% mediante revisiones de código, pair programming y buenas prácticas de Python
Realicé ~30 entrevistas técnicas para posiciones de Ingeniero Senior de Datos, resultando en 6 contrataciones
Gestioné la Comunidad de Datos en Capitole: newsletter quincenal, meetups y charlas técnicas alcanzando a más de 100 ingenieros de datos

PythonTerraformAzure DevOpsAzure DatabricksDelta LakeUnity CatalogFastAPIDockerGitHub Actions

Desarrollador Big Data

Kenmei Technologies

enero de 2022 — marzo de 2023

Ascendido al departamento de Big Data, procesando conjuntos masivos de datos de telecomunicaciones con Scala y PySpark en Google Dataproc y Azure Databricks.

Optimicé un pipeline de datos PySpark de 20 horas a 4 horas (-80%), ahorrando al cliente más de 100k EUR anuales en costes de clúster
Llevé el algoritmo de detección de Interferencia Uplink a producción con PySpark distribuido, reduciendo la ejecución de 60 minutos (nodo único) a 6 minutos (-90%)
Construí un producto de clasificación geoespacial con Scala y Sedona, categorizando tiles como indoor/outdoor en países enteros
Mantuve y extendí CallTraces — un sistema complejo de procesamiento de trazas en tiempo real con Scala/Spark con una base muy reducida de contribuidores, contribuyendo a la implementación para 5G

ScalaPySparkGoogle DataprocAzure DatabricksDelta LakeAzure Blob StorageBigQuerySedona

Ingeniero Junior de Innovación

Kenmei Technologies

junio de 2019 — enero de 2022

Ingeniero de I+D trabajando directamente con el CTO en proyectos individuales para clientes de telecomunicaciones, construyendo servicios Python de alto rendimiento y algoritmos de procesamiento de señal.

Construí un servicio de geolocalización de drones en tiempo real logrando más de 100 geolocalizaciones/segundo (16× el objetivo del cliente) usando vectorización NumPy y MQTT asíncrono
Desarrollé un servidor TCP de alto rendimiento procesando ~550 Mb/s con Cython y Numba, alcanzando un rendimiento superior a la capacidad de la interfaz de red
Creé mapas de cobertura distribuidos con particionamiento espacial en Dask, reduciendo el procesamiento a nivel de país de 4 horas a 35 minutos (-85%)
Diseñé un algoritmo de detección de Interferencia Uplink usando FFT y métricas RSRQ/SINR para identificación de patrones PIM — posteriormente productivizado a escala en Big Data
Recibí reconocimiento del CTO de un importante cliente de telecomunicaciones por la calidad de entrega del proyecto

PythonNumPyNumbaCythonDaskPySparkMQTTAsyncioPostgreSQL

Habilidades

Lenguajes

Pythonexpert

Scalaadvanced

TypeScriptadvanced

Goadvanced

Bashadvanced

Ingeniería de Datos

Apache Spark / PySparkexpert

Delta Lakeexpert

Databricksexpert

Unity Catalogexpert

Daskadvanced

BigQueryadvanced

Cloud e Infraestructura

Azureexpert

Terraform / CDKTFexpert

Kubernetesadvanced

Dockeradvanced

GitHub Actionsadvanced

Azure DevOps Pipelinesadvanced

Backend y APIs

FastAPIadvanced

PostgreSQLadvanced

Diseño de APIs RESTadvanced

Asyncioadvanced

Observabilidad y Calidad

Prometheus / Grafanaadvanced

Pytest / Testing Unitarioexpert

Código Limpio / Arquitecturaadvanced

Pipelines CI/CDadvanced

Certificaciones

Databricks Certified Data Engineer Professional

Databricks

Issued: 2026-01 · Expires: 2028-01

Verify credential →

Certified Kubernetes Application Developer (CKAD)

The Linux Foundation

Issued: 2025-06 · Expires: 2027-06

Databricks Certified Associate Developer for Apache Spark 3.0

Databricks

Issued: 2024-09

AWS Certified Cloud Practitioner

Amazon Web Services

Issued: 2024-06 · Expires: 2027-06

Microsoft Certified: Azure Fundamentals (AZ-900)

Microsoft

Issued: 2024-03

Formación

Máster Habilitante in Ingeniería de Telecomunicaciones

Universitat Politècnica de València

Graduated: 2019-06-15

Grado in Ingeniería de Telecomunicaciones

Universitat Politècnica de València

Graduated: 2018-06-15

CubeSats Concurrent Engineering Workshop in Diseño de Sistemas Satelitales

European Space Agency (ESA)

Graduated: 2019-06-15

Proyectos Personales

Pizza API y Terraform Provider

API REST construida con Go y el framework Gin con autenticación, más un proveedor de Terraform personalizado usando el Terraform Plugin Framework para gestionar recursos a través de la API.

GoGinTerraform Plugin Framework

Ver Proyecto →

Contacto

🔗GitHub 💼LinkedIn ✉️Email 🌐Website