Guía rápida: Costes Canónicos
Esta guía está pensada para un economista de la salud que se acaba de incorporar al equipo. En 5 minutos vas a entender qué resolvemos, cómo lo representamos en datos y cómo usar cada pestaña de la aplicación.
1 · El problema que resolvemos
Cada Comunidad Autónoma publica anualmente sus precios sanitarios en boletines oficiales. El problema: el mismo servicio aparece escrito de formas distintas en cada CCAA.
| Aparece en boletines como… | Realmente es… |
|---|---|
MAMOGRAFÍA
,
Mamografia bilateral
,
Estudio mamográfico
,
Pruebas de imagen de mama
|
Mamografía diagnóstica |
Cefalea
,
Cefálea
,
CEFALEA
,
dolor de cabeza
|
Cefalea |
Sin una capa que agrupe variantes en un concepto único, preguntar "¿cuánto cuesta una mamografía en España?" no tiene respuesta correcta. Esta capa es la que llamamos "concepto canónico" .
2 · ¿Qué es un "coste canónico"?
Un canonical es un agrupador que conecta todos los textos distintos de los boletines que se refieren al mismo servicio sanitario, con una etiqueta limpia y una categoría propia de Weber.
Textos raw del boletín (origen heterogéneo)
MAMOGRAFÍA BILATERAL
Estudio mamográfico
Pruebas de imagen de mama
Mamografia (proyección craneo-caudal)
Concepto canónico (curado, único)
Mamografía diagnóstica
3 · El recorrido del dato
Cada precio que ves en la app ha pasado por varias capas. De PDF en bruto a número agregado a nivel de canonical:
PDF oficial
BOE / BOJA / DOE / etc. Cada CCAA publica anualmente.
Tabla
boletines
Cada línea-precio extraída del PDF. ~35 000 filas raw, una por (texto literal, CCAA, año).
Catálogo canónico
El analista agrupa variantes en canonicals con etiqueta limpia y categoría.
Costes Canónicos
Precio por (canonical × CCAA × año). Es lo que ves en la pestaña principal: mapas, ranking, evolución.
4 · Glosario de términos
Los términos que vas a oír todos los días.
Canonical
Concepto sanitario curado por un humano (p.ej. "Hemodiálisis (sesión)"). Es un agrupador de variantes raw.
Variante (concepto raw)
Texto literal tal como aparece en un boletín. Forma parte de un canonical (un canonical = N variantes).
CCAA / NUTS2
Comunidad Autónoma. Se identifica con su código NUTS2 (ES11 Galicia, ES61 Andalucía, etc.). 19 códigos posibles.
Categoría del Recurso Sociosanitario
Taxonomía propia de Weber para agrupar canonicals (Analíticas, Pruebas de imagen, Consultas AP…). Editable por admin.
Factor de actualización
Multiplicador aplicable a un (CCAA, año): IPC, peso propio, acuerdo bilateral. Permite actualizar un precio publicado.
Origen 'Excel'
Canonical heredado del trabajo pre-app del equipo (los Excel históricos del Ministerio, 2019-2025). 356 canonicals hoy.
Origen 'humano_creado'
Canonical creado desde el Explorador agrupando variantes raw del corpus de boletines.
Mediana nacional
Mediana de los precios del canonical sobre todas las CCAA. Es la métrica de referencia que mostramos.
Boletín
Documento oficial donde una CCAA publica sus precios. Una misma CCAA × año puede tener varios (p.ej. Asturias 2025 tiene 4).
5 · Las 4 pestañas y cuándo usar cada una
| Pestaña | ¿Para qué sirve? | Caso de uso típico |
|---|---|---|
| Costes Canónicos | Vista analítica principal. KPIs, mapa de España, ranking por CCAA y evolución temporal de un canonical concreto. | "¿Cuánto cuesta una mamografía? ¿En qué CCAA es más cara?" |
| Explorador | Búsqueda semántica (SapBERT) o por palabras sobre las ~35 000 variantes raw de los boletines. Marcas las variantes que pertenecen a un mismo concepto y creas un nuevo canonical. | "Quiero crear el canonical 'TAC abdominal con contraste'." |
| Catálogo | Lista completa de canonicals (363 hoy). Renombrar, recategorizar o eliminar. Para cada uno ves su mediana, CCAAs cubiertas y variantes. | "Quiero arreglar el nombre de un canonical mal puesto." |
| Ajustes (admin) | Mantenimiento de la taxonomía: categorías propias de Weber y factores de actualización (IPC, pesos por CCAA). | "Necesito añadir un nuevo factor IPC 2025 para Cataluña." |
README.md
del repositorio, que tiene el detalle
técnico de cada tabla y flujo.