Skip to main content

Dataset de consum i generació energètica per hora

(Hourly Energy Community Dataset)

Propòsit del dataset

Aquest dataset actua com a servei de dades base per a l'execució dels algoritmes d'anàlisi energètica (Anàlisi de Comunitats, Anàlisi per Perfils, Estadístiques Bàsiques i Detecció d'Anomalies).

El seu objectiu és proporcionar una imatge precisa, acotada i operativament eficient del comportament energètic d'un conjunt de punts de subministrament, permetent anàlisis agregades, comparatives i diagnòstiques sense necessitat d'exposar grans volums de dades ni informació sensible.

El dataset està dissenyat específicament per al seu ús en un model Compute-to-Data, on les dades romanen en un entorn segur i només són accessibles per algoritmes autoritzats.


Abast i consideracions tècniques

Atès que el volum històric de dades disponible és elevat (≈3 GB), el dataset no retorna la totalitat de la informació, sinó una vista optimitzada i filtrada que compleix els criteris següents:

  • Dades filtrades per un mes concret
  • Resolució hora a hora
  • Inclusió exclusiva dels camps necessaris per als algoritmes MVP
  • Sense exportació de dades innecessàries o no utilitzades en l'anàlisi

Aquest enfocament redueix costos computacionals, millora els temps d'execució i minimitza els riscos d'exposició de dades.


Tipus de dataset

  • Dataset privat
  • No descarregable
  • Accessible únicament per algoritmes autoritzats
  • Executat sota polítiques de Compute-to-Data

L'accés humà directe al dataset no està permès; només es generen sortides derivades i agregades a través dels algoritmes.


Contingut del dataset

El dataset conté dades energètiques per hora associades a punts de subministrament elèctrics.

Tipus de dades incloses

  • Consum energètic horari
  • Generació energètica horària (quan aplica)
  • Exportació d'excedents (quan aplica)

Cada registre representa el comportament energètic d'un punt de subministrament en una hora concreta.


Identificació dels punts de subministrament

Les dades estan associades a identificadors de punt de subministrament:

  • CUPS (Codi Universal de Punt de Subministrament)
  • Els CUPS poden estar anonimitzats o pseudonimitzats si el context ho requereix
  • No s'inclouen dades personals ni identificadors directes de titulars

Això permet anàlisis comparatives i agregades sense comprometre la privacitat.


Format del dataset

El dataset s'estructura en un format tabular, optimitzat per a l'anàlisi algorítmica.

Estructura general (exemple conceptual)

CampDescripció
cups_idIdentificador del punt de subministrament (anonimitzat si aplica)
timestampData i hora del registre (resolució horària)
energy_consumed_kwhEnergia consumida en aquesta hora (kWh)
energy_generated_kwhEnergia generada en aquesta hora (kWh, si existeix)
energy_exported_kwhEnergia exportada a xarxa (kWh, si existeix)

No tots els camps són obligatoris en tots els registres; el dataset admet valors nuls segons el tipus de subministrament.


Què representa cada camp

  • cups_id
    Identifica de manera única un punt de subministrament dins del dataset. No permet identificar directament persones o entitats.

  • timestamp
    Marca temporal horària que permet anàlisi de sèries temporals, detecció de patrons i comparació entre períodes.

  • energy_consumed_kwh
    Quantitat d'energia consumida durant l'hora indicada.

  • energy_generated_kwh
    Quantitat d'energia generada localment (per exemple, fotovoltaica), si aplica.

  • energy_exported_kwh
    Part de l'energia generada que s'aboca a la xarxa com a excedent.


Relació amb els algoritmes

Aquest dataset està dissenyat exclusivament per alimentar els algoritmes:

  • Anàlisi de Comunitats Energètiques
    → agregació comunitària, percentils, balanços consum–generació

  • Anàlisi per Perfils
    → comparació de cada punt amb el seu grup de referència

  • Estadístiques Bàsiques
    → totals, mitjanes, màxims, mínims, dimensió del sistema

  • Detecció d'Anomalies
    → pics de consum, inactivitat tècnica, exportacions inusuals

Cada algorisme consumeix només els camps necessaris, sense accedir a informació addicional.


Seguretat i govern del dada

  • Les dades no surten de l'entorn segur
  • No es permet la descàrrega del dataset
  • Els algoritmes només retornen:
    • mètriques agregades
    • estadístiques
    • indicadors derivats

Aquest disseny garanteix el compliment amb:

  • principis de minimització de dades
  • governança de dades energètiques
  • requisits de privacitat i confidencialitat

Resum

Aquest dataset proporciona una vista horària, mensual i optimitzada del consum i la generació energètica associada a punts de subministrament. Està dissenyat com un servei de dades privat per a algoritmes Compute-to-Data, incloent només la informació necessària per a anàlisis agregades, comparatives i de diagnòstic. La seva estructura permet obtenir valor tècnic i operatiu de manera ràpida, segura i escalable, sense exposar dades sensibles ni grans volums d'informació.