Skip to content

Registrere dataprodukt

Etter at teamet har laget BigQuery-tabellene med analytiske data, kan disse registreres på Datamarkedsplassen. Dette gjøres ved at man registrerer datasettet som del av et dataprodukt.

I: Dataprodukt

Dataproduktet er en samling av et eller flere datasett som naturlig hører sammen. Teamet velger selv hvilke tabeller som naturlig hører sammen, men tabellene må være i samme GCP-prosjekt. Dataprodukter registreres på Datamarkedsplassen under Legg til nytt dataprodukt i headeren. Der oppgis navn, beskrivelse, team i Teamkatalogen samt kontaktpunkt til teamet.

II: Datasett

Datasett legges til ved at man klikker seg inn på et dataproduktDatamarkedsplassen. Under Legg til datasett kan man registrere den aktuelle tabellen fra BigQuery sammen med metadata som gjør det enklere for teamet å beholde oversikten. Metadata gjør det også enklere for folk utenfor teamet å finne dataene. Beskrivelser av kolonnene i tabellen kan legges inn i BigQuery-konsollet. Metadata fra BigQuery (blant annet tabellskjema) synces med Markedsplassen èn gang i timen.

I Markedsplassen vil vi kun vise den metadataen som er i BigQuery. Ettersom views ikke får skjemaet sitt oppdatert i BigQuery som beskrevet her så vil heller ikke oppdateringer i skjemaet for views vises i Markedsplassen. For å trigge en oppdatering av skjemaet for et view i BigQuery er man avhengig av å oppdatere selve viewet.

Pseudonymisering av tabeller

Team har ofte data om enkeltpersoner der vi trenger identifikatorer for å kunne koble tabeller sammen og følge personer over tid. Vi tilbyr en løsning for å registrere BigQuery-view der valgte kolonner pseudonymiseres. Pseudonymiserte views baserer seg på en hvilken som helst BigQuery-tabell/view i teamets prosjekt. Ved registrering av datasett, kan du velge å pseudonymisere tabellen. Du må velge minst èn kolonne som skal pseudonymiseres. Vi oppretter et eget view i et separat BigQuery-dataset i teamets prosjekt. Her opprettes view der kolonnene er pseuodnymisert. Kolonnene pseudonymiseres med SHA256-algoritmen og en tilfeldig verdi som er forskjellig for hver tabell. Metadata som vises på Markedsplassen inneholder adressen til det pseudonymiserte viewet.

Til tross for at tabellene pseudonymiseres med forskjellige verdier, kan de likevel kobles sammen gjennom en tjenesten vi tilbyr for å koble sammen pseudonymiserte tabeller.