CROW | Linked Data Platform – In het donkere bomenbos met alle termen

Hoi allemaal,

Daar ben ik weer. Na een serie enthousiaste reacties moest ik me wel aan mijn belofte houden om een nieuwe blog te schrijven. Ik heb jullie beloofd om minstens uit te leggen wat Linked Data, SPARQL-endpoint, Publicist, LDP, RDF-OWL, CSPEC, producent, CDOC, open data, objecttypebibliotheken, Producent, open standaarden, turtle-file, autorisatie, API, Consument, ProContract, aanleverspecificaties, Linked Data Platform, BIM,….. - o jee, met die puntjes heb ik de lijst eindeloos gemaakt! Vorige keer heb ik al een hele blog gebruikt voor vier termen: Producent, data, dataset en Linked data. Even nog wat modieuze termen erbij: OTL, ILS, DigidealGO. Anders verlies ik de wedstrijd met mijn collega’s, voor de blog met de meeste hits!

Voor ik begin met de beloofde maar o zo droge informatie over de Publicist en de Aanleverspecificaties moet ik helaas nog even terugkomen op het woord Linked data. Inmiddels heb ik weer bijgeleerd…. praten over Linked data is niet voldoende. De overtreffende trap van Linked data is het Semantisch web; Paarden me Englisch. Die term heeft me geleid richting heerlijke tegenstrijdige toelichtingen van experts op de toepasbaarheid van je data voor automatische interpretatie door computers (“interoperabiliteit”), en het bijbehorende “Semantische niveau” van je data.

Semantisch web

Zijn jullie er nog? Laat ik maar weer eens naar Wikipedia gaan:

Categorie:Semantiek De semantiek houdt zich bezig met de betekenis van symbolen (zoals de woorden in een taal).

Logica
+ } Semantiek
Semiotiek

O jee – zo kom je via taalkunde en filosofie bij logica uit. Ik denk dat ik wat broodkruimeltjes moet strooien, want dit lijkt me een bos waar ik zeker in ga verdwalen. Even terug. Wat ik de vorige keer heb opgeschreven over Linked data, blijkt eigenlijk een beschrijving te zijn van het Semantisch web. Met een middagje browsen door Wikipedia wordt het allemaal duidelijk, dat beloof ik plechtig en waarachtig.

De niveaus van bruikbaarheid van data

Na het raadplegen van verschillende experts, ben ik helemaal up to data. Er zijn 3 BIM niveaus; er zijn 4 niveaus van linked data in de bouw; er zijn 5 niveaus van Open Data; er zijn 6 levels van “conceptual operability”. Ik ga voor de 5 sterren van Tim Berners-Lee, de geestelijk vader van het internet. Deze zijn eigenlijk bedoeld voor beoordeling van Open data; in de betekenis van “vrij toegankelijk voor iedereen”. De data bij het CROW zijn niet vrij toegankelijk. Het ontwikkelen, beheren en publiceren van de data kost geld. Toch zijn de principes goed toepasbaar op onze data.

Ster Een ster. De publicaties in de kennisbank. Of andere documenten op onze website. Je kunt er vrij in zoeken met zoektermen, en de teksten die je vindt zijn goed te begrijpen voor een mens, maar niet voor een computer.

Ster Ster Twee sterren. De IMBOR-catalogus, en ook IMWV, in Acces. Gestructureerde data. Een computer kan deze data lezen en hergebruiken. Maar niet interpreteren, daar is een mens voor nodig. Je hebt betaalde software nodig om de gegevens te kunnen verwerken. Door menselijk ingrijpen zorgen we voor verbanden tussen bestanden, bijvoorbeeld door objecten overal dezelfde naam of code te geven.

Ster Ster Ster Drie sterren. De gegevens staan in een tabel, maar dan in een Open standaard (zoals CSV), zodat ze in elk softwarepakket gebruikt kunnen worden. Ik heb zo gauw geen voorbeeld bij het CROW.

Ster Ster Ster Ster Vier sterren. De CROW-Basisspecificaties op het Linked data platform. We gebruiken URI’s om dingen aan te duiden, zodat anderen naar onze data kunnen verwijzen. De data is daarmee bruikbaar in samenhang met andere bronnen.

Ster Ster Ster Ster Ster Vijf sterren. Ons Linked Data Platform is geschikt voor data op 5 sterren niveau. De data kan worden gelinkt aan andere data, om de context aan te geven. Bijvoorbeeld, hoe onze objectinformatie aansluit op die van het GWSW, of op concepten uit CB-NL. We gebruiken hierbij een datamodel, waardoor ook een computer het verband kan interpreteren en informatie kan afleiden. – Nu ik dit schrijf geef ik onze Basisspecificaties een vier-en-een-half: want ze zijn logisch gestructureerd volgens ons datamodel CSPEC.

Publicist

Terug naar het CROW als Publicist van Linked data. Publicist is makkelijk: wij publiceren datasets, op een Linked Data Platform. Oneerbiedig gezegd een server waar je als gebruiker de Linked data kan zoeken, als je tenminste een abonnement hebt en weet hoe je SPARQL-query’s moet doen. Op de achtergrond wordt dan de toegang tot de data geregeld met een code, en gelukkig hebben we daar weer een term voor: autorisatie. Hoe dit allemaal werkt, daar hebben we handleidingen voor, die helaas nu nog niet online staan maar binnenkort wel.

Aanleverspecificaties

Op het nippertje kom ik dan toch bij de Aanleverspecificaties. Met de technieken achter Linked data kun je alle kennis omzetten in data en alles met alles in een betekenisvol verband brengen. Als iedereen zijn eigen model gaat maken, met eigen betekenissen en definities, dan wordt het alsnog erg veel werk om de informatie uit verschillende bronnen aan elkaar te verbinden. Daarom hebben we een datamodel voor contractspecificaties (CSPEC). Hiermee kan je datasets maken voor UAV- en UAVgc-contracten, bijvoorbeeld om vraagspecificaties eisen op te stellen; of om toetsplannen te maken. Zo kan elke gemeente, provincie, waterschap of andere partij een eigen set eisen maken, en hoeven aannemers en ingenieursbureaus toch maar één keer te zorgen dat ze alle datasets kunnen inlezen. De Aanleverspecificaties zijn de technische beschrijving van hoe de data aangeleverd moet worden.

Maar… hoor ik jullie zeggen, contracten maken, dat is toch niet het enige? We willen data om te plannen, ontwerpen, bouwen, gebruiken, beheren, slopen; we willen kosten kunnen ramen, onderhoudsplannen maken, en verifiëren, en valideren, we willen we willen willen willen…. Ja ja, dat willen wij ook. En informatie uit onze kennisbank voor al deze zaken, daar willen we ook data voor maken. Daar moeten we alleen eerst nog een datamodel voor ontwikkelen. Work in progress….

Volgende keer: waarom is iedereen toch bezig met objecttypebibliotheken?

Nerd-elige hilse (DK), Elisabeth Klören