Categories
Events Linked (Open) Data

HackaLOD 2019

Op 29 en 30 november 2019 deed ik mee aan de HackaLOD 2019, een hackathon met als doel iets te doen met Linked Open Data uit de erfgoedsector. Het was mijn derde keer en hoewel sommige dingen hetzelfde waren als vorige keren, ging ik er met een heel ander gevoel heen en was de ervaring nog beter dan in de gevangenis en in de kerk. Dit is geen precies verslag van de HackaLOD — vier maanden na dato zou ik daar een beetje laat mee zijn — maar een persoonlijke reflectie.

Zonder team

Het was me niet gelukt om collega’s van de UBL mee te krijgen, dus anders dan in 2016 en 2018 was er geen Team UB Leiden. Je moet het ook maar willen en kunnen regelen met partner en eventueel kinderen, want na ruim anderhalf etmaal met weinig tot geen slaap ben je op zaterdagmiddag/-avond waarschijnlijk niet meer zo gezellig.

Voorafgaand was er mailcontact tussen teams en team-zoekenden en ik dacht een team te hebben gevonden in Team SOLID, maar toen het idee dat ze voor ogen hadden onhaalbaar bleek, trok het team zich terug. Jammer, want ik had graag iets gedaan met SOLID.

Inmiddels had ik een flinke lijst met ideeën die ik niet met collega’s hoefde af te stemmen (ook al zijn ideeën van collega’s soms ook goed voor de Publieksprijs) en was ik erg benieuwd naar ideeën van anderen, dus ik was niet bang om geen team te kunnen vinden.

Hetzelfde, maar dan anders

De organisatie van de HackaLOD bestond uit vertrouwde gezichten, hoewel enkele mensen vorige keer nog deelnemer waren. Zoals altijd was het eten en drinken goed verzorgd — dat is de voornaamste ‘tegenprestatie’ die deelnemers naast respect voor hun ideeën mogen verwachten in elke hackathon — de HackaLOD is absoluut geen bier-en-pizzahackathon.

Wat altijd anders is, is de locatie. Het doel is een ietwat alternatieve locatie om zonder veel afleiding van buiten te kunnen werken aan nieuwe ideeën en oplossingen. Mijn eerste keer was in een voormalige gevangenis in Utrecht, vorige keer in een voormalige kerk in Amsterdam (waar het slapen in de kelder door de kou nog minder comfortabel was dan het door de veldbedden al is). Deze keer was de locatie ver buiten de stad, in Radio Kootwijk! Hoewel telefoon- en internetbandbreedte hier minder groot zijn, biedt deze plek spectaculaire afleiding: de Kathedraal. ‘s Nachts moesten we binnen blijven omdat het gebied een stiltegebied is, maar ook om 21u is het pikdonker en kun je nachtfotografie oefenen.

Foto van de Kathedraal (het Zendgebouw) van Radio Kootwijk gemaakt met lange sluitertijd
Het Zendgebouw bij nacht

Buiten een rondje lopen in de kou (voor 23u of na 6u) was één manier om je af te leiden; binnen was er ook entertainment in de vorm van muziek-op-verzoek. Ooit was dat een mondharp in het kerkzaaltje van de gevangenis, nu waren het twee muzikanten met een hoop elektronica die om een uur of vier nog live wat techno voor mij geïmproviseerd, als muzikale boost. Heerlijk.

Wat langzaam verandert bij elke HackaLOD zijn de teams: niet alleen bij de organisatie zie je bekende gezichten, maar de samenstelling van mensen en kennis in teams verschuift. Natuurlijk zie je dat ook in wat er gepresenteerd wordt. In Utrecht was er nog een eenpersoons team met nauwelijks ervaring met Linked Data; de winnaar had een chatbot gemaakt. Nu merkte je dat het kennisniveau tussen teams minder verschilde en ook hoger lag. Ik vermoed dat het helpt dat eigenlijk alle data via betere (commerciële) platforms beschikbaar was, waarop je makkelijker kunt bouwen.

Dat er datasets zijn om mee te werken is logisch: het doel is om iets te doen met meerdere datasets. Terugkijkend is het wel gek om te constateren dat bijna alle datasets speciaal voor de HackaLOD leken te zijn verzameld. Natuurlijk is Wikidata een optie om te gebruiken en mag je zelf op zoek naar data, maar de datasets in ons project werden door Netwerk Digitaal Erfgoed gehost — niet door de eigenaars. Er zijn data, die data zijn open en er zijn links in de data. En toch zijn Linked Data nog geen standaard, zelfs niet in de erfgoedsector waarin ik mede door de beloften van Linked Data in terecht ben gekomen.

Ik kom nog terug op die observatie. Ik denk dat de GLAM-wereld terecht nog heel erg bezig is met het implementeren van Linked Open Data, maar ook dat de killer apps van Linked (Open) Data waarschijnlijk intern geen RDF-technieken gebruiken zoals SPARQL en het volgen van willekeurige links om meer data te vinden. Linked Data als platform voor data-uitwisseling is een prima doelstelling.

Niet te vergeten

Zonder team om direct mee van start te gaan moest ik wel gaan kennismaken met de verschillende teams en hun plannen horen. Dat had ik vorige keren ook moeten doen… Niemand doet mee om in het grootste geheim 20 uur aan iets te werken; men wil graag van elkaar leren of ten minste inspiratie opdoen. De grootste inspiratie komt daarbij uit de verhalen die deelnemers proberen te vertellen, niet uit de combinaties van datasets die willen gaan gebruiken.

Vorig jaar won ik met Saskia en Lucas in Team UB Leiden de publieksprijs voor het idee van een app Prentenmapper met een werkend prototype. Dat was niet de belangrijkste reden dat ik tijdens het avondeten op de vrijdagavond bij Team ExpLOD werd gevraagd, denk ik; waarschijnlijker was dat ik praktische kennis van Linked Data had. Ik heb dit vermoeden niet gecontroleerd en het maakt me ook niet uit — veel belangrijker is dat we een leuk team vormden. Met het team hebben we gebrainstormd en gadgets besproken, ethiek in collectievorming verkend en zijn we naar buiten gegaan, waardoor ik me niet bezwaard voelde om wat foto’s te maken.

In team ExpLOD 🤯 zaten meer mensen die elkaar niet van tevoren hadden gezien. Philo, Matus, Jorim, Edward en ik hadden samen gelukkig genoeg verbeelding en kennis om een installatie te verzinnen, te maken en te presenteren die niet alleen voldeed aan de eis om twee LOD-datasets te verbinden (een formaliteit, hoewel niet triviaal), maar ook het publiek het meest gunstig stemde.
Weer een publieksprijs, voor Unforgettable/Niet te vergeten!

Het was niet gemakkelijk geweest om zoiets in een korte tijd in elkaar te zetten. Ik ben nog steeds onder de indruk van de interface en de demo die net goed genoeg werkte (met meerdere laptops als infrastructuur) om het verhaal te vertellen dat zijn vorm had gekregen tussen het avondeten en het moment dat de jury ons als laatste team kwam kijken.

De zon komt langs de bomen door de ramen in de Theaterloods naar binnen
Zonneschijn na een nacht zonder slaap, terwijl we de laatste hand leggen aan Niet te Vergeten

Ik heb (te) lang zitten stoeien met mijn belangrijkste taak, het verbinden van de data van het Rijksmuseum en die van de Nederlandse Musea van Wereldculturen (NMVW). Slaapgebrek en tijdsdruk helpen mij nooit bij het snel tot oplossingen komen. Het volkomen onterechte gevoel dat ik zelf een slimme oplossing moet verzinnen, terwijl er veel meer mensen met (veel) meer LOD-ervaring waren dan ik, hielp ook niet.
Als je dan ontdekt dat het Rijksmuseum en NMVW vergelijkbare aspecten in collectiebeschrijvingen (wanneer is iets gemaakt? waar komt het vandaan? waar is het van gemaakt?) op heel verschillende manieren in RDF aanbieden, lijkt het ideaal van Linked Open Data heel ver weg.

Op dat moment had ik moeten beseffen dat data wrangling een wezenlijk onderdeel is van de HackaLOD. Net als vorige keer, toen Saskia uren bezig is geweest met het normaliseren van namen van kerken die in verschillende spellingen in bijschriften van topografische prenten stonden.
Na afloop heb ik zitten spelen met LinkedPipes ETL om een verrijkte dataset te maken van ‘onze’ twee datasets. Als ik nou wat meer ervaring met dit soort ETL-tools voor Linked Data had gehad…
Gelukkig had ik genoeg ervaring met mijn eigen servertje, om Docker, Traefik, GitHub en Let’s Encrypt te gebruiken om iteratief te werken aan de backend API (en Nextcloud om wat data te delen).

En dan verder

Ik kijk dus terug op een succesvolle HackaLOD met een ander gevoel over wat je tijdens een hackathon allemaal kunt doen naast programmeren, modellen maken en hacken. Als het kan, doe ik volgende keer weer mee, hoewel ik dan van tevoren onderzoek of we datasets moeten opschonen. Het zou mooi zijn als het verbinden van datasets echt meer formaliteit dan uitdaging is.

We hebben in januari/februari nog meegedaan aan de LODLAM Challenge, maar terecht ging die prijs naar een van de andere inzendingen. Het was misschien een beetje grootheidswaanzin om met het resultaat van een dag hacken mee te doen tussen de resultaten van maanden werk.

En natuurlijk doe je niet mee voor de prijzen, hoewel het wel leuke bedragen zijn om bijvoorbeeld meer gadgets van te kopen. Wie weet lukt het de volgende keer om de juryprijs te bemachtigen…