maandag 28 december 2015

Allemaal omschrijvingen

Wanneer je op WikiData naar een item zoekt, zie je niet alleen de naam van het gezochte item, maar ook (een deel van) de omschrijving van dat item. Vooral wanneer er meerdere items met dezelfde naam zijn (bijv. meerdere personen met de naam Pietje Puk), dan is het handig als in de omschrijving omschreven staat welke Pietje Puk bedoeld wordt. Als je de politicus zoekt, is het handig om te weten welke uit het lijstje dan politicus is, zodat je niet de voetballer en ook niet de kunstenaar kiest.

Heel veel items hadden wel een titel, maar nog geen omschrijving op WikiData. Daarom had ik een script in Python geschreven die deze omschrijving automagisch kan aanmaken. Afhankelijk van het type WikiData-item, wordt er gekeken naar land, beroep of een andere eigenschap, om zo een omschrijving te maken.

In december 2015 had mijn script zo al meer dan 300.000 items van een omschrijving voorzien. Momenteel is hij bezig met de personen die op de Franstalige, Engelstalige en Duitstalige Wikipedia een artikel hebben. Alle personen op de Nederlandstalige Wikipedia zijn al gedaan.

Nu een nieuw project verzinnen, om met een nieuw script iets anders beter, mooier of completer te maken!