Converting a published PDF to an Open Data Service [part 2]


Start at Part 1: Introduction

Ask for the Data

This is the second part of the series of posts describing the process of opening up the health inspection data of the NVWA . The goal is to create a machine readable geocoded open data service of the records that are currently published as PDF.

Sometimes the easiest way to get the data the way you want to is to simply ask for it to the owner. Currently the dataset is published as PDF and as a map-service. We would like to have a text-file with tabular data, such as a CSV of Excel file.

On July 10, 2014 I sent an email to the general contact email of the NVWA asking for a tabular text file.

On July 23, 2014 I received the following reply:

Uw vraag is voorgelegd aan een deskundige, onderstaand volgt de reactie op uw vraag.


De informatie die nu verstrekt wordt is een totale lijst in PDF vorm en de kleuren op de inspectiekaart en app. De NVWA verstrekt de gegevens niet op andere wijze, zoals bijvoorbeeld in Excel. In algemene zin binnen de overheid wordt gesproken over het verstrekken van data. Deze ontwikkelingen worden door de NVWA gevolgd. Vooralsnog zal de NVWA geen andere wijze toepassen om data te verstrekken. ****Conclusion: the NVWA will not provide the data in tabular form. They are following the discussion about providing data, but the NVWA doesn’t take action.

So I need to convert the data the way Iwant to myself, on to part 3: Datasource selection