Welke regio’s in Nederland zijn het meest innovatief? Het blijkt mogelijk met machine learning aan de hand van bedrijvensites daar beter zicht op te krijgen.

De uitdaging


Eens in de twee jaar houdt het CBS de innovatie-enquête onder bedrijven met minimaal 10 werkzame personen. Maar is het ook mogelijk om zicht te krijgen op innovatie bij bedrijven met minder dan 10 werkzame personen? Hiermee wordt het mogelijk om regionale clusters van innovatieve bedrijven in Nederland, zogenoemde innovatieve hotspots, met een grotere mate van detail in kaart te brengen. Samen met het bedrijf Innovatiespotter heeft het CBS hier onderzoek nar gedaan in opdracht van het ministerie van Economische Zaken en Klimaat.

De aanpak

De gehanteerde methode maakt gebruik van een combinatie van webscraping, textmining en kunstmatige intelligentie (AI). Door combinatie van deze technieken met gegevens afkomstig uit bronnen zoals bedrijvensites en de Innovatie-enquête blijkt het mogelijk om een meer gedetailleerd beeld te geven.

Het valt te verwachten dat innovatieve bedrijven voor het overgrote deel een website zullen hebben. Daarom zijn in eerste instantie bij zoveel mogelijk bedrijven uit het Algemeen Bedrijvenregister van het CBS de websites gezocht. Vervolgens zijn trefwoorden bepaald die kenmerkend zijn voor sites van innovatieve bedrijven. Daarmee is het mogelijk om websites te classificeren als behorend bij een al of niet innovatief bedrijf. De uitkomsten zijn op verschillende manieren gevalideerd, bijvoorbeeld met een detailstudie in de regio Eindhoven.

 

De resultaten

In onderstaande kaart worden de concentraties van innovatieve bedrijven in Nederland in een zogenoemde ‘heatmap’ getoond. Er kan gekozen worden tussen een verdeling op basis van aantal bedrijven of op basis van het aantal werkzame personen. In het laatste geval springen de gebieden met relatief grote bedrijven er uit. Voor de heatmap worden alle innovatieve bedrijven gegroepeerd in gebieden van 1 bij 1 km, met een minimum van 5 bedrijven per gebied. Met deze werkwijze wordt herleidbaarheid naar individuele bedrijven voorkomen. Het betekent wel dat gebieden met weinig innovatieve bedrijven op dit kaartje wegvallen. Stedelijke gebieden komen extra goed naar voren. De mate waarin dit effect optreedt is echter wel redelijk gelijkmatig voor heel Nederland.

heatmap innovatieve hotspots

Figuur 1. Screenshot van interactieve kaart op https://www.cbs.nl/nl-nl/over-ons/innovatie/project/innovatieve-hotspots

Het CBS denkt met deze methode een manier te hebben gevonden om gedetailleerdere statistieken over innovatie in Nederland te kunnen leveren. Daarnaast lijkt het hiermee ook mogelijk om specifiek naar een afbakening (populatie en locatie) van start-ups te kijken.

Meer informatie

Voor een verdere toelichting zie de CBS Innovatiesite  of dit CBS nieuwsbericht

Contact

Barteld Braaksma  en Piet Daas  kunnen meer vertellen over dit onderzoek.