Skip to Main Content
Universiteitsbibliotheek

Onderzoeksvaardigheden - Gevorderd: Data vinden

In deze training academische vaardigheden leer je je informatiebehoefte bepalen, bronnen te vinden en beoordelen en informatie te verwerken.

Waar vind ik data voor mijn scriptie?

 

1 Doel

Doel
Deze module leert je hoe je via Research Data Services van de UBVU snel en efficiënt data kunt vinden voor je scriptie. Aan het eind van deze module weet je:

  • Het belang van het gebruik van data in je onderzoek.
  • Welke databestanden beschikbaar zijn binnen de UBVU.
  • Op welke manier het de helpdesk van Research Data Services hulp biedt bij het gebruik van databases.

Tijdsduur
10 minuten

Voorkennis Geen speciale voorkennis is vereist.

Doelgroep: Deze module is met name van belang voor studenten die met bestaande data werken en voor hun scriptie willen zoeken in databestanden.

2 Hoe bepaal ik welke data ik nodig heb?

Bij het starten van een onderzoek is het belangrijk om vooraf te bedenken of je cijfermateriaal nodig hebt. Het werken met bestaande data kan een uitstekend en tijdbesparend alternatief zijn voor het zelf verzamelen van nieuwe data. Werk het onderwerp goed uit door aan de hand van je probleemstelling te bedenken welke data je nodig hebt. Check vervolgens of de data door de UB aangeboden wordt. Ga niet schrijven voordat je dit gedaan hebt. Het is zonde van de tijd als je opnieuw moet beginnen wanneer later blijkt dat de gegevens niet beschikbaar zijn.

Voorbeeld
Probleemstelling: "Wat is de invloed van het onderwijssysteem op de leerprestaties van Nederlandse kinderen van ouders met een migratieachtergrond?"

Uitwerking
De volgende data kun je gebruiken voor de beantwoording:

  • Educatieve prestaties:
    Opleidingsniveau
    Etnische achtergrond
  • Onderwijssysteem:
    Leeftijd waarop men start
    Contacturen met de opleiding
    Selectiejaar van het secundair onderwijs
  • Controle variabelen: 
    Taal die thuis wordt gesproken
    Opleidingsniveau ouders

3 Hoe weet ik welke databestanden ik nodig heb?

Als voorbeeld nemen we de volgende onderzoeksvraag:
Wat is de invloed van het onderwijssysteem op de leerprestaties van Nederlandse kinderen van ouders met een migratieachtergrond?

Aan de hand van drie eenvoudige vragen kun je snel bepalen welke databestanden relevant zijn voor jouw scriptie. De antwoorden op deze vragen geef je aan de hand van je uitgewerkte onderzoeksvraag. Stel jezelf de volgende drie vragen:

 

1. Welke tijdsperiode ga ik onderzoeken? Bijv. de laatste tien jaar.

2. Welk geografisch gebied ga ik onderzoeken? Bijv. Noord-Holland of Nederland.

3. Wat voor soort gegevens heb ik nodig? Bijv. gegevens over opleidingsniveau van de bevolking.

 

Databestanden die inhoudelijk helemaal (of grotendeels) overeenkomen met de antwoorden op de drie vragen kunnen gebruikt worden bij jouw onderzoek.

Bedenk het volgende: alle databases bevatten niet alle data over hetzelfde regiogebied in dezelfde tijdsperiode. Ofwel, dekking en spreiding verschillen van database tot database. Bovenstaande vragen bepalen in sterke mate welke database je moet gebruiken. Soms dien je, door deze limieten, jouw onderzoeksvraag aan te passen. Kijk over de grens van de VU. Is de data elders beschikbaar? Informeer daar of je er gebruik van mag maken.

4 Research Data Support / RDM ondersteuning

Het vinden, beheren en archiveren van onderzoeksdata is enorm in ontwikkeling en vraagt specifieke kennis. Research Data Support helpt wetenschappers en studenten bij het vinden van data en gebruik van data (minus analyse). Onderzoek vindt vooral plaats bij het data vinden deel. Data-archivering en -management voor researchers wordt ondersteund door het Research Data Management Team.

Research Data Support biedt studenten en medewerkers:

  • trainingen en presentaties over het werken met databestanden (zie Agenda UB website) <<
  • hulp bij het zoeken in databestanden en downloaden van informatie (helpdesk en afspraak) .

Een overzicht van beschikbare databestanden bij Research Data Support staat op LibGuide Data Finding

5 Hoe combineer ik databestanden? (landen) 

Veel bestanden gebruiken codes om landen of talen uniek te identificeren. Daarnaast gebruiken bestanden regelmatig ook codes die internationaal afgesproken zijn. Voorbeelden hiervan zijn:

  • De ISO 3166-1 norm. Dit is het eerste deel van ISO 3166 en legt alle landen van de wereld vast met unieke tweeletterige landcodes, drieletterige landcodes en driecijferige landcodes.
  • De ISO 639-1 norm. Dit is een door ISO vastgestelde standaard voor het weergeven van de namen van veelgebruikte talen met een tweeletterige code.

Dit soort codes moet je downloaden met data die je nodig hebt uit de bestanden. Je kunt ze vervolgens daarna gebruiken om de data uit meerdere bestanden aan elkaar te koppelen via programma's als Excel, SPSS, Stata of Eviews.

Houd bij jouw onderzoek altijd rekening met het feit dat landen ook kunnen veranderen door de tijd heen. Naties kunnen uit uiteen vallen of er kunnen ook nieuwe naties ontstaan. Kijk in de handleiding of hulp-informatie van een databestand als je twijfelt welke codes correct zijn.

6 Hoe combineer ik databestanden? (bedrijven)

Stel dat je financiële gegevens nodig hebt over bedrijven. Voor bepaalde data heb je soms meer dan één databestand nodig. Ga daarom na wat de mogelijkheden zijn om van dezelfde bedrijven in 2 of meer databestanden gegevens op te zoeken.


 

Ieder bestand gebruikt eigen codes om elk bedrijf uniek te identificeren. Daarnaast hebben beursgenoteerde bedrijven vaak codes die in meerdere bestanden voorkomen. Voorbeelden hiervan zijn:

  • ISIN = International Security Identification Number
  • Ticker = Symbool waarmee een bedrijf aan een beurs is genoteerd
  • Sedol = Stock Exchange Daily Official List. Code van een beursgenoteerd bedrijf aan de London Stock Exchange
  • CUSIP = Identificatie code de Committee on Uniform Security Identification Procedures.

Dit soort codes moet je samen met de data downloaden uit je eerste bestand. Vervolgens kun je deze identificatiecodes als lijst gebruiken in een tweede bestand om aanvullende data te downloaden. Zorg er dan wel voor dat je dezelfde identificatiecodes meeneemt als je data download uit het tweede bestand; anders kun je de data uit beide bestanden niet aan elkaar koppelen via programma's als Excel, SPSS of Eviews.

Meer informatie over data vinden vind je in de Libguide Finding data

Meer informatie over data verwerking vind je in de Libguide Working with data

7 Tips voor het vergelijken van data

Er zijn veel databestanden beschikbaar die relevante gegevens kunnen bevatten voor je scriptie. Bedenk het volgende: niet alle databases bevatten dezelfde data, dekken hetzelfde regiogebied over dezelfde tijdsperiode. Ofwel, bovenstaande vragen bepalen in sterke mate welke database je moet gebruiken. Soms dien je, door deze limiet, je onderzoeksvraag aan te passen. Daarnaast kunnen databases verschillen in valuta en eenheden (aantallen) Vergelijken is soms lastig. 

De volgende tips helpen je om de onderlinge vergelijkbaarheid van de data te beoordelen. Hier enkele tips:

Valuta
Is alles in dezelfde valuta, of domestic? In FactSet kun je zelf de valuta bepalen.

Eenheden
​Ga n voor de databestanden wat de eenheden zijn van de data die je kunt downloaden. Soms kun je kiezen, maar soms kan dat niet.

Frequentie
Data kunnen verschillen in frequentie (dagelijks, wekelijks, maandelijks, jaarlijks). Check de database op de (on)mogelijkheden.

Accounting regels
Gebruiken de bedrijven voor de hele periode dezelfde accounting regels? Kijk altijd of je informatie hierover kunt mee downloaden met de data.

Berekende waarden
Berekende waarden (ratio's, indexen etc) kunnen per database verschillen. Ga altijd rekenmethode na. Vaak zijn ze afwezig en zul je de componenten moeten downloaden om de berekening zelf te doen.

Bestudeer de achtergrond van de datasets die je wil gebruiken goed (helpsectie database) . Hier vind je rekenmethodes en welke datasets er zijn.

Voorbeeld
Hulpsectie van Support Wharton Research Data services

Neem gerust contact op met Research Data Services als je de juiste data niet kunt vinden, of als het downloaden van data niet goed lukt.

8 Samenvatting

Waar vind ik bestaande data voor mijn scriptie?

Data voor je scriptie 
  • Formuleer je probleemstelling en kijk meteen of er data beschikbaar zijn voor jouw analyse. Welke data heb ik nodig?
  • Bepaal time frame, geographical scope, type data
  • Keuze van databestanden
  • Combineren van databestanden

Waar kan ik data vinden?  

  • Beschikbare databestanden
  • Hulp vanuit Research Data Services van de UBVU

Tips

Verkenning
Een voorbereidende verkenning van de literatuur over jouw onderwerp kan je inspireren bij het vinden van geschikte data. In tijdschriftartikelen over vergelijkbaar onderzoek kun je een idee krijgen van de gegevens die gebruikt zijn bij die onderzoekmethode. Vergeet hierbij niet dat je wellicht andere of aanvullende data nodig hebt als je onderzoek een wat andere invalshoek heeft. 

Voorbeeld
In 2010 is een rapport verschenen over werkgelegenheid en consumentenvertrouwen in Nederland. De World Bank Open Data database werd gebruikt om een vergelijking te maken met andere landen. Een dergelijke studie zou je op het idee kunnen brengen dezelfde data te gebruiken, maar een andere invalshoek te kiezen bv. op basis van meer specifieke cijfers over consumentenuitgaven (beschikbaar via Passport GMID op www.ub.vu.nl -> e-Resources).