Doel
Deze module leert je hoe je via Research Data Services van de UBVU snel en efficiënt data kunt vinden voor je scriptie. Aan het eind van deze module weet je:
Tijdsduur
10 minuten
Voorkennis Geen speciale voorkennis is vereist.
Doelgroep: Deze module is met name van belang voor studenten die met bestaande data werken en voor hun scriptie willen zoeken in databestanden.
Bij het starten van een onderzoek is het belangrijk om vooraf te bedenken of je cijfermateriaal nodig hebt. Het werken met bestaande data kan een uitstekend en tijdbesparend alternatief zijn voor het zelf verzamelen van nieuwe data. Werk het onderwerp goed uit door aan de hand van je probleemstelling te bedenken welke data je nodig hebt. Check vervolgens of de data door de UB aangeboden wordt. Ga niet schrijven voordat je dit gedaan hebt. Het is zonde van de tijd als je opnieuw moet beginnen wanneer later blijkt dat de gegevens niet beschikbaar zijn.
Voorbeeld
Probleemstelling: "Wat is de invloed van het onderwijssysteem op de leerprestaties van Nederlandse kinderen van ouders met een migratieachtergrond?"
Uitwerking
De volgende data kun je gebruiken voor de beantwoording:
Als voorbeeld nemen we de volgende onderzoeksvraag:
“Wat is de invloed van het onderwijssysteem op de leerprestaties van Nederlandse kinderen van ouders met een migratieachtergrond?”
Aan de hand van drie eenvoudige vragen kun je snel bepalen welke databestanden relevant zijn voor jouw scriptie. De antwoorden op deze vragen geef je aan de hand van je uitgewerkte onderzoeksvraag. Stel jezelf de volgende drie vragen:
1. Welke tijdsperiode ga ik onderzoeken? Bijv. de laatste tien jaar.
2. Welk geografisch gebied ga ik onderzoeken? Bijv. Noord-Holland of Nederland.
3. Wat voor soort gegevens heb ik nodig? Bijv. gegevens over opleidingsniveau van de bevolking.
Databestanden die inhoudelijk helemaal (of grotendeels) overeenkomen met de antwoorden op de drie vragen kunnen gebruikt worden bij jouw onderzoek.
Bedenk het volgende: alle databases bevatten niet alle data over hetzelfde regiogebied in dezelfde tijdsperiode. Ofwel, dekking en spreiding verschillen van database tot database. Bovenstaande vragen bepalen in sterke mate welke database je moet gebruiken. Soms dien je, door deze limieten, jouw onderzoeksvraag aan te passen. Kijk over de grens van de VU. Is de data elders beschikbaar? Informeer daar of je er gebruik van mag maken.
Het vinden, beheren en archiveren van onderzoeksdata is enorm in ontwikkeling en vraagt specifieke kennis. Research Data Support helpt wetenschappers en studenten bij het vinden van data en gebruik van data (minus analyse). Onderzoek vindt vooral plaats bij het data vinden deel. Data-archivering en -management voor researchers wordt ondersteund door het Research Data Management Team.
Research Data Support biedt studenten en medewerkers:
Een overzicht van beschikbare databestanden bij Research Data Support staat op LibGuide Data Finding.
Veel bestanden gebruiken codes om landen of talen uniek te identificeren. Daarnaast gebruiken bestanden regelmatig ook codes die internationaal afgesproken zijn. Voorbeelden hiervan zijn:
Dit soort codes moet je downloaden met data die je nodig hebt uit de bestanden. Je kunt ze vervolgens daarna gebruiken om de data uit meerdere bestanden aan elkaar te koppelen via programma's als Excel, SPSS, Stata of Eviews.
Houd bij jouw onderzoek altijd rekening met het feit dat landen ook kunnen veranderen door de tijd heen. Naties kunnen uit uiteen vallen of er kunnen ook nieuwe naties ontstaan. Kijk in de handleiding of hulp-informatie van een databestand als je twijfelt welke codes correct zijn.
Stel dat je financiële gegevens nodig hebt over bedrijven. Voor bepaalde data heb je soms meer dan één databestand nodig. Ga daarom na wat de mogelijkheden zijn om van dezelfde bedrijven in 2 of meer databestanden gegevens op te zoeken.
Ieder bestand gebruikt eigen codes om elk bedrijf uniek te identificeren. Daarnaast hebben beursgenoteerde bedrijven vaak codes die in meerdere bestanden voorkomen. Voorbeelden hiervan zijn:
Dit soort codes moet je samen met de data downloaden uit je eerste bestand. Vervolgens kun je deze identificatiecodes als lijst gebruiken in een tweede bestand om aanvullende data te downloaden. Zorg er dan wel voor dat je dezelfde identificatiecodes meeneemt als je data download uit het tweede bestand; anders kun je de data uit beide bestanden niet aan elkaar koppelen via programma's als Excel, SPSS of Eviews.
Meer informatie over data vinden vind je in de Libguide Finding data
Meer informatie over data verwerking vind je in de Libguide Working with data
Er zijn veel databestanden beschikbaar die relevante gegevens kunnen bevatten voor je scriptie. Bedenk het volgende: niet alle databases bevatten dezelfde data, dekken hetzelfde regiogebied over dezelfde tijdsperiode. Ofwel, bovenstaande vragen bepalen in sterke mate welke database je moet gebruiken. Soms dien je, door deze limiet, je onderzoeksvraag aan te passen. Daarnaast kunnen databases verschillen in valuta en eenheden (aantallen) Vergelijken is soms lastig.
De volgende tips helpen je om de onderlinge vergelijkbaarheid van de data te beoordelen. Hier enkele tips:
Valuta
Is alles in dezelfde valuta, of domestic? In FactSet kun je zelf de valuta bepalen.
Eenheden
Ga n voor de databestanden wat de eenheden zijn van de data die je kunt downloaden. Soms kun je kiezen, maar soms kan dat niet.
Frequentie
Data kunnen verschillen in frequentie (dagelijks, wekelijks, maandelijks, jaarlijks). Check de database op de (on)mogelijkheden.
Accounting regels
Gebruiken de bedrijven voor de hele periode dezelfde accounting regels? Kijk altijd of je informatie hierover kunt mee downloaden met de data.
Berekende waarden
Berekende waarden (ratio's, indexen etc) kunnen per database verschillen. Ga altijd rekenmethode na. Vaak zijn ze afwezig en zul je de componenten moeten downloaden om de berekening zelf te doen.
Bestudeer de achtergrond van de datasets die je wil gebruiken goed (helpsectie database) . Hier vind je rekenmethodes en welke datasets er zijn.
Voorbeeld
Hulpsectie van Support Wharton Research Data services
Neem gerust contact op met Research Data Services als je de juiste data niet kunt vinden, of als het downloaden van data niet goed lukt.
Waar kan ik data vinden?
Verkenning
Een voorbereidende verkenning van de literatuur over jouw onderwerp kan je inspireren bij het vinden van geschikte data. In tijdschriftartikelen over vergelijkbaar onderzoek kun je een idee krijgen van de gegevens die gebruikt zijn bij die onderzoekmethode. Vergeet hierbij niet dat je wellicht andere of aanvullende data nodig hebt als je onderzoek een wat andere invalshoek heeft.
Voorbeeld
In 2010 is een rapport verschenen over werkgelegenheid en consumentenvertrouwen in Nederland. De World Bank Open Data database werd gebruikt om een vergelijking te maken met andere landen. Een dergelijke studie zou je op het idee kunnen brengen dezelfde data te gebruiken, maar een andere invalshoek te kiezen bv. op basis van meer specifieke cijfers over consumentenuitgaven (beschikbaar via Passport GMID op www.ub.vu.nl -> e-Resources).