Dataset Generator - Bulk testdata genereren met BSN, IBAN, naam en meer

Genereer complete testdatasets door meerdere generators te combineren: BSN, IBAN, naam, adres, e-mail en telefoonnummer. Tot 10.000 records per batch met directe export naar Excel (.xlsx), CSV en JSON. Ideaal voor QA testing, test automation en het vullen van testdatabases.

Let op:alle gegenereerde gegevens zijn volledig fictief en mogen niet worden gebruikt als echte persoonsgegevens.

Aantal:

Complete testdatasets genereren

De dataset generator combineert alle individuele generators tot complete testrecords. Elk record bevat samenhangende fictieve persoonsgegevens die direct bruikbaar zijn in test- en ontwikkelomgevingen.

Beschikbare velden per record

Elk gegenereerd testrecord kan de volgende velden bevatten:

Exportformaten

Gegenereerde datasets kunnen worden geëxporteerd in drie formaten, elk geschikt voor een ander scenario:

  • Excel (.xlsx)— Ideaal voor QA-teams die testdata handmatig willen inspecteren of delen met stakeholders.
  • CSV— Geschikt voor database imports, ETL-processen en gebruik in test automation frameworks.
  • JSON— Direct bruikbaar in API tests, frontend mocking en als fixture data in unit tests.

Use cases

  • Test automation— Gebruik datasets als input voor geautomatiseerde end-to-end tests met tools als Cypress, Playwright of Selenium.
  • Database seeding— Vul ontwikkel- en staging-databases met realistische testdata voor handmatige tests.
  • Demo data— Presenteer applicaties aan klanten met overtuigende maar volledig fictieve gegevens.
  • Performance testing— Genereer grote datasets (tot 10.000 records) om load tests en stress tests uit te voeren.

AVG/GDPR compliance

Alle gegenereerde data is volledig fictief en niet herleidbaar tot echte personen. Dit maakt de datasets volledig compliant met de Algemene Verordening Gegevensbescherming (AVG). In tegenstelling tot geanonimiseerde productiedata, waarbij het risico op heridentificatie altijd aanwezig blijft, is synthetische testdata per definitie privacy-veilig. Gebruik deze generator als alternatief voor het kopiëren van productiedata naar testomgevingen.

Welke velden zitten in een testdataset?

Elke rij in de dataset bestaat uit samenhangende, maar volledig fictieve persoonsgegevens. De velden worden onafhankelijk gegenereerd door de onderliggende generators, zodat elk record de wiskundige controles van de desbetreffende standaard doorstaat.

  • BSN— negen cijfers die de elfproef doorstaan. Gewichten 9, 8, 7, 6, 5, 4, 3, 2, -1 leveren een som op die deelbaar is door 11.
  • IBAN— Nederlands formaat met correcte MOD-97 controlecijfers (ISO 7064). Zie de IBAN generator voor details per land.
  • Naam— voornaam, optioneel tussenvoegsel (de, van, van der, etc.) en achternaam uit een Nederlandse namenlijst. Geconfigureerd via de naam generator.
  • E-mail— RFC 2606 compliant op gereserveerde domeinen (example.com, example.net) zodat er nooit per ongeluk mail naar echte adressen gaat. Afgeleid via de e-mail generator.
  • Postcode— Nederlands 1234 AB formaat, los te genereren met de postcode generator.
  • Telefoon— Nederlands 06-nummer in correct formaat. Zie de telefoonnummer generator.
  • Geboortedatum— realistische leeftijdsverdeling (18–90 jaar), formaat ISO 8601. Beschikbaar via de geboortedatum generator.

Use cases per branche

Synthetische datasets vervangen productiekopieën in veel sectoren waar AVG-risico en datagevoeligheid hoog zijn.

  • Fintech— KYC/onboarding flows testen, IBAN-invoer valideren en anti-fraude-regels uitproberen zonder AVG-risico. Ideaal voor challenger banks en PSD2-integraties.
  • Zorg— BRP-koppelingen, Vektis-koppelingen en ZIS/EPD integraties testen met fictieve BSNs zonder patientgegevens aan te raken. Belangrijk voor NEN 7510 compliance.
  • Retail en e-commerce — checkout flows, adresvalidatie, klantregistratie en betaalintegraties (iDEAL, SEPA) testen met realistische maar fictieve klantprofielen.
  • Overheid— DigiD-koppelingen, Berichtenbox-integraties en Haal Centraal/BRP-API testen in pre-productieomgevingen waar echte BSNs verboden zijn.
  • HR en payroll— loonstroken, jaaropgaven en Loonaangifte-XML genereren voor accountancy- en HR-software zonder personeelsdata uit de productieomgeving te gebruiken.
  • Test automation— fixtures voor Cypress, Playwright, Pytest en Jest. Ideaal voor end-to-end tests, contract tests en database seeding in CI/CD pipelines.

Excel/CSV/JSON export en integratie in test automation

Het exportproces draait volledig in de browser. De dataset wordt pas bij de download-actie geserialiseerd — er gaat niets via een server en er wordt niets opgeslagen. De Excel export gebruikt een dynamisch geladen SheetJS-bundle, zodat de pagina zelf licht blijft.

  • Excel (.xlsx)— Headers op rij 1, data vanaf rij 2. Direct te openen in Excel, Numbers of LibreOffice. Handig voor QA-review en stakeholder demos.
  • CSV— UTF-8 met BOM, komma als scheidingsteken, quotes rond velden met speciale tekens. Importeerbaar in vrijwel elke database, ETL-tool (Talend, Airbyte) en data-analyseframework (pandas, dplyr).
  • JSON— array van objecten, pretty-printed. Direct bruikbaar als fixture in JavaScript/TypeScript tests en REST API mocking.

Integratie-voorbeelden:

  • Cypress fixtures— download de JSON export, plaats hem in cypress/fixtures/users.json en laad hem via cy.fixture('users').
  • Playwright— importeer JSON direct in je test.beforeEach om databases te seeden of formulierinput te driven.
  • Postman / Newman— gebruik de CSV export als data file in collection runs voor data-driven API tests.
  • Pytest— laad JSON als parametrized fixture met @pytest.fixture of @pytest.mark.parametrize.
  • Jest— importeer JSON direct in je test file (import users from './users.json') voor snapshot- of data-driven tests.

Veelgestelde vragen

Wat kan de dataset generator en welke velden worden ondersteund?
De dataset generator combineert alle beschikbare generators (BSN, IBAN, naam, adres, postcode, e-mail, telefoonnummer, UUID) tot volledige testdatasets. Je kiest zelf welke velden je nodig hebt en hoeveel records je wilt genereren (tot 10.000 per batch). Elk record bevat consistente, samenhangende fictieve persoonsgegevens — ideaal voor het vullen van testdatabases en het opzetten van realistische testscenario's.
Hoeveel records kan ik genereren en hoe snel gaat dat?
Je kunt tot 10.000 records per batch genereren. De generatie vindt volledig client-side plaats in je browser met geoptimaliseerde JavaScript, waardoor zelfs grote batches binnen seconden klaar zijn. Er wordt geen data naar een server gestuurd, wat zowel de snelheid als de privacy ten goede komt. Bij zeer grote batches (5.000+) kan het exporteren naar Excel iets langer duren.
Naar welke formaten kan ik mijn testdata exporteren?
De dataset generator ondersteunt drie exportformaten: Excel (.xlsx) — direct bruikbaar in spreadsheet-applicaties en ideaal voor handmatige review, CSV — het universele formaat voor data-import in databases en test automation tools, en JSON — perfect voor API testing, seed scripts en direct gebruik in development omgevingen. Alle exports bevatten correcte headers en encoding.
Is de gegenereerde testdata geschikt voor test automation pipelines?
Ja, de dataset generator is specifiek ontworpen voor gebruik in test automation. De JSON en CSV exports zijn direct inzetbaar in test frameworks zoals Selenium, Cypress, Playwright en Robot Framework. Je kunt de exports gebruiken als test fixtures, als input voor data-driven tests of als seed data voor CI/CD pipelines. Alle gegenereerde waarden (BSN, IBAN) voldoen aan hun respectievelijke validatie-algoritmes.
Wordt mijn gegenereerde testdata opgeslagen of gedeeld?
Nee. De volledige dataset generatie en export vindt client-side plaats in je browser. Er wordt geen data verstuurd naar een server, opgeslagen in een database of gedeeld met derden. De gegenereerde records bestaan uitsluitend in je browsersessie totdat je ze exporteert. Dit maakt de tool ook geschikt voor gebruik in omgevingen met strikte privacy- en security-eisen.
Kan ik de dataset generator gebruiken voor het testen van AVG-compliant software?
Ja. Omdat alle gegenereerde data volledig fictief is en niet herleidbaar tot echte personen, is het een veilige en AVG-verantwoorde manier om testdata te verkrijgen. Dit voorkomt het risico van het gebruik van productiedata in testomgevingen — een veelvoorkomend compliance-risico. De fictieve maar realistisch ogende data zorgt ervoor dat je software realistische scenario's kan verwerken zonder privacy-risico's.

Gerelateerde tools