wat doet de boer/nl
Overige algoritmesIn gebruik· LARS 62718178

Octobox Anonimiseren

Ministerie van Algemene Zaken → Ministerie van Algemene Zaken
/ Doel
Octobox Anonimiseren helpt het ministerie om informatieverzoeken in het kader van de Woo sneller te verwerken en zodoende te voldoen aan wettelijke afhandelingstermijnen. Octobox doet suggesties voor het weglakken van persoonsgegevens en/of terugkerende te lakken passages. De impact van het gebruik van dit algoritme is laag: laksuggesties worden uitsluitend na menselijke controle overgenomen. Er is geen sprake van automatische beslissingen.
/ Methoden & modellen

Octobox Anonimisering werkt op basis van open source Natutal Language Processing (NLP) van SpaCy, waarbij taal en kunstmatige intelligentie samenkomen. Onder meer kunnen teksten geclassificeerd worden door bijvoorbeeld te herkennen wat het onderwerp van een zin is of wat een werkwoord is. Binnen het model wordt gebruik gemaakt van Named Entity Recognition (NER) om bijvoorbeeld namen te herkennen. De open source bibliotheek YOLO (You Only Look Once) stelt in staat handtekeningen te herkennen. Verder worden technieken zoals Optical Character Recognition (OCR) toegepast om gevoelige gegevens die voldoen aan herkenbare formats (zoals telefoonnummers, BSN-nummers, IBAN-nummers, postcodes of e-mail adressen) te detecteren. De output van het algoritme betreft suggesties voor te lakken passages in documenten. Het algoritme leert op basis van menselijke correcties en toevoegingen.

/ Wettelijke grondslag

Algemene verordening gegevensbescherming (AVG) Algemene Wet Bestuursrecht (AWB) Bekendmakingswet Wet Open Overheid (WOO) Wet Elektronische Publicaties (WEP)

/ Menselijk toezicht

Alle door Octobox Anonimiseren voorgestelde te lakken passages worden door een medewerker goedgekeurd, gewijzigd of afgekeurd. Er is geen sprake van automatische beslissingen.

/ Risico's

Inzet van het algoritme brengt geen extra risico's met zich mee. Het gebruik versnelt en vereenvoudigt een bestaand proces en verhoogt de kwaliteit van te lakken documenten. De uitkomst van het proces is en blijft de verantwoordelijkheid van medewerkers van het ministerie.

Proportionaliteit

Octobox Anonimiseren versnelt en vereenvoudigt een bestaand proces (actieve en passieve openbaarmaking) dat voorheen volledig handmatig verliep. Ook wordt de kwaliteit van het proces verhoogd omdat de handmatige werkwijze foutgevoeliger was. De kans op een datalek is kleiner en de gegevens van burgers en bedrijven beter beschermd.

/ Brondata

Het algoritme is in de basis getraind met openbare documenten en/of artikelen om specifiek entiteiten en namen te herkennen in verschillende soorten documenten en formats.

/ Metagegevens
Start
december 2023
Leverancier
Octobox Nederland B.V.
Register-standaard
v1.0