WhatsApp Ontdubbelaar
Het algoritme bepaalt welke chatgesprekken bij elkaar horen door te kijken naar de inhoud van de berichten binnen een chat. Bij een bepaalde overlap groepeert het algoritme de exports. Een medewerker controleert of dit klopt en stelt de namen van de deelnemers correct in. Het algoritme kan vervolgens ontdubbelen. Berichten worden ontdubbeld op basis van inhoud, tijd en auteur. Bijlagen worden ontdubbeld op basis van de hash (een unieke code voor elk bestand).
De Wet open overheid (Woo) regelt het recht op informatie over alles wat de overheid doet. Het is de opvolger van de Wet openbaarheid van bestuur (Wob).
Een medewerker controleert of de juiste bestanden samen worden gevoegd en of de namen van de deelnemers correct zijn.
Het algoritme ontdubbelt alleen berichten die op inhoud, tijd en auteur matchen. Daardoor worden geen berichten verwijderd. In het geval van een mismatch op één van deze factoren wordt dat bericht niet ontdubbeld. Een medewerker controleert of de juiste bestanden samen worden gevoegd en of de namen van de deelnemers correct zijn. Deze fouten kunnen gemist worden, bijvoorbeeld als de naam van een deelnemer van een gesprek verkeerd wordt toebedeeld. Chatberichten worden in dat geval toegeschreven aan iemand die deze tekst niet geschreven heeft. Dit vormt een mogelijk risico dat het gebruiken van bronbestanden niet heeft.
Door de inzet van dit algoritme worden WhatsApp gesprekken vollediger gepubliceerd. Gaten van de ene datahouder kunnen worden opgevuld met informatie van een tweede datahouder. De tijdswinst en kwaliteit van beoordeling maakt de inzet van het algoritme effectiever en completer dan het beoordelen van alle bronbestanden. Bronbestanden blijven onveranderd en beschikbaar. Het samengestelde gesprek wordt openbaar gemaakt, de bronbestanden zelf niet.
WhatsApp gesprekken met bijbehorende bijlagen
- Start
- mei 2023
- Leverancier
- Intern ontwikkeld
- Contact
- data-science@minvws.nl
- Register-standaard
- v1.0