Technologie

Model Training voor AI Triage: Van Data naar Werkend Systeem

AI-modellen verschijnen niet uit het niets. Ze worden getraind op data, gevalideerd door experts, en continu verbeterd. Dit artikel legt uit hoe dat proces werkt.

PD
Patrick Dronk AI Consultant
| December 2025 | 14 min leestijd

AI Triage Serie - Artikel 8 van 10

← Terug naar het overzicht

"Waar komt die AI-kennis vandaan?"

Een logische vraag. AI-modellen leren niet uit een handboek, ze leren uit data. Duizenden voorbeelden van triagegesprekken, elk voorzien van een correct label door een expert. Dit proces, model training, bepaalt of een AI-systeem betrouwbaar is of gevaarlijk. In dit artikel leg ik uit hoe dit werkt, zonder te vervallen in technisch jargon.

Overzicht van het trainingsproces

Model training voor medische AI verloopt in vijf fases:

  1. 1 Data verzamelen. Historische triagegegevens verzamelen, anonimiseren en opschonen.
  2. 2 Labelen. Medische experts beoordelen elk voorbeeld en kennen de juiste urgentie toe.
  3. 3 Trainen. Het model leert patronen herkennen uit de gelabelde data.
  4. 4 Valideren. Het model wordt getest op data die het nog nooit heeft gezien.
  5. 5 Deployen en monitoren. Het model gaat in productie en wordt continu gemonitord.

Data verzamelen en voorbereiden

Goede data is de basis van elk AI-model. Voor medische triage heb je nodig:

  • Volume. Minimaal duizenden voorbeelden per urgentiecategorie. Meer is beter.
  • Diversiteit. Alle soorten klachten, leeftijden, en presentaties moeten vertegenwoordigd zijn.
  • Kwaliteit. Complete, accurate gegevens zonder fouten of missende velden.
  • Representativiteit. De data moet lijken op wat het model in productie tegenkomt.

Anonimiseren

Voordat data gebruikt kan worden, moeten alle persoonsgegevens worden verwijderd of vervangen. Namen, geboortedata, BSN-nummers en adressen worden vervangen door placeholders. Dit is wettelijk verplicht onder de AVG en cruciaal voor privacy.

Data labelen: de rol van experts

Een AI kan alleen leren wat goed is als iemand het voordoet. Daarom worden alle trainingsvoorbeelden gelabeld door ervaren triagisten of artsen.

Dit proces werkt als volgt:

  1. 1. Dubbele beoordeling. Elk voorbeeld wordt door minstens twee experts beoordeeld.
  2. 2. Consensus bij verschil. Bij verschillende oordelen beslist een derde expert of wordt gediscussieerd.
  3. 3. Uitleg vastleggen. Experts noteren waarom ze een bepaalde urgentie kozen.
  4. 4. Kwaliteitscontrole. Steekproefsgewijs worden labels gecontroleerd door senior artsen.

Dit proces is arbeidsintensief en kostbaar, maar essentieel. Slechte labels leiden tot een slecht model, ongeacht hoe geavanceerd de technologie is.

Het trainingsproces zelf

Training is het moment waarop het model leert. Vereenvoudigd werkt het zo:

  1. 1. Initialisatie. Het model begint met willekeurige parameters, het "weet" nog niets.
  2. 2. Voorbeelden verwerken. Het model krijgt een triagevoorbeeld en doet een voorspelling.
  3. 3. Fout berekenen. De voorspelling wordt vergeleken met het correcte label. Het verschil is de "fout".
  4. 4. Parameters aanpassen. De parameters worden een klein beetje aangepast om de fout te verkleinen.
  5. 5. Herhalen. Dit proces herhaalt zich miljoenen keren tot het model nauwkeurig voorspelt.

Moderne AI-modellen voor triage zijn meestal gebaseerd op "transformers", dezelfde technologie achter ChatGPT. Deze modellen zijn bijzonder goed in het begrijpen van tekst en context.

Validatie en testen

Een model dat goed presteert op trainingsdata is nog niet per se goed. Het moet ook werken op nieuwe, ongeziene data. Daarom wordt de data opgesplitst:

Dataset Percentage Doel
Training 70% Model leert van deze data
Validatie 15% Hyperparameters afstemmen, overfitting detecteren
Test 15% Finale evaluatie op compleet ongeziene data

Pas als het model goed presteert op de testset, kan het naar productie. Extra validaties omvatten testen op data uit andere ziekenhuizen of regio's om te controleren of het model generaliseert.

Continu leren en verbeteren

Een model in productie is nooit "af". De medische praktijk verandert, nieuwe ziektes ontstaan, en het model kan geleidelijk minder goed presteren. Daarom is er een continu verbeterproces:

  • Monitoring. Continue tracking van prestatiemetrieken (zie artikel 7).
  • Feedback loops. Overrides en correcties door triagisten worden verzameld als nieuwe trainingsdata.
  • Periodieke hertraining. Met nieuwe data wordt het model regelmatig opnieuw getraind.
  • A/B testing. Nieuwe modelversies worden eerst op een subset getest voor brede uitrol.

Dit proces vereist governance: wie beslist wanneer een nieuw model live gaat? Wie is verantwoordelijk bij problemen? Dit moet vooraf geregeld zijn.

Kernpunten

  • • Model training begint met het verzamelen en anonimiseren van data
  • • Labelen door medische experts is essentieel en arbeidsintensief
  • • Het model leert door miljoenen keren fouten te corrigeren
  • • Validatie op ongeziene data toont of het model generaliseert
  • • Continue monitoring en hertraining houden het model actueel
PD

Patrick Dronk

AI Consultant

Vragen over model training? Neem contact op.

Overwegen jullie AI-triage?

Bespreek de mogelijkheden voor jouw organisatie.