"Maar wat als de AI een hartinfarct mist?"
Dit is de vraag die elke zorgverlener stelt, en terecht. In tegenstelling tot een verkeerde productaanbeveling of een gemiste e-mail, kan een fout in medische triage letterlijk levens kosten. Daarom is veiligheid niet een van de features van AI-triage, het is de fundamentele eis.
In dit artikel leg ik uit hoe AI-triagesystemen veiligheid waarborgen door middel van klinische beslisregels, zekerheidsdrempels en menselijke controle. Het doel is niet om je gerust te stellen, maar om je de tools te geven om kritisch te evalueren of een systeem veilig genoeg is.
Wat zijn klinische beslisregels?
Klinische beslisregels zijn gestructureerde instructies die bepalen hoe een AI-systeem omgaat met specifieke symptoomcombinaties. Ze vormen de "wet" waaraan het systeem zich moet houden, ongeacht wat de machine learning modellen suggereren.
Voorbeelden van klinische beslisregels:
- • Als pijn op de borst + uitstraling naar arm dan altijd U1 (hoogste urgentie), ongeacht andere factoren.
- • Als leeftijd onder 3 maanden + koorts boven 38 graden dan altijd U2 (spoed).
- • Als suicidale uitingen gedetecteerd dan direct escalatie naar mens + notificatie.
- • Als ademhalingsproblemen + bekende astma dan vraag naar medicijngebruik voordat urgentie wordt bepaald.
Deze regels zijn gebaseerd op medische richtlijnen en protocollen. In Nederland volgen de meeste systemen de Nederlandse Triage Standaard (NTS), internationaal wordt vaak de Emergency Severity Index (ESI) gebruikt.
Harde regels versus geleerde patronen
AI-triagesystemen combineren twee benaderingen: harde regels die vooraf zijn geprogrammeerd, en patronen die het systeem leert uit data. Elk heeft sterke en zwakke punten:
| Aspect | Harde regels | Geleerde patronen |
|---|---|---|
| Voorspelbaarheid | 100% voorspelbaar | Kan varieren |
| Aanpasbaarheid | Vereist handmatige update | Leert van nieuwe data |
| Uitlegbaarheid | Volledig traceerbaar | Soms lastig uit te leggen |
| Edge cases | Moet vooraf bedacht zijn | Kan nieuwe patronen herkennen |
| Risicoprofiel | Conservatief, veilig | Flexibeler, meer onzekerheid |
In de praktijk: Goede systemen gebruiken harde regels als vangnet. Als de machine learning een casus classificeert als U4 (routine), maar de harde regels detecteren een alarmsymptoom, wint de harde regel. Altijd.
Zekerheidsdrempels per urgentieklasse
Een AI-systeem geeft niet alleen een classificatie, maar ook een zekerheidspercentage. "80% zeker dat dit U3 is." De vraag is: wanneer is het systeem zeker genoeg om te handelen?
Dit hangt af van de ernst. Voor levensbedreigende situaties willen we meer zekerheid dan voor routine-afspraken.
| Urgentie | Min. zekerheid | Actie bij onzekerheid |
|---|---|---|
| U1 (levensbedreiging) | 95-99% | Escaleer onmiddellijk naar mens |
| U2 (spoed) | 90-95% | Escaleer naar mens, upgrade naar U1 |
| U3 (dringend) | 85-90% | Stel vervolgvragen of escaleer |
| U4 (routine) | 80-85% | Stel vervolgvragen |
| U5 (zelfzorg) | 80% | Stel vervolgvragen, upgrade naar U4 |
Het principe: Liever te voorzichtig dan te optimistisch. Als het systeem twijfelt, wordt de casus doorgestuurd naar een mens of opgewaardeerd naar een hogere urgentie.
Wanneer schakelt het systeem over naar een mens?
Escalatie naar een menselijke triagist gebeurt niet alleen bij lage zekerheid. Er zijn meerdere triggers:
- Zekerheid onder drempel. Als de classificatiezekerheid onder de vereiste grens komt.
- Conflicterende signalen. Als de symptomen wijzen op meerdere mogelijke urgentieklassen.
- Hoog-risico symptomen. Bij detectie van alarmsymptomen zoals suicidale uitingen, geweld, of specifieke medische noodgevallen.
- Patient verzoek. Als de patient aangeeft liever met een mens te spreken.
- Complexe voorgeschiedenis. Bij patienten met meerdere aandoeningen of bijzondere omstandigheden.
- Technische onzekerheid. Als de invoerdata incompleet of inconsistent is.
Bij escalatie krijgt de triagist alle informatie die de AI heeft verzameld, plus de reden voor escalatie en de voorlopige classificatie van het systeem. De mens hoeft niet opnieuw te beginnen.
Nederlandse Triage Standaard in AI
De Nederlandse Triage Standaard (NTS) is het officiële protocol voor triage in de Nederlandse gezondheidszorg. Het beschrijft precies hoe klachten moeten worden geclassificeerd.
Het vertalen van NTS naar AI-algoritmes is een nauwkeurig proces:
- Protocolanalyse. Elk triageprotocol wordt geanalyseerd en opgedeeld in discrete beslispunten.
- Beslisboom constructie. De beslispunten worden vertaald naar een hiërarchische structuur van if-then regels.
- Symptoomkoppeling. NLP-output wordt gekoppeld aan de termen die NTS gebruikt.
- Validatie. Testcasussen worden doorlopen om te controleren of de AI dezelfde conclusies trekt als een menselijke triagist.
- Klinische review. Medisch specialisten reviewen de implementatie en identificeren edge cases.
Belangrijk: NTS wordt regelmatig geupdate. Een AI-systeem moet deze updates volgen, wat betekent dat er een proces moet zijn voor regelmatige hervalidatie.
Override mechanismen: als de AI het fout heeft
Geen enkel systeem is perfect. Daarom bevatten goede AI-triagesystemen override mechanismen die ingrijpen wanneer specifieke risico's worden gedetecteerd.
Voorbeelden van automatische overrides:
- • Alarmsymptomen. Detectie van woorden als "niet ademen", "bewusteloos", of "veel bloed" overschrijft elke classificatie naar U1.
- • Kwetsbare groepen. Bij zwangeren, baby's of ouderen worden drempels automatisch verlaagd.
- • Combinatiesymptomen. Bepaalde symptoomcombinaties triggeren altijd een hogere urgentie, ongeacht individuele scores.
Menselijke overrides:
- • Triagisten kunnen elke AI-classificatie aanpassen.
- • Overrides worden gelogd voor kwaliteitsanalyse.
- • Patronen in overrides worden gebruikt om het systeem te verbeteren.
Veiligheid is geen feature, het is de basis
Als je overweegt AI-triage te implementeren, zijn dit de vragen die je moet stellen aan potentiele leveranciers:
- 1. Welke klinische beslisregels zijn hard-coded en hoe worden deze onderhouden?
- 2. Wat zijn de zekerheidsdrempels per urgentieklasse en waarom?
- 3. Welke triggers leiden tot escalatie naar een mens?
- 4. Hoe is NTS/ESI geimplementeerd en gevalideerd?
- 5. Welke override mechanismen bestaan voor hoog-risico situaties?
- 6. Hoe worden protocol-updates verwerkt?
Een leverancier die deze vragen niet helder kan beantwoorden, is nog niet klaar voor medische AI.
Kernpunten
- • Klinische beslisregels zijn de "wet" die boven ML-modellen staat
- • Harde regels zorgen voor voorspelbaarheid en veiligheid
- • Hogere urgentie = hogere zekerheidseis
- • Bij twijfel: escaleer naar mens of upgrade urgentie
- • Override mechanismen vangen edge cases op
Patrick Dronk
AI Consultant
Wil je de veiligheidsarchitectuur van een AI-triagesysteem laten evalueren? Neem contact op.