Technische Uitleg

Hoe AI Triage Werkt: Van Symptoom tot Classificatie

Wat gebeurt er eigenlijk als een patient klachten invoert? Een kijkje onder de motorkap van AI-triagesystemen: van tekstanalyse tot urgentiebepaling.

PD

Patrick Dronk AI Consultant

|

December 2025

15 min leestijd

Dit artikel is onderdeel van onze serie over AI in de zorg:

AI Triage Serie

2 van 10 artikelen

← Terug naar het overzicht

"Het voelt alsof het systeem mijn gedachten leest. Hoe weet het dat ik me zorgen maak over mijn hart?"

Een patient die voor het eerst een AI-triagesysteem gebruikt, stelt precies de juiste vraag. Hoe werkt dit eigenlijk? De meeste uitleg blijft vaag: "kunstmatige intelligentie analyseert je klachten." Dat helpt niet als je moet beslissen of je zo'n systeem wilt invoeren.

In dit artikel neem ik je mee door de technische werking van AI-triage. Niet om je een cursus machine learning te geven, maar om je te helpen begrijpen wat er gebeurt, waar het systeem sterk is, en waar de grenzen liggen.

De vier lagen van AI triage

Een AI-triagesysteem bestaat uit vier functionele lagen die samenwerken. Elke laag heeft een specifieke taak:

Data input laag. Ontvangt en valideert wat de patient invoert, of dat nu tekst, spraak of antwoorden op vragen zijn.
NLP-verwerkingslaag. Zet ruwe invoer om in gestructureerde medische concepten die het systeem kan gebruiken.
Classificatielaag. Bepaalt op basis van de herkende symptomen hoe urgent de situatie is.
Integratielaag. Koppelt de uitkomst aan je EPD of HIS en genereert een bruikbaar advies.

Deze lagen werken in volgorde: de output van de ene laag is de input voor de volgende. Laten we elke laag bekijken.

Data input: van vrije tekst naar gestructureerde data

De meeste AI-triagesystemen accepteren vrije tekst. Een patient typt: "Ik heb al drie dagen hoofdpijn, vooral 's ochtends, en ik word er misselijk van." Dit is handig voor de patient, maar lastig voor een computer.

Wat de input-laag doet:

• Validatie. Controleert of de invoer bruikbaar is. Is het tekst? Bevat het medisch relevante informatie? Of is het spam of een vraag over openingstijden?
• Normalisatie. Corrigeert spelfouten, herkent afkortingen, en zet de tekst om naar een standaardformaat.
• Aanvulling. Sommige systemen stellen vervolgvragen om ontbrekende informatie te verzamelen: "Heb je ook koorts gehad?"

Goede systemen combineren vrije tekst met gerichte vragen. De patient begint met een open beschrijving, daarna volgen specifieke vragen op basis van wat het systeem heeft herkend.

NLP en symptoomherkenning

Natural Language Processing (NLP) is waar de magie gebeurt. Of eigenlijk: waar de wiskunde gebeurt. De NLP-laag zet tekst om in medische concepten.

Het proces in stappen:

Tokenisatie. De tekst wordt opgedeeld in woorden en zinsdelen. "Drie dagen hoofdpijn" wordt: ["drie", "dagen", "hoofdpijn"].
Named Entity Recognition. Het systeem herkent medisch relevante termen: "hoofdpijn" = symptoom, "drie dagen" = duur, "'s ochtends" = tijdstip.
Mapping naar medische codes. De herkende symptomen worden gekoppeld aan standaardcodes. Veel systemen gebruiken SNOMED CT, een internationaal medisch codesysteem.
Context-analyse. Het systeem bepaalt relaties: de misselijkheid hangt samen met de hoofdpijn, niet met iets anders.

Het lastigste onderdeel is ambiguiteit. "Pijn in mijn borst" kan duiden op een hartprobleem, spierpijn, reflux, of angst. Goede NLP-systemen houden rekening met deze onzekerheid en geven meerdere mogelijke interpretaties door.

Praktisch voorbeeld: De zin "Ik heb al drie dagen hoofdpijn, vooral 's ochtends, en ik word er misselijk van" wordt vertaald naar: symptoom: hoofdpijn (SNOMED: 25064002), duur: 72 uur, patroon: ochtend, geassocieerd symptoom: misselijkheid (SNOMED: 422587007).

Machine learning classificatie

Na de NLP-laag heeft het systeem gestructureerde symptoomdata. Nu moet het bepalen: hoe urgent is dit? Hier komt machine learning in beeld.

De meeste systemen gebruiken een ensemble van modellen: meerdere algoritmes die samen tot een conclusie komen. Dit is betrouwbaarder dan een enkel model.

Model type	Sterke kant	Zwakke kant
Decision trees	Goed uitlegbaar, snel	Mist subtiele patronen
Random forest	Robuust, minder overfitting	Trager, minder uitlegbaar
Gradient boosting	Hoge nauwkeurigheid	Complex om te tunen
Neurale netwerken	Leert complexe patronen	Moeilijk uit te leggen

De output is een urgentiecode, vaak volgens de Nederlandse Triage Standaard:

U1 Levensbedreigend, direct actie nodig
U2 Spoed, binnen 1 uur gezien worden
U3 Dringend, dezelfde dag
U4 Routine, binnen enkele dagen
U5 Advies, geen consult nodig

Klinische beslisregels en veiligheid

Pure machine learning is niet genoeg voor medische beslissingen. Daarom bevatten goede systemen een laag met expliciete klinische beslisregels. Dit zijn harde regels die altijd worden gevolgd, ongeacht wat het ML-model denkt.

Voorbeelden van beslisregels:

• "Pijn op de borst" + "uitstraling naar arm" = altijd U1. Ongeacht andere symptomen.
• Leeftijd < 3 maanden + koorts = altijd U2. Bij baby's is voorzichtigheid geboden.
• Suicidale uitingen = directe escalatie. Plus notificatie naar de triagist.

Deze regels zorgen ervoor dat ernstige situaties nooit worden gemist, zelfs als het ML-model onzeker is. Ze zijn gebaseerd op medische richtlijnen en worden regelmatig geupdate.

Veiligheidsdrempels: Systemen zijn ontworpen om liever te "overtriageren" dan te "undertriageren". Een patient die onnodig naar spoed wordt verwezen is minder erg dan een hartaanval die wordt gemist. Dit betekent dat de drempel voor hoge urgentieklassen bewust laag ligt.

Output: van algoritme naar advies

De laatste stap is het genereren van bruikbare output. Dit gaat naar twee doelgroepen: de triagist en de patient.

Wat de triagist ziet:

• Urgentiecode met onderbouwing: waarom U3 en niet U2?
• Geextraheerde symptomen in gestructureerd format
• Mogelijke differentiaaldiagnoses om te overwegen
• Aanbevolen vervolgacties

Wat de patient ziet:

• Een duidelijke indicatie: "We adviseren contact binnen 24 uur"
• Eventueel zelfzorgadvies bij lage urgentie
• Alarmsymptomen waarbij ze direct moeten bellen

Performance: hoe nauwkeurig is het?

De belangrijkste vraag: hoe goed werkt dit in de praktijk? Er zijn verschillende metrics die ertoe doen:

Metric	Wat het meet	Typische waarde
Sensitivity	% urgente gevallen correct herkend	90-95%
Specificity	% niet-urgente gevallen correct herkend	85-92%
Overtriage rate	% onnodig als urgent geclassificeerd	8-15%
Undertriage rate	% urgent gemist (kritiek!)	2-5%

Belangrijk: Deze cijfers varieren per systeem, per zorgcontext, en per patientpopulatie. Vraag je leverancier om validatiedata die relevant zijn voor jouw situatie.

Een undertriage rate van 2-5% klinkt misschien laag, maar betekent dat 2-5 op de 100 urgente gevallen aanvankelijk worden gemist. Daarom is menselijk toezicht essentieel: de triagist bekijkt elke casus en kan de AI corrigeren.

Samenvatting

AI-triage werkt door vier lagen:

1. Data input valideert en normaliseert patientinvoer
2. NLP herkent symptomen en zet ze om naar medische codes
3. Machine learning bepaalt urgentie op basis van patronen
4. Klinische regels zorgen dat ernstige situaties nooit worden gemist

Het systeem is een hulpmiddel, geen vervanging. De triagist neemt altijd de eindbeslissing.

PD

Patrick Dronk

AI Consultant

Wil je meer weten over hoe AI-triage kan werken in jouw organisatie? Neem contact op voor een vrijblijvend gesprek.

Meer in deze serie

Vorige

AI Triage in de Zorg: Praktische Gids

Overzicht van AI-triage: wat het is, wat het kost, en hoe je het implementeert.

Binnenkort

Data Input en Validatie voor AI Triage

Welke data heb je nodig en hoe zorg je voor kwaliteit?

Wil je weten of AI triage past bij jouw organisatie?

Doe de gratis AI Readiness Scan of plan een vrijblijvend gesprek.

Doe de AI Readiness Scan Neem contact op