Zorgvraagtypering met de HoNOS+: kijken in een glazen bol?
In 2022 is in Nederland het zorgprestatiemodel, de nieuwe bekostiging voor de geestelijke gezondheidszorg (ggz), samen met de zorgvraagtypering ingevoerd. Met deze zorgvraagtypering probeert men inzicht te krijgen in de zorgvraag, de duur van de benodigde zorg en de intensiteit van de benodigde zorg (Zorgprestatiemodel 2021). De zorgvraagtypering zal waarschijnlijk van belang worden in de toekomstige bekostiging van de ggz. Zo zal vanaf 2024 de zorgvraagtypering deel uitmaken van de contractering tussen zorgaanbieders en zorgverzekeraars. Het is dus van groot belang dat de zorgvraagtypering accuraat wordt bepaald.
Op dit moment wordt het zorgvraagtype geschat op basis van de vragenlijst Health of the Nations Outcome Scale (HoNOS; Wing e.a. 1999), waaraan zeven vragen zijn toegevoegd die gericht zijn op historisch gedrag (de HoNOS+, Zorgprestatiemodel 2021). De vraag is echter of de HoNOS+ een goede voorspeller is voor zorgconsumptie en zorgkosten in de klinische praktijk. Mogelijk zijn zorgconsumptie, zorgkosten en daarmee in het verlengde behandelrespons per definitie lastig te voorspellen. Probeert men iets te voorspellen wat vooralsnog niet te voorspellen valt?
HoNOS+ als voorspeller van zorgconsumptie en -kosten
De HoNOS is een observatielijst, ontwikkeld in opdracht van het Engelse ministerie van Volksgezondheid (Wing e.a. 1999), met als doel het geestelijk en sociaal functioneren te meten. In het zorgprestatiemodel wordt de HoNOS+ ingezet als instrument om de zorgvraagzwaarte en zorginzet te bepalen. Het instrument wordt dus voor een ander doel gebruikt dan waar het voor ontwikkeld is en de vraag is in hoeverre er sprake is van een verband tussen de HoNOS+ en de uiteindelijke zorgconsumptie.
Voor zover ons bekend zijn er drie studies gericht op zorgconsumptie relevant. Hieruit blijkt slechts een zeer geringe samenhang met zorgconsumptie (Andreas e.a. 2010; Golay e.a. 2016; Maddison e.a. 2018). Op de website van het zorgprestatiemodel (Zorgprestatiemodel 2021) wordt desalniettemin gesproken over passende vergoedingen per cliëntgroep op basis van de zorgvraagtypering. Hierbij gaat men uit van de indeling naar twintig zorgvraagtypen/clusters die binnen de HoNOS+ wordt gehanteerd en koppelt deze aan zorgkosten. Echter, deze clusterindeling is onvoldoende wetenschappelijk onderbouwd, maar is tot stand gekomen in workshops en lokale overleggen (Self e.a. 2008a; b).
Het is dan ook niet verrassend dat uit onderzoek van Jacobs e.a. (2016), met een database van 1,9 miljoen clusterepisoden, is gebleken dat de clusters niet homogeen zijn op het gebied van kosten en zorgconsumptie uitgedrukt als aantal opnamedagen en aantal contacten met behandelaars. Omgekeerd werd met een statistische classificatietechniek aangetoond dat patiëntengroepen met soortgelijke zorgbehoeften niet correleerde met de twintig clusters van de HoNOS. De auteurs concludeerden dan ook dat dit weinig goeds belooft indien deze clusters de basis worden van een bekostigingssysteem (Jacobs e.a. 2016).
Ook is in een historisch cohortonderzoek van Twomey e.a. (2016) met 1343 patiënten gekeken naar de samenhang tussen de HoNOS-items en de totale HoNOS-score met zorgkosten, geoperationaliseerd als het aantal behandelcontacten. Zij vonden dat enkel het HoNOS-item ‘zelfbeschadiging’ een statistisch significante associatie had met de zorgkosten van het daaropvolgende jaar. De HoNOS-totaalscore en de andere elf items bleken niet statistisch significante voorspellende waarde te hebben voor zorgkosten, en zouden enkel een gering deel van de hoge kosten kunnen verklaren.
Alternatieve voorspelmodellen in de ggz
De ontwikkeling van voorspelmodellen is zeer relevant geworden binnen de ggz, onder andere vanwege de ontstane kloof tussen vraag en aanbod (GGZ 2018). Vanwege deze kloof en de hierdoor ontstane behoefte om de beschikbare ggz-middelen eerlijker te verdelen hebben Van Mens e.a. (2022) geprobeerd de zorgconsumptie, in behandeluren, te voorspellen. Zij concludeerden dat machine-learningtechnieken, in het bijzonder random-foresttechnieken, kunnen ondersteunen bij de planning en toewijzing van middelen. Helaas bleek het voorspellen op individueel niveau en dan met name bij cliënten met een hogere zorgconsumptie nauwelijks haalbaar (van Mens e.a. 2022). Toepassing van deze technieken in de klinische praktijk heeft dus nog verder onderzoek nodig.
Ook voor de risicoverevening is het voorspellen van de zorgconsumptie relevant. Zorgverzekeraars krijgen bij de risicoverevening een financiële compensatie op basis van de zorgbehoefte van hun verzekerdenpopulatie. Voor een goedwerkend financieringssysteem is het dus belangrijk dat de zorgconsumptie en zorgkosten zo goed mogelijk worden voorspeld. Uit onderzoek van Gupta Strategists (2020) blijkt dat met machine-learningtechnieken deze voorspellingen kunnen worden verbeterd. Echter, de invoering van het zorgprestatiemodel en het daarmee ontbreken van kostenhomogene clusters (Jacobs e.a. 2016) zal van negatieve invloed zijn op toekomstige uitkomsten van de risicoverevening.
Al met al blijkt dat zorgconsumptie en zorgkosten, en daarmee in het verlengde behandeluitkomsten, in de ggz niet betrouwbaar te voorspellen zijn. Hoewel de ontwikkeling op het gebied van machine-learningtechnieken razendsnel gaat, staan deze binnen de ggz nog in de kinderschoenen (Chekroud e.a. 2021). Zo vertrouwt men bij het inschatten van behandeluitkomsten in de praktijk nog vaak op het klinische oordeel, wat beperkingen heeft (Grove e.a. 2000). De komende tijd zal men verder moeten inzetten op het ontwikkelen, prospectief toetsen en implementeren van goede voorspelmodellen.
Aanbevelingen
We concluderen dat het niet wenselijk is om de zorgvraagtypering te baseren op de huidige HoNOS+. De HoNOS+ is geen goede voorspeller voor toekomstige zorgconsumptie en zorgkosten waarbij bovendien de clusters niet homogeen zijn.
Met deze kennis hebben wij de volgende aanbevelingen voor de toekomst:
– Onderzoek en ontwikkel andere instrumenten als input voor de zorgvraagtypering. SiRM (2021b) heeft reeds een eerste inventarisatie gedaan naar de instrumenten MATE en OQ45. Aan deze goede eerste stap dient men met verder onderzoek een vervolg te geven.
– Continueer het doorontwikkelen van de clusters binnen de HoNOS+, indien men vasthoudt aan de HoNOS+ voor de zorgvraagtypering. De eerste stap is hierin gelukkig reeds gezet (SiRM 2021a).
Vooralsnog dienen we echter kritisch en voorzichtig te zijn bij het gebruik van een instrument voor zorgvraagtypering voor doelen waarvoor het niet ontwikkeld is. Bij het gebruik van de zorgvraagtypering ter ondersteuning van de afspraken tussen zorgverzekeraars en zorgaanbieders is het daarom ongewenst om dit instrument leidend te laten zijn voor de zorgbekostiging. De situatie is desondanks dat deze zorgvraagtypering meegaat bij iedere declaratie van de zorgaanbieder. Dit geeft een risico op onjuiste vergoeding, wat adequate kwaliteit van zorg voor een individuele patiënt in de weg kan staan.
Andreas S, Harries-Hedder K, Schwenk W, e.a. Is the Health of the Nation Outcome Scales appropriate for the assessment of symptom severity in patients with substance-related disorders? J Subst Abuse Treat 2010; 39: 32-40.
De Nederlandse ggz. Personeelstekorten ggz nemen alleen maar toe. 2018. https://www.denederlandseggz.nl/nieuws/2018/personeelstekorten-ggz-nemen-alleen-maar-toe
Golay P, Basterrechea L, Conus P, e.a. Internal and predictive validity of the French Health of the Nation Outcome Scales: Need for future directions. PLoS One 2016; 11: e0160360.
Grove WM, Zald DH, Lebow BS, e.a. Clinical versus mechanical prediction: A meta-analysis. Psychol Assess 2000; 12: 19.
Gupta Strategists. Onderzoek machine learning in de risicoverevening. Gupta Strategists; 2020.
Jacobs R, Chalkley MJ, Aragon Aragon MJM, e.a. Funding of mental health services:: Do available data support episodic payment? York: University of York; 2016.
Maddison P, Golay P, Muncer S. Latent class analysis of the Health of the Nation Outcome Scales: A comparison of Swiss and English profiles and exploration of their predictive utility. Eur Psychiatry 2018; 48: 1-5.
Mens K van, Kwakernaak S, Janssen R, e.a. Predicting future service use in dutch mental healthcare: A machine learning approach. Admin Policy Ment Health 2022; 49: 116-24.
Self R, Painter J, Davis R. Study: To improve and demonstrate the structural properties of the care clusters that form the basis of the PbR currency development programme (Care Pathways and Packages Project). 2008a.
Self R, Rigby A, Leggett C, e.a. Clinical decision support tool: A rational needs-based approach to making clinical decisions. J Ment Health 2008b; 17: 33-48.
SiRM. Naar een voorstel voor subclusters. Utrecht: SiRM; 2021a.
SiRM. Alternatieve bronnen voor zorgvraagtypering. Utrecht: SiRM; 2021b.
Twomey C, Prina AM, Baldwin DS, e.a. Utility of the Health of the Nation Outcome Scales (HoNOS) in predicting mental health service costs for patients with common mental health problems: historical cohort study. PLoS One 2016; 11: e0167103.
Wing JK, Curtis R, Beevor AS. Health of the Nation Outcome Scales (HoNOS). Glossary for HoNOS score sheet. Br J Psychiatry 1999; 174: 432-4.
Zorgprestatiemodel. Handleiding zorgvraagtypering. 2021.
Aanvulling artikel
Voor ons commentaarartikel over de zorgvraagtypering met de HoNOS+ zouden wij graag als aanvulling naar het artikel van Broekman & Schippers (2017) willen refereren. In dit overzichtsartikel wordt o.a. het gebruik van de HoNOS als toewijzingsinstrument geanalyseerd en worden ernstige bezwaren t.a.v. toekomstig gebruik beschreven. Voor ons commentaarartikel hebben we de aangehaalde literatuur door Broekman & Schippers 2017 vergeleken met onze eigen PubMed-search en aanvullende studies toegevoegd. Het was daarom passend geweest om naar dit artikel te refereren, ook omdat dit een bredere analyse van “het Engelse model” betreft dat verder gaat dan enkel de voorspellende waarde van de HoNOS+ als beschreven in ons commentaarartikel.
Broekman T, Schippers G. Het ‘Engelse model’in de ggz–a fairy tale? Tijdschrift voor Psychiatrie 2017;11:702-709.
Authors
Susanne Bremer-Hoeve, data-analist, Dimence Groep, Deventer.
Erik de Groot, senior stafadviseur, Dimence Groep, Deventer.
E. Bas van Wel, psychiater, Dimence Groep, Deventer.
Bart P.F. Rutten, psychiater, Vakgroep Psychiatrie & Neuropsychologie, School for Mental Health and Neuroscience, Maastricht UMC+.
Suzanne C. van Bronswijk, psychiater, Vakgroep Psychiatrie & Neuropsychologie, School for Mental Health and Neuroscience, Maastricht UMC+.
Correspondentie
Dr. Suzanne van Bronswijk
(suzanne.vanbronswijk@maastrichtuniversity.nl).
Geen strijdige belangen meegedeeld.
Het artikel werd voor publicatie geaccepteerd op 14-6-2022.
Citeren
Tijdschr Psychiatr. 2022;64(7):416-4147