Trois décennies de recherche sur le « Protocole néerlandais » n'ont pas produit de preuves fiables

La Petite Sirène
29 mai
22 min de lecture

30 mai 2026

Résumé

Dans « The Dutch Approach for Transgender Adolescents ; Past, Present and Future Perspectives », les cliniciens et les chercheurs du Center of Expertise on Gender Dysphoria (CEGD) se retourent sur trois décennies de recherche sur le CEGD et concluent que, sur la base de ces études, ils peuvent désormais avoir « beaucoup plus confiance » dans la fourniture de bloqueurs de la puberté, d'hormones intersexuées et de chirurgies aux mineurs atteints de dysphorie de genre qu'à la fin des années 1990, lorsque le paradigme du traitement a été proposé pour la première fois. La CEGD a en effet produit de nombreux documents de recherche importants, mais aucun d'entre eux n'est le résultat de plans d'étude méthodologiquement solides. Des chercheurs et des méthodologues indépendants qui ont effectué des revues systématiques et des méta-analyses de haute qualité ont tous conclu que la base de données probantes dans ce domaine est faible. Cela inclut les études du CEGD. Bien qu'il ne soit pas clair quels effets ces interventions peuvent avoir sur les résultats en matière de santé mentale, nous savons qu'elles peuvent causer de l'infertilité et sont associées à d'autres risques importants pour la santé. Par conséquent, il est inquiétant qu'en 2026, les principaux cliniciens et chercheurs du CEGD expriment plus de confiance dans l'approche néerlandaise, alors que la réponse appropriée aux nombreuses revues systématiques publiées au cours des 6 dernières années réduirait la confiance dans son efficacité et, par conséquent, une plus grande prudence clinique.

Introduction

À la fin des années 1990/début des années 2000, les cliniciens et les chercheurs du Center for Expertise on Gender Dysphoria (CEGD) du Centre médical de l'Université d'Amsterdam ont commencé à traiter certains mineurs dysphoriques de genre précoces de la puberté (Tade Tanner Stage 2) avec des bloqueurs de la puberté (PB) et des hormones intersexuées (CSH). Peu de temps après avoir été pionnier de cette approche de traitement, qui est devenue connue sous le nom de « Protocole néerlandais », les experts de ce groupe ont co-écrit les directives de traitement au nom de deux grandes organisations médicales : la World Professional Association for Transgender Health (WPATH) et l'Endocrine Society (ES) (Harry Benjamin International Gender Dysphoria Association, Citation2001; Hembree et al., Citation2009). Lorsque la ligne directrice de WPATH de 2001 a été publiée, recommandant le blocage pubertaire précoce pour certains patients, les preuves publiées consistaient en un seul rapport de cas de 1998 co-écrit par un psychologue du CEGD (Cohen-Kettenis & van Goozen, Citation1998). Ces directives officielles de l'ES et du WPATH, ainsi que leurs itérations ultérieures (Coleman et al., Citation2012, Citation2022; Hembree et al., Citation2017), ont officialisé l'approche du protocole néerlandais. D'autres conseils organisationnels ont commencé à faire référence avec autorité aux documents ES et WPATH (Taylor, Hall, Heathcote, et al., Citation2024), et le protocole néerlandais a été rapidement intégré dans la pratique de traitement standard dans de nombreux pays occidentaux. Sur la base de directives co-écrites par des experts en CEGD et basées en grande partie sur la recherche sur le CEGD menée par ces mêmes experts, les cliniciens de genre du monde entier ont commencé à recommander des interventions endocriniennes et chirurgicales pour les patients pédiatriques atteints de dysphorie de genre (GD).

Au milieu des années 2010, certains cliniciens de genre à l'extérieur des Pays-Bas ont commencé à s'exprimer des inquiétudes sur le fait que leurs patients ne semblaient pas bénéficier de l'approche médicalisée de la GD (par exemple, Kaltiala-Heino et al., Citation2015). Les experts avaient critiqué le protocole néerlandais depuis sa création (par exemple, Korte et al., Citation2008; Vrouenraets et al., Citation2015), mais à mesure qu'il est devenu la norme de soins dans les pays occidentaux, l'examen minutieux et les critiques se sont intensifiés (Block, Citation2023). Alors que les directives officielles ES et WPATH (co-écrites, comme toujours, par les cliniciens du CEGD) sont devenues progressivement plus permissives en ce qui concerne les critères d'éligibilité - notamment, l'exigence d'une GD extrême à vie a été abandonnée (McDeavitt, Citation2024) - les références de patients augmentaient de façon exponentielle, dominée par une nouvelle population : les femmes adolescentes sans antécédents clairs de GD prépubère et avec des taux de santé mentale et de comorbidités neurodéveloppementales plus élevés que prévu (Taylor, Hall, Langton, et al., Citation2024). L'inquiétude a augmenté parmi les experts (et, dans certains pays, parmi le grand public) en ce qui concerne les changements épidémiologiques mal compris, la nature irréversible de la médicalisation et les phénomènes de transition et/ou de regret, ainsi qu'en ce qui concerne les risques du traitement, y compris l'infertilité, la diminution de l'accumulation de densité osseuse, l'augmentation des facteurs de risque métaboliques et cardiovasculaires, le développement génital arrêté et le dysfonctionnement sexuel à vie (McDeavitt, Citation2025). Certains ont commencé à se demander : les bloqueurs de la puberté, les hormones sexuelles croisées et les chirurgies étaient-ils vraiment bénéfiques pour la santé mentale des enfants et des adolescents ? Étaient-ils vraiment « médicalement nécessaires » ?

Dans ce contexte d'incertitude, les autorités sanitaires nationales de Scandinavie et du Royaume-Uni ont commandé des examens systématiques (SR) des preuves (Ludvigsson et al., Citation2023; National Institute for Health and Care Excellence, Citation2020a, Citation2020b; Pasternack et al., Citation2019). De nombreux SR rigoureux ont été publiés depuis (U.S. Ministère de la Santé et des Services sociaux, Citation2025).Note de bas de page1 Ils ont constamment constaté que les preuves des avantages pour la santé mentale des PB, des CSH et des chirurgies sont très incertaines, ce qui signifie qu'il n'y a aucune preuve fiable qu'elles améliorent la santé mentale. La base de preuves est, comme l'a constaté la Cass Review du Royaume-Uni, « remarquablement faible » (Cass, Citation2024).

Dans « The Dutch Approach for Transgender Adolescents ; Past, Present and Future Perspectives », de Vries et al. fournissent un examen narratif d'un segment important de cette base de preuves « remarquablement faible » : études réalisées au CEGD (de Vries et al., Citation2026). Cependant, leur article de synthèse ne traite pas de la recherche montrant que les études fondamentales du CEGD (de Vries et al., Citation2011, Citation2014) ont de sérieuses limites méthodologiques (Abbruzzese et al., Citation2023; Biggs, Citation2023) ou avec les tentatives infructueuses de réplication (Carmichael et al., Citation2021; Olson-Kennedy et al., Citation2025). Plus important encore, l'article de revue ne traite pas des résultats des SR, même s'ils sont un élément essentiel de la médecine factuelle (EBM). Selon EBM, les SR/méta-analyses sont plus fiables que les études individuelles ou l'opinion d'experts.

De Vries et al. tirent plutôt des conclusions via un examen narratif de leur propre travail. Ce n'est pas conforme aux principes de l'EBM. En se référant aux RS, notre article vise à montrer que, contrairement aux affirmations de Vries et al., les études du CEGD sont en fait méthodologiquement limitées et ne peuvent pas servir de base à des recommandations concernant les interventions de transition médicale pédiatrique. De plus, nous soutenons que les études du CEGD ont minimisé de manière inappropriée les risques et mis l'accent sur les avantages. Enfin, nous identifions une tendance inquiétante : les justifications cliniques changeantes pour l'utilisation de ces interventions endocriniennes et chirurgicales chez les mineurs.

Limitations méthodologiques des études CEGD

La plupart des études de recherche clinique examinées dans de Vries et al. (Citation2026) ont été officiellement évalués par un ou plusieurs SR de haute qualité. Le tableau 1 (supplément) démontre que le programme de recherche CEGD ne peut pas être considéré comme une entité distincte de la base de données probantes pour les interventions de transition médicale pédiatrique. Ces études représentent une grande partie des preuves dans ce domaine, et la recherche CEGD a été incorporée dans toutes les synthèses rigoureuses qui ont trouvé les preuves très incertaines. Dans les SR, la plupart des évaluations des études CEGD ont trouvé qu'elles étaient méthodologiquement limitées ; les problèmes comprennent le manque de suivi à long terme (nécessaire pour évaluer le risque de maladie cardiovasculaire, par exemple, et l'incidence du regret du traitement), le manque de groupes de comparaison appropriés, l'utilisation de mesures de résultats de substitution, la perte de suivi (par exemple, dans une étude, une enquête de suivi menée 7 ans après le traitement n'a pu atteindre que 39 % des patients (Arnoldussen, Van Der Miesen, et al., Citation2022)), et le manque de méthodes analytiques qui s'ajustaient de manière adéquate pour les variables de confusion (limitant ainsi la capacité d'attribuer les résultats observés à l'intervention) (McDeavit et al., Citation2025). Aucune étude CEGD n'a utilisé des plans d'études randomisés et contrôlés.

Différents modèles d'étude sont utilisés à des fins différentes. Les études transversales, par exemple, peuvent être utilisées pour l'estimation de la prévalence ou la génération d'hypothèses. Les études pilotes explorent la faisabilité de fournir une intervention. En ce qui concerne les études de cohorte bien conçues, la causalité peut être suggérée si, par exemple, il y a une cohérence dans les résultats entre plusieurs études/cohortes, des effets dépendants de la dose et/ou de grandes tailles d'effet. Seuls des essais contrôlés randomisés (ECR) bien menés peuvent fournir des preuves décisives de la causalité. C'est un problème lorsque les chercheurs tirent des conclusions qui vont au-delà de ce que les plans d'étude peuvent soutenir. Malheureusement, c'est ce qui s'est passé au CEGD.

Deux études fondamentales sur la CEGD faisant état de résultats en matière de santé mentale sont considérées comme le fondement probant du domaine (de Vries et al., Citation2011, Citation2014). Ces études séquentielles ont suivi une petite cohorte de patients pendant 6 ans, au cours de laquelle ils ont reçu des PB, des CSH et une intervention chirurgicale. Bien que décrite par les auteurs comme prospective, la conception était en fait rétrospective, car la première étude a rapporté des données sur les résultats en matière de santé mentale pour les 70 premiers patients qui avaient reçu des PB et qui avaient été approuvés, après une évaluation psychologique, pour continuer à la CSH (c'est-à-dire que la cohorte a été définie après l'apparition d'un résultat, c'est-à-dire la progression vers la CSH). La deuxième étude (de Vries et al., Citation2014), a rapporté des données de ce même groupe de patients après avoir reçu une CSH et des chirurgies chirurgicales. Ces études étaient sensibles à un biais de sélection dès leur création, car de nombreux patients qui avaient besoin d'une évaluation psychologique étendue ou qui n'ont pas progressé vers la CSH ont été exclus de l'analyse initiale, et l'analyse finale a exclu cinq autres patients en raison de l'arrêt du traitement, du développement d'un diabète non contrôlé, de l'obésité sévère ou du décès.

En fin de compte, les chercheurs du CEGD ont signalé « des améliorations du fonctionnement psychologique » et ont conclu que l'utilisation séquentielle d'interventions endocriniennes et chirurgicales avait « [fourni] aux jeunes dysphoriques de genre qui cherchent une réaffectation de genre dès le début de la puberté, la possibilité de se développer en jeunes adultes qui fonctionnent bien » (de Vries et al., Citation2014). Cependant, ces patients devaient être psychologiquement stables au départ pour commencer le traitement (Delemarre van de Waal & Cohen-Kettenis, Citation2006), il y avait des données de résultats incomplètes (disponibles uniquement pour 32/70 patients pour certaines mesures) et des facteurs de confusion étaient présents (tous les patients recevaient une psychothérapie régulière et fréquente et un soutien psychosocial par le biais du CEGD). Aucune amélioration n'a été observée dans toutes les mesures des résultats en matière de santé mentale, et dans celles qui se sont améliorées, les améliorations étaient petites et d'une signification clinique peu claire. Les tailles d'effet n'ont pas été signalées. Les résultats n'ont été déclarés que comme scores moyens ; compte tenu de la distribution inconnue des données, il n'est pas clair si cette décision était justifiée. La deuxième étude a affirmé la « résolution » de la GD et l'amélioration de l'image corporelle, mais cette affirmation a été contestée par des chercheurs qui ont souligné que les échelles de mesure étaient commutées entre différents moments (Abbruzzese et al., Citation2023). The de Vries et al. (Citation2026) Le document de synthèse réitère l'affirmation selon laquelle ces études ont montré un « soulagement » de la GD, même si de Vries a reconnu ailleurs que l'échelle de dysphorie de genre d'Utrecht est, à tout le moins, limitée dans sa capacité à saisir les changements longitudinaux ou « pré-post » dans le degré de détresse liée au genre (de Vries, Citation2023).

De Vries et al. (Citation2011) et de Vries et al. (Citation2014) se sont avérés être méthodologiquement limités par les SR (tableau 1), même si certains des problèmes (les échelles de mesure commutées pour la GD et l'image corporelle ; la conception rétrospective) n'ont pas été identifiés par les évaluateurs. En d'autres termes, il est probable que les évaluateurs systématiques aient en fait sous-estimé les problèmes méthodologiques.

The de Vries et al. (Citation2026) l'examen narratif, faisant écho aux modèles exposés dans les études primaires du CEGD, tire des conclusions qui vont au-delà de ce que les plans de l'étude peuvent soutenir. Une analyse transversale comparant les enquêtes de différentes populations de patients ne peut pas être utilisée pour suggérer un lien de causalité entre les interventions endocriniennes et les résultats favorables en matière de santé mentale (van der Miesen et al., Citation2020), par exemple. Les résultats de petites études transversales sur le CEGD sont et ont été utilisés pour suggérer l'absence de dommages, même si de telles conceptions sont mal adaptées à la détection des effets indésirables (par exemple, Staphorsius et al., Citation2015). Une autre étude, Arnoldussen, Hooijman, et al. (Citation2022), est communément cité comme preuve qu'il y a peu de raisons de s'inquiéter concernant les effets des PB sur le développement neurocognitif, bien qu'il n'ait signalé que le QI des patients avant le traitement et s'ils ont suivi plus tard des écoles professionnelles ou des études supérieures en tant que jeunes adultes. Ces données ne peuvent être utilisées pour étayer des conclusions sur l'impact des PB sur la cognition (Baxendale, Citation2024). Arnoldussen, Van Der Miesen, et al. (Citation2022) a constaté que la perception de soi des adultes était plus favorable qu'elle ne l'avait été lorsqu'ils étaient jeunes adolescents ; de Vries et al. (Citation2026) suggèrent que cela peut être attribué à des interventions endocriniennes et chirurgicales, même si les adultes matures devraient généralement avoir une perception de soi plus favorable que les adolescents, quelle que soit toute intervention médicale.

Deux conclusions méthodologiquement injustifiées tirées par des études du CEGD et réitérées dans de Vries et al. (Citation2026) concernent les résultats de la densité minérale osseuse (DMO) et les résultats de la fonction sexuelle. Une étude qui a suivi 50 patientes 11 ans après le début du traitement avec des PB a révélé que les scores Z de la DMO des patientes étaient proches des bases de base pré-PB (van der Loos, Vlot, et al., Citation2023). (Les scores Z de la DMO mesurent la densité osseuse d'un patient se compare aux normes basées sur l'âge et le sexe.) Cependant, seulement environ la moitié des patients éligibles ont consenti aux tests de suivi, et il est possible que ceux qui étaient d'accord étaient en meilleure santé physique que ceux qui ne l'étaient pas. Quoi qu'il en soit, une étude de cohorte méthodologiquement limitée rapportant des données provenant d'un petit nombre de patients (environ la moitié du groupe éligible) n'est tout simplement pas une base suffisante pour affirmer qu'il n'y a « aucun impact durable du traitement [PB] » sur la densité osseuse de ces patients, ou pour conclure que « les effets diminutifs sur le traitement [BMD] du traitement [PB] sont inversés à l'âge adulte ». La recherche transversale sur la fonction sexuelle basée sur une enquête auprès de 37 patients adultes de sexe masculin (van der Meulen et al., Citation2025) est également citée par de Vries et al. (Citation2026) comme preuve « que les individus [qui ont commencé les PB au début de la puberté] étaient capables de faire l'expérience du désir sexuel, de l'excitation et de l'orgasme à un rythme similaire à ceux qui ont initié la transition médicale à l'âge adulte », mais les enquêtes s'appuyaient sur le rappel rétrospectif du fonctionnement pré-chirurgical et les comparaisons de très petits sous-groupes ne pouvaient pas faciliter des comparaisons statistiquement significatives (Clayton et al., Citation2025).

La recherche sur le CEGD a trop mis l'accent sur les avantages et minimisé les risques

En général, les études de cohorte longitudinales, surtout si elles sont rétrospectives, se concentrent sur les avantages espérés du traitement et ont tendance à sous-déclarer les méfaits (Loke et al., Citation2007; Mayo-Wilson et al., Citation2023; Qureshi et al., Citation2022). En médecine de genre pédiatrique, « certaines études [ont été] désireuses de présenter une image optimiste » (Thompson et al., Citation2022).

Dans le cas de la recherche CEGD examinée dans de Vries et al. (Citation2026), il semble que les avantages présumés soient soulignés et que les risques potentiels/méfaits connus du traitement minimisés. Dans la cohorte suivie dans le fondamental de Vries et al. (Citation2011, Citation2014) études, un patient masculin est décédé postopératoirement après une vaginoplastie à l'âge de 18 ans. La cause du décès était la fasciite nécrosante, une complication de la vaginoplastie intestinale. En raison de l'exposition séquentielle aux PB et aux œstrogènes qui avait été initiée autour du stade Tanner 2, les organes génitaux du patient étaient trop petits pour l'inversion pénienne standard, de sorte qu'un morceau d'intestin a été utilisé pour construire le canal néovaginal (une procédure plus complexe). Une infection agressive s'en est suivie et le patient est mort. de Vries et al. (Citation2014) n'a pas signalé ce décès en tant que conséquence ou événement indésirable, mais l'a brièvement mentionné dans la section "Méthodes" du journal. Ils n'ont pas expliqué que cette mort était directement attribuable à l'hypoplasie pénoscrotale causée par l'exposition au PB/œstrogène. Par conséquent, la mortalité associée à l'approche du protocole néerlandais n'a jamais été identifiée comme un préjudice par des revues systématiques. Il n'a été mis en lumière que par des recherches indépendantes menées par le sociologue de l'Université d'Oxford Michael Biggs, qui a noté qu'"un taux de mortalité supérieur à 1 % arrêterait sûrement tout autre traitement expérimental sur des adolescents en bonne santé" (Biggs, Citation2023). Dans les de Vries et al. (Citation2026) revue, le rapport de cas sur le décès de ce patient (Negenborn et al., Citation2017) a été décrit comme un « cas mortel de complications post-chirurgicales après une vaginoplastie intestinale » qui « montre comment les médecins et les patients doivent toujours être conscients des complications graves qui surviennent rarement ».

Il existe d'autres exemples de minimisation des risques et des risques dans la recherche du CEGD. Il s'agit notamment de mettre l'accent sur les comparaisons entre les sexes dans une cohorte dans laquelle la plupart des mesures métaboliques (par exemple, l'indice de masse corporelle, les niveaux de cholestérol) se sont aggravées au fil du temps et les taux d'obésité ont augmenté par rapport aux comparateurs cisgenres (Klaver et al., Citation2020). Les articles du CEGD ont également émis l'hypothèse, sur la base de recherches transversales de différents groupes de patients, que les résultats défavorables de la densité osseuse (par exemple, des scores Z de la DMO constamment bas à la colonne lombaire chez les hommes traités par PB et œstrogènes) peuvent être dus aux mauvais choix de mode de vie des patients (van der Loos et al., Citation2024). Cependant, c'est un fait physiologique non controversé que la minéralisation osseuse augmente pendant la puberté en réponse aux hormones sexuelles, et c'est un fait pharmacologique non controversé que les PB suppriment les hormones sexuelles. Par conséquent, il est raisonnable de conclure que les scores Z déprimés, même après la CSH, représentent probablement des séquelles d'une utilisation antérieure de PB. Se concentrer sur les choix de mode de vie risque de déplacer la responsabilité des résultats négatifs sur les patients et de donner de faux réconfort aux cliniciens qui les prescripent. Il convient de noter que dans une étude du CEGD, les hommes adultes au début de la vingtaine ayant des antécédents de consommation de PB/œstrogènes avaient des taux accrus (entre ~6 et 12 %) de faible densité osseuse au niveau du col du fémur et de la colonne vertébrale L (scores Z de la DMO < -2) par rapport aux ~2,3 % qui seraient attendus dans une population de référence de même âge (Schagen et al., Citation2020). Cette étude est décrite par de Vries et al. (Citation2026) article de revue montrant que « l'accumulation de minéraux osseux est également retardée par le traitement [PB], mais rattrape [CSH] ».

Il est également remarquable qu'en plus de minimiser les risques et les dommages, certains résultats des études CEGD n'ont pas soutenu les hypothèses initiales des chercheurs concernant les effets du traitement. Par exemple, au début des années 2000, les chercheurs prévoyaient que le traitement des hommes avec des PB et des œstrogènes séquentiels limiterait potentiellement leur atteinte de la taille (Delemarre van de Waal & Cohen-Kettenis, Citation2006). (Selon l'éthique du traitement de la clinique, ce serait un résultat positif parce que les patients ressembleraient plus de manière convaincante aux femmes, qui ont tendance à être plus petites que les hommes.) Cependant, lorsque les chercheurs ont constaté que les hommes traités au début de la puberté ont en fait fini par devenir plus grands que prévu à l'origine sur la base des antécédents de croissance et de la taille parentale moyenne, ils ont répondu non pas en réévaluant le protocole de traitement, mais en ajoutant des œstrogènes ou d'éthinylestradiol à fortes (Boogers et al., Citation2022), ce qui peut augmenter le risque (déjà élevé) de thromboembolie veineuse (de Blok et al., Citation2021; Gialeraki et al., Citation2018; Schwartz et al., Citation2025). (Heureusement, aucun événement thrombotique n'a été signalé chez ces patients.) De même, des études ont révélé que les hommes initiés à des interventions endocriniennes en tant que mineurs développaient la même quantité de tissu mammaire que les hommes qui ont fait une transition médicale à l'âge adulte, et chez les femmes, la largeur médiane-pelvienne ne semblait pas être différente entre ceux qui avaient utilisé des PB/testostérone en tant que mineurs et ceux qui ont fait une transition médicale à l'âge adulte (Boogers, Sardo Infirri, et al., Citation2025; Boogers, Sikma, et al., Citation2025). (Vraisemblablement, le CEGD considérerait un cadre plus étroit comme un résultat positif, mais cette constatation suggère au moins une raison d'incertitude quant à savoir si la largeur du bassin féminin peut être considérablement modifiée par les PB/testostérone.) Ces exemples illustrent le fait que les résultats qui soutiennent une certaine justification (par exemple, que l'intervention endocrinienne précoce facilite mieux la ressemblance physique avec l'autre sexe) sont soulignés, et les résultats qui ne le font pas ne sont pas mentionnés. Aucune des questions ci-dessus, par exemple, n'est soulevée dans de Vries et al. (Citation2026) examen. Au lieu de cela, la revue note que l'œstrogène « induit le développement des seins et une composition corporelle et une forme corporelle plus féminines » et que « la testostérone provoque une rupture de la voix, une augmentation des poils du visage et une composition corporelle et une forme corporelle plus masculines ».

Le protocole néerlandais est un traitement à la recherche d'une indication

Les cliniciens et les chercheurs du CEGD ont été les pionniers du protocole néerlandais sur la base de plusieurs justifications. Ils pensaient que les interventions endocriniennes précoces à la puberté entraîneraient (1) des résultats favorables pour la santé mentale parce que l'apparence physique des patients ressemblerait davantage à celle du sexe opposé/ils « passeraient » mieux, (2) que les PB en particulier fourniraient du « temps pour réfléchir »/explorer l'identité de genre avant de prendre des décisions concernant des interventions irréversibles, et (3) que les procédures chirurgicales invasives pourraient être évitées si certaines caractéristiques physiques n'étaient jamais développées en premier lieu (par exemple, mastectomie, chirurgie de féminisation faciale, rasage trachéal) (de Vries & Cohen-Kettenis, Citation2012; Delemarre van de Waal & Cohen-Kettenis, Citation2006). Bien que de Vries et al. (Citation2026) le document de synthèse fait référence à la justification du « temps de réflexion », au cours des 15 dernières années, des études CEGD, ainsi que des études d'autres pays, ont rapporté que plus de 90 % des patients commencés sur les PB passent à la CSH (Brik et al., Citation2020; Carmichael et al., Citation2021; Karakılıç Özturan et al., Citation2023; van der Loos, Klink, et al., Citation2023; Wiepjes et al., Citation2018). Cela suggère que les PB ne fournissent pas de manière significative « le temps de réflexion » ; et en effet, cette justification clinique ne semble plus être opérationnelle, même parmi les plus défenseurs les plus forts de la transition médicale pédiatrique (Turban et al., Citation2025; U.S. c. Skrmetti (No. 23–477), chercheurs et médecins experts, mémoire d'Amicus curiae, Citation2024). Si elles sont commencées au début de la puberté, les PB éviteront en effet la nécessité de certaines interventions chirurgicales ; cependant, comme discuté ci-dessus en ce qui concerne la vaginoplastie, l'utilisation des PB limite également certaines options chirurgicales futures.

La justification clinique de la facilitation des résultats favorables en matière de santé mentale a été, pendant des années, la base sur laquelle les interventions endocriniennes et chirurgicales ont été recommandées à des dizaines de milliers d'enfants et d'adolescents dans le monde. Aux États-Unis, les médecins dirigeants et les publications ont en fait insisté sur le fait que les PB, les CSH et les chirurgies sont « salvateurs » parce qu'ils réduisent le risque de suicide (ABC News [ABC], Citation2011; Georges et al., Citation2024; Lee & Rosenthal, Citation2023). En 2018 - quatre ans après que l'étude fondamentale du CEGD a revendiqué des améliorations de la santé mentale basées sur le suivi post-traitement de 32 à 55 patients tout en enterrant efficacement un taux de mortalité de 1,4 % (de Vries et al., Citation2014) - les résidents médicaux aux États-Unis ont appris que ces interventions étaient fondées sur des preuves et constituaient une prévention du suicide vitale.Note de bas de page2 Mais les SR de haute qualité ont maintenant montré de manière concluante que les preuves des avantages pour la santé mentale des PB, des CSH et des chirurgies sont très incertaines. Les fournisseurs de soins de santé ne peuvent pas dire, avec un degré raisonnable de certitude, quel type d'effet (positif, neutre ou négatif) ces interventions peuvent avoir sur les résultats en matière de santé mentale, y compris la dépression, l'anxiété, le suicide et le GD lui-même. En termes simples, les effets sur la santé mentale sont inconnus.Note de bas de page3

Bien que de Vries et al. ne reconnaissent pas explicitement l'état des preuves dans leur récent document de synthèse, ils le font obliquement lorsqu'ils concluent qu'à un « niveau fondamental, il est nécessaire de discuter de la meilleure façon d'évaluer l'efficacité du GAMT [traitement médical d'affirmation du genre] pour les adolescents » (de Vries et al., Citation2026). Une interprétation est que les chercheurs du CEGD reconnaissent que les preuves en faveur de la justification clinique traditionnelle originale (résultats favorables en matière de santé mentale) ne se sont pas matérialisées et recherchent donc maintenant de nouvelles justifications cliniques (par exemple, objectifs d'incarnation de genre, transfiguration corporelle créative, euphorie de genre) (Ashley, Citation2019; Blacklock et al., Citation2025; Oosthoek et al., Citation2024). Ces raisons alternatives « représentent un écart significatif » par rapport à l'objectif de la médecine, qui est la protection et la promotion de la santé et du bien-être lié à la santé (Gorin, Citation2024). Si des doutes substantiels survissent sur l'efficacité d'un traitement qui comporte des risques importants pour la santé, le traitement devrait, selon les circonstances, être retiré de la pratique ou étudié plus rigoureusement. Quoi qu'il en soit, l'éthique médicale dicte que si des traitements plus efficaces ou tout aussi efficaces avec moins de probabilité de risque attendue sont disponibles, ceux-ci devraient être fournis aux patients dans l'intervalle (Smids, Citation2026). C'est ce qui s'est passé dans de nombreux pays qui ont mis à jour les directives cliniques pour être proportionnelles aux résultats des SR (Cass, Citation2024; Council for Choices in Health Care Finland, Citation2020; Socialstyrelsen, Citation2022). de Vries et al. (Citation2026) reconnaît brièvement ces développements internationaux, mais ne mentionne pas que le traitement de première intention de la détresse pédiatrique liée au genre dans ces pays est maintenant une psychothérapie et un soutien psychosocial.

Il n'est pas scientifiquement ou éthiquement approprié de répondre aux preuves très incertaines dans ce domaine en recherchant une autre justification clinique qui pourrait justifier la fourniture de traitements. Il est particulièrement inapproprié de le faire tout en affirmant simultanément des niveaux élevés de confiance dans le traitement (« nous pouvons avec beaucoup plus de confiance soutenir la fourniture de ce traitement dans le contexte néerlandais » (de Vries et al. (Citation2026).) L'engagement excessif du clinicien à un certain traitement (ou technique chirurgicale, dispositif chirurgical, etc.) a été plus facilement reconnu et critiqué lorsque des preuves défavorables sont ignorées ou dénoncées par des chirurgiens engagés dans leur procédure préférée (Kincaid, Citation2025) ou lorsqu'il existe des conflits d'intérêts financiers évidents. Les engagements dans ce domaine peuvent être différents/plus complexes, mais la médecine de genre pédiatrique ne devrait pas être exemptée de l'attente standard selon laquelle la médecine est pratiquée selon des principes fondés sur des preuves.

Conclusion

The de Vries et al. (Citation2026) l'examen narratif de la recherche sur le CEGD est problématique principalement parce que les auteurs font des déclarations définitives qui ne peuvent pas être étayées par les méthodologies des études incluses. De plus, bien que les revues narratives aient leur place dans la littérature médicale, elles ne supplantent pas et ne peuvent pas supplanter des revues systématiques bien menées en tant que sources de preuves concernant l'efficacité du traitement. Malheureusement, de Vries et al. ne s'engagent pas dans les nombreuses revues systématiques qui ont été publiées au cours de la dernière demi-décennie environ et ils fournissent donc une image incomplète et biaisée de l'état des preuves. Il y a des problèmes supplémentaires avec leur examen narratif, bien que ce commentaire ne puisse pas tous les aborder (par exemple, l'impact sur les analyses de preuves de la publication de données de plusieurs cohortes de patients qui se chevauchent et l'affirmation, déjà abordée par Levine et al., selon laquelle la recherche sur le CEGD soutient la capacité des mineurs à consentir à des interventions endocriniennes/chirurgicales (Levine et al., Citation2022; Vrouenraets et al., Citation2022)).

Leur examen narratif dénature également fondamentalement le programme de recherche du CEGD comme ayant historiquement utilisé une approche méthodique et progressive (« les cliniciens et chercheurs néerlandais, lors de l'introduction d'une nouvelle étape de soins ou de la modification du protocole, ont évalué ces soins avant d'adapter davantage le modèle de soins »). En fait, les articles fondateurs du Protocole néerlandais sur les résultats en matière de santé mentale reposaient sur un examen rétrospectif des dossiers médicaux, et au moment où le document final a été publié en 2014, les cliniciens du CEGD avaient déjà contribué à ancrer l'approche de traitement de la clinique dans des directives officielles et internationales. Continuer à étendre la fourniture de traitement au CEGD (par exemple, la suppression des limites d'âge pour les interventions endocriniennes, abaisser l'âge de la mastectomie à 16 ans) au lieu de se recalibrer après un résultat négatif (décès d'un patient) ne reflète pas un développement judicieux des voies de soins. On ne sait pas si le décès du patient de la cohorte initiale de 70 patients a été signalé au comité d'examen de l'éthique de l'hôpital et, dans l'au cas, quelles mesures ont été prises pour protéger les autres patients. Les résultats originaux de la santé mentale ont reçu l'approbation éthique, mais la plupart des études CEGD ultérieures étaient des examens rétrospectives de la base de données du registre des patients de la Cohorte de la dysphorie de genre d'Amsterdam et ont été exemptées de cette exigence.

Nous sommes d'accord avec le récent article de Donkin et al. (Citation2026), qui exhorte les cliniciens et les chercheurs travaillant dans ce domaine « à faire face objectivement aux défis et aux incertitudes, en utilisant des preuves solides ». Donkin et al. soulignent que parce que les cliniciens/chercheurs « ne veulent pas croire qu'ils peuvent nuire aux enfants », ils peuvent utiliser des stratégies de « déni et de rationalisation ». Nous craignons que de Vries et al. (Citation2026) L'examen narratif peut mettre en évidence ces stratégies : manque d'engagement avec les résultats des SR comme déni et recherche d'une justification clinique alternative comme rationalisation. Dans le contexte d'une intense controverse internationale sur les soins aux enfants et aux adolescents atteints de MG, la communauté médicale au sens large doit reconnaître et rejeter de telles stratégies.

La collecte d'une mine d'informations n'équivaut pas automatiquement à effectuer d'excellentes recherches si la méthode scientifique n'est pas rigoureusement appliquée. The de Vries et al. (Citation2026) Le document de synthèse ne tient pas compte des preuves de haut niveau provenant de 6 ans d'examens systématiques lorsqu'il arrive, de manière injustifiée, à la conclusion que les propres recherches des auteurs fournissent un soutien solide à la continuité de la Fourniture de PB, de CSH et de chirurgies. En d'autres termes, divers groupes d'évaluateurs experts indépendants, certains commandés par les principales autorités sanitaires, ont constaté que la recherche sur le CEGD ne fournit pas de preuves fiables sur les effets de ces interventions sur divers résultats en matière de santé. Mais dans leur document de synthèse, de Vries et al. ignorent cela et évaluent eux-mêmes la recherche du CEGD - leur propre travail. Dans leur estimation, leurs recherches soutiennent « plus de confiance » dans l'utilisation d'interventions invasives et qui modifient la vie pour les enfants et les adolescents en bonne santé physique : des interventions qui peuvent causer de l'infertilité et qui sont associées à d'autres risques importants pour la santé. Simultanément, de Vries et al. reconnaissent que le domaine doit décider « de la meilleure façon d'évaluer l'efficacité » de ces interventions. Ainsi, malgré leurs assurances, on ne sait toujours pas exactement en quoi ces chercheurs ont « le plus confiance ».

Les conclusions de l'article de revue narrative de l'équipe du CEGD devraient faire l'objet d'un sérieux scepticisme. Historiquement, l'élévation de l'opinion d'experts par rapport aux preuves a souvent entraîné des dommages iatrogènes substantiels (Baxendale, Citation2025; D'Angelo, Citation2026). Le rejet de preuves de haut niveau à partir de revues systématiques et l'indécision et l'instabilité concernant la justification clinique de base devraient également inciter la communauté médicale aux Pays-Bas et ailleurs à se demander si le CEGD atteint actuellement ses objectifs de protection et de promotion des meilleurs intérêts de ce groupe de patients vulnérable.

Abréviations

Centre d'expertise sur la dysphorie de genre (CEGD), la dysphorie de genre (GD), la société endocrinienne (ES), les bloqueurs de la puberté (PB), les hormones intersexuées (CSH), la médecine factuelle (EBM), Association professionnelle mondiale pour la santé des transgenres (WPATH)

Reconnaissance

Les auteurs aimeraient remercier Alex Byrne, Moti Gorin et Yuan Zhang pour leurs commentaires utiles sur les premières ébauches de cet article.

Déclaration de divulgation

K.M. a contribué aux États-Unis. Examen des données probantes du ministère de la Santé et des Services sociaux sur ce sujet. Il n'y a pas d'autres intérêts concurrents.

Déclaration de disponibilité des données

Le partage de données ne s'applique pas à cet article car aucune nouvelle donnée n'a été créée ou analysée.

Notes

1 L'aperçu des preuves menée en 2025 pour les États-Unis. Le ministère de la Santé et des Services sociaux, par exemple, a synthétisé les preuves de sept SR rigoureuses examinant les PB, la CSH et/ou la chirurgie.

2 Expérience personnelle du premier auteur.

3 On prétend parfois que toutes ou la plupart des études d'observation dans ce domaine, même si elles sont de faible qualité, ont généralement pointé dans la même direction (par exemple, pour trouver des améliorations de la santé mentale), mais ce n'est pas le cas (McDeavitt, Citation2024; McDeavitt et al., Citation2025). (Si de nombreuses études de cohorte longitudinales bien menées avaient toutes trouvé des améliorations dans les mêmes mesures et signalé de grandes tailles d'effet, des revues systématiques auraient trouvé des preuves de meilleure qualité pour un effet directionnel sur les résultats en matière de santé mentale).