top of page

Magali Pignard : Hormones chez les ados : comment l’étude de Chen induit le lecteur en erreur

  • Photo du rédacteur: La Petite Sirène
    La Petite Sirène
  • 23 mai
  • 9 min de lecture

Dernière mise à jour : 10 juin



Ce post analyse une étude très médiatisée, publiée dans le New England Journal of Medicine (Chen et al., 2023), souvent citée comme preuve en faveur des traitements hormonaux chez les jeunes s’identifiant comme transgenres. Afin de rendre les problèmes méthodologiques accessibles à un large public, je commence par présenter une étude fictive - reproduisant les mêmes biais - avant d’aborder le cas réel.

La rigueur méthodologique constitue un fondement central de la recherche clinique. Elle nécessite le respect du protocole pré-enregistré, la transparence dans la présentation des résultats, et une interprétation prudente des résultats. Le contournement de ces principes compromet la fiabilité de l’ensemble d’une étude.


Afin d’illustrer concrètement ce type de dérive, présentons une étude fictive.


1. Étude fictive sur les effets de la Cyclotramine* sur la santé mentale et le bien-être psychosocial dans le trouble bipolaire


Imaginons une étude prospective visant à évaluer l’effet de la Cyclotramine un nouveau traitement stabilisateur de l’humeur, sur la santé mentale et le fonctionnement psychosocial de 300 personnes atteintes de trouble bipolaire. Dans ce projet ambitieux, les chercheurs suivent les participants pendant 24 mois, évaluant une quinzaine de variables liées au bien-être et à la santé mentale tous les trois mois. L’étude ne comporte pas de groupe contrôle.

*Cyclotramine : nom fictif


Protocole pré-enregistré


Dans leur protocole pré-enregistré (déposé avant le début du recrutement des participants, comme il se doit), les chercheurs formulent l’hypothèse que la Cyclotramine entraînera une amélioration des huit variables suivantes :

Manie/Hypomanie ; Anxiété ; Dépression ; Suicidalité ; Irritabilité ; Qualité de vie ; Fonctionnement global ; Automutilation.


Des hypothèses solides… jusqu’aux résultats décevants

Après deux années de suivi, le constat est sans appel : six de ces huit variables n’ont montré aucune amélioration. Seules l’anxiété et la dépression baissent légèrement — et encore, uniquement chez la moitié des participants. Les effets sont statistiquement faibles, et cliniquement insignifiants.


Publication finale : les règles du jeu changent

C’est ici que les choses prennent une tournure surprenante :

Dans la publication finale, les hypothèses sont discrètement révisées, de manière à écarter (sans explication) les six variables principales qui n’ont montré aucune amélioration.


Ne subsistent donc que la dépression et l’anxiété — les deux seules variables du

protocole ayant montré une légère amélioration — auxquelles les auteurs ajoutent trois nouvelles variables : l’estime de soi, l’affect positif et… la satisfaction thérapeutique.

Cette dernière est évaluée par un questionnaire auto-rapporté comportant deux sous-échelles, mais seule la satisfaction thérapeutique est présentée, sans mention de l’autre sous-échelle ni justification de cette omission.


Fidélité au protocole, vraiment ?


Malgré ces ajustements post-hoc — suppression de six variables clé du protocole, ajout de trois nouvelles variables, et sélection partielle des résultats — les auteurs déclarent garantir la conformité de l’étude au protocole.


Une variable providentielle


Comme par un heureux hasard, la seule variable à montrer un effet notable chez tous les participants est justement cette fameuse « satisfaction thérapeutique » introduite a postériori. Et c’est autour d’elle que l’article s’organise. Les auteurs vont jusqu’à la présenter comme un « objectif principal » du traitement alors même qu’elle ne figurait nulle part dans les hypothèses de départ.


À l’aide de modèles statistiques complexes, les auteurs avancent que l’amélioration de cette satisfaction thérapeutique expliquerait l’effet du traitement sur la santé mentale et le bien-être psychosocial, bien que leurs propres résultats contredisent cette suggestion : les autres variables rapportées - dépression, anxiété, affect positif, estime de soi - ne s’améliorent que légèrement chez une moitié des participants, et pas du tout chez les autres.


Et la conclusion ?


Tout au long de l’article, les auteurs répètent que leur étude montre que la Cyclotramine améliore la santé mentale et le fonctionnement psychosocial.


En résumé, selon eux : ce médicament est efficace.

  • Même si la plupart des résultats rapportés ne vont pas dans ce sens.

  • Même si les hypothèses ont été modifiées après coup.

  • Même si on ne sait rien de l’évolution de ¾ des variables principales pour lesquelles les chercheurs avaient prédit une amélioration.

  • Même si toute la démonstration repose sur une seule variable secondaire, ajoutée après l’analyse.

  • Et même si - détail non négligeable - les traitements concomitants (psychothérapie, antidépresseurs, stabilisateurs de l’humeur…) n’ont jamais été contrôlés, rendant impossible toute conclusion sérieuse sur l’effet propre de la Cyclotramine.


Un tel article serait au minimum corrigé… sauf dans un domaine

Dans n’importe quel autre domaine de la médecine, une telle publication - qui modifie ses hypothèses a posteriori sans justification, sélectionne les seuls résultats favorables et passe sous silence les données négatives - provoquerait des critiques immédiates, entraînant au minimum une correction, voire une rétractation.

Sauf dans un domaine : la médecine pédiatrique du genre.


2. L’étude de Chen et al. : un cas bien réel


Aussi surprenant que cela puisse paraître, l’exemple fictif présenté plus haut est directement inspiré d’une étude bien réelle, encensée par les médias et une grande partie de la communauté médicale. Il s’agit de l’étude de Chen et al., publiée en 2023 dans le prestigieux New England Journal of Medicine :



Cette étude évalue les effets des hormones sexuelles chez 315 adolescents s’identifiant comme transgenres ou non binaires. Les auteurs ont mesuré une quinzaine de variables psychosociales sur une période de 24 mois, à intervalles de six mois.


Dans l’article publié, cinq résultats sont rapportés : une légère amélioration de la satisfaction de vie, de l’affect positif, de la dépression et de l’anxiété chez les filles natales ; aucune amélioration chez les garçons. Seule la variable de « congruence de l’apparence » montre une taille d’effet élevée, pour l’ensemble des participants.


Parallèle méthodologique par rapport à l’étude fictive

Hypothèses modifiées après observation des résultats


Comme décrit en détail par Singal (2023, traduit en français), les hypothèses formulées dans l’article publié (Chen et al., 2023, p. 241) diffèrent sensiblement de celles annoncées dans le protocole pré-enregistré (p. 36/44 de la version finale du protocole 2021).

Cette révision, intervenue après l’observation des résultats, n’est jamais mentionnée comme telle dans la publication — ce qui correspond à un cas classique de HARKing (Hypothesizing After the Results are Known, Kerr,1998).


Omission sélective des variables clé


La réécriture des hypothèses a entraîné :

  • Une mise à l’écart de 75 % des variables clés (6 sur 8) pour lesquelles les auteurs s’attendaient initialement à une amélioration : Suicidalité, Dysphorie de genre, Qualité de vie, Estime corporelle, Troubles liés aux traumatismes, Automutilation. Ces variables ont pourtant bien été mesurées à chaque point du suivi (cf. p. 22 à 28/44 de la version finale du protocole 2021), mais ne sont tout simplement pas rapportées, sans justification.

  • L’introduction de trois nouvelles variables également sans justification : affect positif, satisfaction de vie, et congruence de l’apparence. Cette dernière n’est pas classée par les auteurs eux-mêmes comme une variable psychosociale. Il s’agit d’une sous-échelle de la Transgender Congruence Scale (TCS), administrée en totalité, mais dont seule cette composante est rapportée.


Le tableau ci-dessous illustre les conséquences de la réécriture de ces hypothèses

Variables évaluées

Amélioration significative/sexe

Dépression

Seulement les femmes natales

Effet faible (d = 0,20)

Anxiété

Seulement les femmes natales

Effet faible (d = 0,25)

Congruence de l’apparence*

Hommes et femmes

Effet élevé (d = -1,12)

Affect positif*

Seulement les femmes natales

Effet très faible (d = -0,06)

Satisfaction de vie*

Seulement les femmes natales

Effet faible à modéré (d = -0,39)

Suicidalité

?

Dysphorie de genre

?

Qualité de vie

?

Estime corporelle

?

Troubles liés aux traumatismes

?

Automutilation

?

Acceptation de l’identité de genre*

?

*non présentes dans les hypothèses du protocole pré-enregistré

Taille d’effet : 0,20 : faible, 0,50 : modéré, > 80 : élevé

Les tailles d’effet sont celles rapportées dans le tableau S5 de l’annexe supplémentaire de l’étude.


Une déclaration contredite par les faits


Malgré ces écarts notables entre le protocole et l’article final, les auteurs affirment sans détour :

« Les auteurs garantissent l’exactitude et l’exhaustivité des données, ainsi que la conformité de l’étude au protocole ». (Chen et al., 2023, p. 247)


Une variable secondaire devenue pilier de l’analyse


La congruence de l’apparence, introduite après coup, devient pourtant le pivot de l’analyse.

Elle est soudain présentée comme un « objectif principal » du traitement. Pour la valoriser, les auteurs mobilisent des modèles statistiques complexes (modèles de croissance latente parallèles) visant à démontrer que cette variable est un mécanisme potentiel par lequel le traitement hormonal influence le fonctionnement psychosocial[1].

Or, cette hypothèse est contredite par leurs propres résultats : les variables psychosociales publiées ne s’améliorent que faiblement chez les filles, et pas du tout chez les garçons.


Des résultats partiels et fragiles mis en avant pour affirmer un bénéfice global inexistant


En dépit de l’absence d’amélioration significative de la majorité des résultats psychosociaux rapportés, et en l’absence de groupe contrôle, les auteurs généralisent leurs conclusions. L’article contient plusieurs affirmations fortes, telles que :

« Nos résultats ont montré des améliorations du fonctionnement psychosocial sur deux années de traitement par hormones sexuelles croisées » (p. 249) ; « Les augmentations de la congruence de l’apparence étaient associées à une diminution des symptômes de dépression et d’anxiété, ainsi qu’à une augmentation de l’affect positif et de la satisfaction de vie » (p. 245).


Et en conclusion :

« Nos résultats ont montré des améliorations du fonctionnement psychosocial sur deux années de traitement par hormones sexuelles croisées, ce qui soutient leur utilisation comme traitement efficace […] Globalement, nos résultats apportent des éléments en faveur d’un effet bénéfique des hormones sexuelles croisées sur la congruence de l’apparence et le fonctionnement psychosocial » (p. 249).


Au-delà des affirmations finales, une faille méthodologique majeure rend ces conclusions intenables : les deux dernières formulations laissent entendre que les hormones sexuelles croisées sont responsables des améliorations observées. Or, cette conclusion est méthodologiquement indéfendable : l’étude ne contrôle à aucun moment les traitements concomitants reçus par les participants (antidépresseurs, anxiolytiques, psychothérapies, etc.). Aucun ajustement statistique n’est effectué pour en isoler les effets. Dans ces conditions, il est impossible de savoir si les quelques évolutions observées sont dues aux hormones sexuelles croisées, ou à d’autres traitements concomitants (par exemple, certains participants avaient une dépression sévère au début de l'étude, et prenaient probablement des antidépresseurs en plus des hormones sexuelles croisées).


Le double standard éditorial


Dans n’importe quel autre domaine de la médecine, une étude qui modifie ses hypothèses après coup, ne rapporte pas les résultats négatifs et met en avant une variable introduite a posteriori ferait l’objet de critiques immédiates, voire de demandes de rétractation. Et c’est précisément ce qui s’est produit ici : plusieurs chercheurs ont soumis des lettres à l’éditeur et des demandes de correction (Biggs (2023a) ; Hare (2023) ; Jorgensen (2023c)). Mais le New England Journal of Medicine n’a apporté aucune correction à ce jour, ni publié de réponse substantielle à ces critiques. L’article reste inchangé, comme si les objections méthodologiques n’avaient pas lieu d’être.


Les conséquences concrètes d’un récit biaisé

Ce décalage entre les résultats effectivement mesurés et les conclusions rapportées risque de tromper les cliniciens, les familles et les jeunes eux-mêmes : un professionnel pourrait ainsi être amené, à tort, à conclure que les hormones sexuelles croisées améliorent de manière significative le fonctionnement psychosocial de ces jeunes.

Or, dans le cadre du consentement éclairé, il est essentiel que les professionnels transmettent aux jeunes et à leurs familles des informations équilibrées, transparentes et fondées sur des données solides. En amplifiant les bénéfices supposés, ce type de publication compromet la possibilité d’un consentement réellement éclairé.


Par ailleurs, les bénéfices potentiels des hormones, déjà jugés de certitude faible à très faible par les principales revues systématiques (dont la plus récente : Miroshnychenko et al., 2025), doivent être mis en balance avec les risques importants : fragilité osseuse et troubles cardiovasculaires (Chan Swe et al., 2022), impact sur la fertilité (Stolk et al., 2023), dysfonctions sexuelles (Kronthaler et al., 2024 ; da Silva et al., 2024), ainsi que des effets encore inconnus à long terme liés à leur usage dès l’adolescence (Cass Review, 2024, point 90).

Ces traitements sont en outre prescrits à une population dont l’identité et les priorités sont largement susceptibles d'évoluer avec du temps (Cass Review 2024, 16.10, Bachmann et al. 2024, Rawee et al. 2024, Sapir, 2024).


Dans un tel contexte, la rigueur scientifique est une exigence éthique. Tant que les données restent aussi fragiles, il est impératif d’adopter une approche prudente, fondée sur des preuves robustes, avant de généraliser ou de médicaliser davantage des jeunes en pleine construction de leur identité.


[1] À la différence de l’étude fictive, l’hypothèse avancée par Chen et al. (selon laquelle la congruence de l’apparence pourrait améliorer le fonctionnement psychosocial) s’appuie sur un raisonnement psychologique plus crédible. Toutefois, le problème ne réside pas tant dans la plausibilité théorique de cette hypothèse que dans la manière dont elle est utilisée : formulée après coup, elle devient le pilier interprétatif d’un article qui passe sous silence la majorité des variables cliniques initialement prévues.

 


À savoir : Les auteurs d'un article du British Medical Journal ont évalué cette étude en utilisant deux outils :

  • Échelle de Newcastle-Ottawa (utilisée dans la revue systématique sur les hormones qui informé le Cass Review ; cette revue n'a pas évalué cette étude car elle a été publiée après la recherche des études).

     Score total : 5/7, qualité « modérée » (cette échelle ne prend pas explicitement en compte le phénomène de HARKing).


  • Risk of Bias in Non-Randomised Studies - of Interventions (ROBINS-I) (voir l'annexe supplémentaire en ligne, appendice 3 ).

    Risque biais : critique.



Comments


  • YouTube
bottom of page