Le préprint (ou prépublication, ou manuscrit auteur) a fait une irruption récente, mais tonitruante, dans le domaine médical à la faveur de la pandémie de Covid-19. Un préprint est une version d'un article scientifique qui précède son acceptation par le comité de rédaction d'une revue scientifique. Il ne comprend donc pas les modifications réalisées par l'auteur (ou les auteurs) à la demande du comité de lecture, lors du processus d'évaluation par les pairs, ni les corrections et la mise en page réalisées par l'éditeur. Le préprint est utilisé de longue date par les chercheurs en physique théorique, qui avaient pour habitude de distribuer leurs manuscrits par courrier avant publication afin de se préserver des retards abusifs ou des vols d'idées par les rapporteurs sous couvert de confidentialité. Une archive ouverte de prépublications électroniques d'articles scientifiques, ArXiv, est développée en 1991, puis hébergée par l'université de Cornell (États-Unis). Les sciences sociales suivent en 1994, puis l'économie en 1997. La décennie 2010 verra le développement de plusieurs serveurs de prépublications, avec notamment la plateforme BioRxiv pour la biologie, créée par le laboratoire Cold Spring Harbor, où travaillent plus de 600 chercheurs (État de New-York). À l'été 2019, les créateurs de BioRxiv, associés au British Medical Journal et à l'université de Yale, ouvrent la plateforme MedRxiv, dédiée à la médecine et couvrant une cinquantaine de domaines [1]. Le monde médical était réticent en raison des risques pour les patients et les médecins engendrés par le fait de s'appuyer sur des études non validées par les pairs, c'est‑à‑dire non relues et non critiquées par d'autres scientifiques (méthode apparentée à la démocratie définie selon Winston Churchill comme un mauvais système, mais le moins mauvais de tous). Il est recommandé que ces sites de préprint comportent, comme MedRxiv, une note du type : “Attention : les préprints sont des rapports préliminaires de travaux qui n'ont pas été certifiés par un examen par les pairs. Ils ne doivent pas servir à orienter la pratique clinique ou les comportements liés à la santé et ne doivent pas être présentés dans les médias comme des informations établies.” Le démarrage de MedRxiv sera laborieux, mais l'épidémie de Covid-19 va tout changer ! La pandémie va gagner la planète des préprints, et l'avertissement de prudence sera peu respecté.
De nombreuses équipes de recherche vont rapidement se consacrer à la thématique de la Covid-19 dans tous les domaines, mais en premier lieu dans le domaine médical et inonder les sites de préprint de publications de niveaux très variables.
Sur les plateformes MedRxiv et BioRxiv, le nombre de préprints était de 1 500 le 11 avril 2020, de 3 000 le 8 mai et atteignait 4 000 le 2 juin. Le secteur traditionnel des articles adressés à des revues connaissait également une inflation record. À la date du 25 juin 2020, il y avait 25 945 articles indexés “Covid-19” dans PubMed. La croissance a été exponentielle, car il y en avait 5 000 le 15 avril 2020 et 13 100 le 16 mai, et une “news” publiée le 13 mai par Science estimait que le nombre d'articles doublait tous les 20 jours [2].
La politique s'est emparée de ce flot de communications. Des pressions ont été exercées sur les éditeurs pour permettre un accès libre et gratuit aux communications ayant trait à la Covid-19, bien que la moitié d'entre elles demeure malgré tout payante. La base de données américaine CORD-19 (Covid-19 Open Research) a été créée fin mars, avec le soutien de la Maison Blanche, et recense tous les articles possibles sur les coronavirus depuis 1950, soit 130 000. Le but est d'extraire de cette base, grâce à des techniques d'intelligence artificielle, des données pertinentes, mais seulement 40 000 articles de la base comportaient le texte intégral nécessaire au “data mining” ou exploration de données. L'Académie américaine des sciences et l'OMS ont identifié 10 questions prioritaires à résoudre en s'aidant des données de CORD-19.
Plus modestement, mais de façon extrêmement utile pour le clinicien ou tout simplement le médecin curieux, un petit groupe d'internes du CHU de Grenoble a mis en place une veille avec analyse bibliographiquedès le début de la pandémie, en février, avec l'aide de la Fabrique VingtCinq, une agence spécialisée dans le numérique. Les publications jugées les plus intéressantes sont répertoriées et synthétisées grâce à un résumé des principaux résultats, l'essentiel à retenir et le niveau de preuve. 670 articles figuraient dans cette base le 30 juin, et ce travail remarquable doit être salué (bibliovid.org).
La pandémie de Covid-19 a eu pour effet bénéfique de raccourcir de moitié les délais de relecture et de publication par les grandes revues, mais des erreurs vont ébranler les certitudes sur la qualité des publications des grandes revues. Les principales revues internationales sont contrôlées par les géants de l'édition scientifique que sont Elsevier, Springer ou Wiley. Ces conglomérats vendent à prix fort des packages d'abonnement aux bibliothèques universitaires contraintes de passer sous leurs fourches Caudines. On comprend que ces sociétés luttent contre le modèle de l'open access. Elsevier, propriétaire du Lancet et de 2 500 revues, dégageait en 2018 un bénéfice de 1 milliard d'euros, avec une marge de 35 %, soit celle de l'industrie du luxe. Le retrait de 2 articles sur la Covid-19 s'appuyant sur une base de données de 96 000 patients hospitalisés dans 671 hôpitaux de la société Surgisphere dirigée par l'un des auteurs, Sapan Desai, montre cependant l'insuffisance du travail d'évaluation des revues les plus prestigieuses (The New England Journal of Medicine pour un article sur l'absence de conséquence des antihypertenseurs sur la mortalité des patients atteints de Covid-19 et The Lancet pour l'article décrivant une augmentation de la mortalité et des troubles du rythme cardiaque chez les malades traités par chloroquine ou hydroxychloroquine).
Les tarifs prohibitifs de ces revues ont favorisé le développement de l'open access, l'accès au document étant libre pour le lecteur, mais l'auteur ou son institution payant des APC (article processing charges) pour financer la publication. Ce système d'auteur payeur a entraîné la création de “revues prédatrices” n'offrant aucune expertise et diffusant des informations fausses ou trompeuses (par exemple, la théorie de la création du Sars-CoV-2 par l'homme à partir du VIH et du virus du SRAS, énoncée par J.C. Perez, mathématicien, dans l'International
Journal of Research – Granthaalayah, théorie soutenue par L. Montagnier, prix Nobel de médecine). Ces revues, pas toujours faciles à identifier, garantissent une publication rapide avec un APC très bas (< 150 $) et ont généralement une adresse mail non professionnelle.
Enfin, les polémiques autour du Pr D. Raoult, éminent chercheur avec 2 974 occurrences dans PubMed de 1979 au 7 septembre 2020 (et un record annuel de 282 publications référencées en 2016), ont mis en lumière que prendre le contrôle d'une revue peut faciliter les publications d'un auteur ou d'un groupe de chercheurs. La revue New Microbes and New Infections, fondée en 2013, éditée par Elsevier, a publié, au 10 juin 2020, 742 articles. Une analyse bibliométrique a été réalisée par Y. Gingras et M. Khelfaoui, professeurs de l'université du Québec à Montréal [3]. La France, avec 373 articles, représentait 50 % du total des articles, alors que ce pays n'a produit que 7 % des publications mondiales en virologie, contre 41 % pour les États-Unis. Sur les 373 publications françaises, 337 (soit 90 %) contenaient au moins une adresse institutionnelle de chercheurs basés à Marseille, et 234 (soit les deux tiers) étaient cosignées par le Pr D. Raoult. Le rédacteur en chef est basé à Marseille, de même que 5 des 6 membres français du comité scientifique composé de 15 personnes, ce qui peut expliquer la domination des publications issues de cette ville dans une revue dite internationale. La pratique des “dirty hands” [4] semble fréquente pour le Pr D. Raoult, qui apparaît comme un auteur incontournable des publications issues de l'IHU Méditerranée Infection.
Finalement, la pandémie de Covid-19 nous instruit sur les problèmes actuels des publications scientifiques : rythme délirant des publications, développement exponentiel des préprints, frontières souvent floues entre open access et “revues prédatrices”, contrôle de certaines revues scientifiques au bénéfice de petits groupes de chercheurs.