Philippe Aigrain

De l’accès libre à la science ouverte

Une version de ce texte a été présentée par Philippe Aigrain au titre d’une conférence invitée lors de la Berlin 6 Open Access Conference à Dusseldorf en novembre 2008. Il s’agit ici d’une version remaniée par l’auteur à partir de la présentation orale.

Philippe Aigrain est informaticien et analyste des enjeux informationnels. Il dirige Sopinspace une société spécialisée dans les outils et services du débat public utilisant internet.

Il est l’auteur en 2005 de Cause commune : l’information entre bien commun et propriété, Fayard/Transversales, qui fut le premier livre publié en français sur les biens communs de la connaissance. (http://causecommune.org), et de Internet & Création : comment reconnaître les échanges sur internet en finançant la création, (Éditions In Libro Veritas, 2008), un livre où il développe une approche globale permettant de repenser la rémunération de la création en s’appuyant sur le partage et les communs.

Membre fondateur de l’association La quadrature du net (http://www.laquadrature.net), Philippe Aigrain développe régulièrement ses idées sur son blog : http://paigrain.debatpublic.net/

Les publications scientifiques, entre propriété et bien commun

Le mouvement pour l’accès libre aux publications scientifiques est né d’une révolte interne aux milieux scientifiques. La concentration croissante de l’édition de journaux scientifiques, l’envolée des coûts des abonnements à la fin des années 80 les ont rendu inaccessibles aux pays en développement mais aussi aux bibliothèques universitaires de nombreux pays développés. Cela constituait de nouveaux obstacles mis à la diffusion rapide et générale des articles[ 1 ] qui éloignaient sans cesse la réalité de l’édition scientifique de l’idéal d’un partage du savoir. Cette évolution était d’autant plus paradoxale que la généralisation de l’accès à internet dans les institutions scientifiques rendait possible une diffusion rapide et universelle des publications. On retrouve ici une caractéristique commune à de nombreux domaines : le développement des Technologies d’Information et de Communication (TIC) conduit à des mouvements contradictoires[ 2 ]. Pour ceux qui voient dans les TIC une occasion de maximiser les profits qu’ils tirent de l’information, il est naturel de mettre en place toujours plus de contrôles et de restrictions à l’accès, et lorsqu’on parvient à installer des monopoles ou oligopoles, de s’en servir pour fixer des prix arbitraires. Pour ceux qui voient dans les TIC un outil de partage des connaissances et de collaboration, les échanges libres hors marché s’imposent comme un choix naturel, pour peu que l’on rompe avec le dogme selon lequel seul ce qui a un prix aurait une valeur.

Des archives à la prise en main du devenir des publications scientifiques

Les premières actions de ce qui devint plus tard le mouvement pour l’accès libre se concentrèrent sur les besoins immédiats des scientifiques eux-mêmes : comment garantir aux scientifiques de chaque discipline un accès rapide aux publications ? C’est ainsi que se développèrent des « archives » dans lesquelles les scientifiques déposaient soit les versions avant publication de leurs travaux (preprints – prépublications) soit les articles publiés (reprints). Ces archives en libre accès pour tous, y compris en dehors de la discipline concernée, ont favorisé le développement de mécanismes d’indexation et de recherche des publications adaptés à l’internet. Le projet arXiv[ 3 ] mis en place à partir de 1991 par Paul Ginsparg, mobilisant essentiellement dans un premier temps les physiciens des hautes énergies, est typique de cette approche « archivage » de l’accès libre. Le but n’était pas de modifier l’organisation du système des journaux scientifiques, ni de concurrencer le modèle économique des éditeurs scientifiques. Compte tenu de la spécificité de cette discipline scientifique, qui vivait largement par l’échange de prépublications, l’archivage permettait simplement de garantir la rapidité d’accès aux publications. Un besoin essentiel pour les communautés scientifiques.

Mais bien sûr, l’archivage ou encore la simple mise en ligne par les chercheurs sur leur propre site, parfois appelée auto-archivage, interagissent avec les politiques des éditeurs. Certains journaux n’autorisent pas la mise en ligne des articles, ou ne le tolèrent qu’après un très long délai. D’autres refusent de publier des articles dont les brouillons ont été mis en ligne avant publication. Ces tensions ont été au cœur de la première stratégie pour le libre accès – baptisée parfois Green road to open access – qui œuvrait pour que les chercheurs obtiennent le droit le plus large possible d’archivage de leurs propres publications. Ce mouvement demande également aux organismes de financement public de la recherche d’imposer systématiquement l’archivage en accès libre[ 4 ] (avec un délai plus ou moins bref après parution) des publications résultant des travaux qu’ils ont soutenus.

D’autres chercheurs (ou les mêmes dans d’autres contextes) se sont fixés un objectif plus immédiatement ambitieux : créer des journaux scientifiques administrés par la communauté scientifique elle-même et développant des modèles économiques originaux pour assurer une diffusion en libre accès de versions numériques des publications. Cette seconde voie appelée Golden road to open access, part d’un constat simple : les scientifiques font déjà aujourd’hui l’essentiel du travail des revues : rédaction et mise en forme des articles, revue et sélection éditoriale, et bien sûr le travail scientifique lui-même. Ne peuvent-ils pas alors s’emparer de ce qui reste, à savoir la gestion du système de réputation et de la diffusion des revues ? Ne sont-ils pas pour cela aidés par la généralisation de l’internet ? Ce choix suppose l’invention de nouveaux modèles économiques – parmi lesquels certains sont en cours d’expérimentation.

Ces deux voies du mouvement des scientifiques pour l’accès libre élargissent en permanence la quantité et la qualité des publications scientifiques accessibles directement par tous. Nous nous proposons de traiter ici les conséquences qui résultent de ce mouvement : que se passe-t-il au-delà de l’accès aux publications ? Celles-ci changent-elles quand leurs rédacteurs savent qu’elles vont être en accès libre ? Les communautés scientifiques se transforment-elles ? Que se passe-t-il pour les données et les outils de la recherche ? Y a-t-il un impact sur les objectifs de la recherche eux-mêmes ? Comment le rapport entre la science et la société se modifie-t-il lorsque de plus en plus de productions scientifiques sont placées sous le statut de bien commun ?

Publications informelles et articles lisibles par l’amateur cultivé

Alors que cela n’était pas leur but originel, les archives de publications sont devenues des moyens de communication directs au sein des communautés scientifiques concernées. Dans un site comme arXiv, on trouve un certain nombre de publications informelles, qui n’ont pas forcément vocation à devenir des publications classiques. Même si leur nombre reste limité en proportion des plus de 500 000 publications archivées dans arXiv, ces publications informelles n’ont pas fait l’objet de « revues par les pairs ». Seule une étude d’envergure permettrait d’évaluer leur qualité, mais un simple butinage dans des champs connus de l’auteur montre que certaines publications informelles sont d’une qualité significative[ 5 ]. Fait intéressant, ces publications semblent émaner souvent de chercheurs de pays émergents ou concerner des travaux interdisciplinaires.

Les archives de publications n’ont pas été conçues pour cet usage, et l’immense majorité des publications informelles passe par d’autres canaux : sites web personnels des auteurs, sites fédérant des communautés de recherche[ 6 ]. Il est encore trop tôt pour savoir si ce type d’exposition précoce de travaux à l’accès général modifiera en profondeur les pratiques scientifiques.

De façon peut-être plus significative, l’étude des publications des journaux en libre accès montre des modifications dans le style même de rédaction des articles, en comparaison avec des publications propriétaires. Des champs comme la biologie et les biotechnologies se caractérisent par des structures d’articles normalisées qui facilitent la lecture pour le spécialiste[ 7 ], mais aussi par un jargon très hostile au lecteur qui n’est pas spécialiste de la discipline ou même de la micro-discipline concernée, même lorsqu’il est doté d’une bonne culture générale scientifique. C’est dans ce domaine de la recherche biologique et biomédicale que s’est développée l’une des initiatives emblématiques des publications en accès libre : la création de la Public Library of Science (PLoS)[ 8 ]. PLoS édite des journaux en ligne mais aussi des versions imprimées de certains de ces journaux. On peut noter plusieurs tendances intéressantes dans les articles de PLoS Biology, PLoS Medicine ou PLoS Pathogens :

— en complément au « résumé » (abstract) formel, souvent illisible pour le non-spécialiste, un résumé spécifique a été ajouté afin de présenter les résultats de l’article pour le lecteur non-spécialiste[ 9 ] ;

— plus généralement, les articles incluent plus d’éléments de contexte et de justification ;

— les articles les plus lus sont ceux qui traitent de sujets intéressant aussi les lecteurs de disciplines voisines (par exemple épidémiologie, santé publique) ;

— de façon liée, on voit apparaître un plus grand nombre d’articles multidisciplinaires, sans qu’il soit aisé de savoir s’il s’agit d’une ligne éditoriale ou si cela reflète une évolution des soumissions.

Les processus qui entourent les publications évoluent également. Ainsi la Public Library of Science a-t-elle créé un journal expérimental – Plos-ONE[ 10 ] – avec un processus de revue rapide (un mois ou un mois et demi). Les articles acceptés sont mis en ligne et ouverts aux commentaires du public. Un système d’annotation en ligne spécifique a été développé pour cela, dont les fonctionnalités se rapprochent de systèmes plus généralistes comme co-ment®[ 11 ]. Il s’agit d’un exemple parmi d’autres de l’évolution de l’édition vers un rôle d’animation des échanges des communautés scientifiques.

Des communautés scientifiques à champ plus large et plus ouvert

Les communautés scientifiques concrètes qui forment une micro-discipline se définissent autour d’une ou quelques revues et de quelques conférences. Les éditeurs de journaux propriétaires trouvent un intérêt à la multiplication sans fin des revues – un des facteurs[ 12 ] qui contribue à un émiettement excessif des communautés scientifiques. À l’opposé, les publications en accès libre se créent généralement en couvrant un champ plus vaste, tout en se différenciant au fur et à mesure de leur succès. L’exemple de la Public Library of Science est parlant de ce point de vue : interdisciplinaire dans le domaine biologique, cette revue permet des échanges de savoirs au delà de communautés trop restreintes. Y aura-t-il convergence de ce processus vers un « idéal » qui couvrirait un champ suffisamment large et ouvert pour qu’une mise en correspondance soit possible, mais valorisant tout de même à un travail approfondi et spécifique au sein d’une communauté plus large qui partage des savoirs fondamentaux complexes ?

Science ouverte… ou pas de science du tout : les régimes de biens communs pour les données, les outils et les matériaux de recherche

L’expression « science ouverte » qui donne son titre à ce chapitre peut surprendre : que serait donc une science non ouverte ? Malheureusement, une grande part de la recherche scientifique et technique relève bel et bien d’une telle contradiction dans les termes. Dès 2000 dans une intervention à l’OECD Global Research Village[ 13 ], je soulignais que le simple fait qu’une part importante des résultats scientifiques soit aujourd’hui « enfermée » dans des logiciels propriétaires suffisait, pour de nombreux résultats, à réduire à néant la capacité de vérification par les pairs qui est au principe même de la science. Il n’est donc pas étonnant qu’au-delà des seules publications scientifiques, un vaste mouvement se soit développé pour (re)donner aux données, outils et matériaux scientifiques un statut de biens communs librement utilisables par tous.

La définition de ces régimes de biens communs pose des problèmes importants : il ne suffit pas en effet de transposer l’approche des logiciels libres aux données ou aux matériaux scientifiques (lignées de cellules, variétés végétales, etc.). Plusieurs difficultés se présentent.

Comme il n’existe pas encore de définition directe en droit d’un statut de biens communs volontaires[ 14 ], la mise sous un tel statut passe par l’application de licences. Mais celles-ci doivent s’appuyer sur un droit exclusif (le droit d’auteur ou copyright dans le cas du logiciel et des autres expressions créatives, par exemple), dont elles sont une extension. Or un tel droit exclusif n’existe pas forcément, en particulier dans le cas des données scientifiques[ 15 ], pour lesquelles celui qui a constitué les données est simplement celui qui va décider de les rendre publiques ou non. Lorsqu’un droit exclusif existe, c’est sous des formes (brevets, certificats d’obtentions de variétés végétales) qui freinent trop l’utilisation pour que l’on puisse parler de création d’un bien commun. Ainsi les brevets ont une validité territoriale (ils s’appliquent pays par pays), et la garantie d’un droit d’usage à partir d’une licence de brevets est par nature fragile face à l’existence possible d’autres brevets. On pourrait penser à simplement dire : voilà mes données, voilà mes matériaux biologiques, faites-en ce que vous voulez. Mais certaines données, comme les variations du génome, ont un caractère très sensible (elles peuvent concerner des individus, des familles, des ethnies) et l’accès libre doit s’accompagner de l’adhésion à des principes de bon usage. Dans d’autres cas (variétés végétales), le bien commun doit être protégé contre la réappropriation par ceux qui n’apporteraient que des améliorations mineures sur des lignées ayant déjà une longue histoire de partage dans les communautés paysannes.

Des expérimentations à grande échelle[ 16 ] pour l’élaboration de statuts adaptés aux données scientifiques ont lieu dans des projets comme le Hapmap project[ 17 ], Science Commons[ 18 ], Cambia / BiOS[ 19 ], ou la BioBrick Foundation[ 20 ].

De nouvelles interactions entre science et société

En rendant l’information scientifique plus accessible, plus lisible et plus débattue, l’accès libre a créé l’une des conditions pour qu’émergent de nouvelles interactions entre la recherche scientifique et technique, les citoyens et les organisations de la société civile.

En ce qui concerne l’évolution des communautés scientifiques, l’une des tendances les plus prometteuses issues de l’accès libre est le fait qu’elles réfléchissent de façon plus poussée et ouverte à leur propre devenir. Cette réflexion se fait à travers des articles spécifiques baptisés « essais » mais aussi à travers des articles scientifiques proprement dits. Elles mobilisent les chercheurs spécialisés (par exemple en politique de recherche ou en bibliométrie) mais aussi les chercheurs des disciplines elles-mêmes. Cette tendance est particulièrement sensible dans les domaines liés à la santé publique[ 21 ].

Pour que ces interactions se développent et qu’elles puissent avoir lieu y compris en amont des travaux scientifiques, lors du débat sur les orientations de la recherche et les incitations à innover, il faudra également une modification importante sur l’autre versant : que les citoyens s’approprient des niveaux suffisants de culture scientifique pour pouvoir participer à des dialogues constructifs. La promesse de l’accès libre est peut-être dans la création d’un cercle vertueux en la matière : en rendant la recherche plus accessible, moins étroitement spécialisée, plus réfléchie, on la rend aussi plus attirante, plus accueillante à la curiosité du public.

[ 1 ]

Pour une analyse de fond de l’histoire des publications scientifiques, voir Jean-Claude Guédon, A l’ombre d’Oldenburg : Bibliothécaires, chercheurs scientifiques, maisons d’édition et le contrôle des publications scientifiques ; Colloque ARL, Toronto, mai 2001.
http://archives.univ-lyon2.fr/30/1/oldenburg-jcguedon.pdf

[ 2 ]

Pour une analyse de ces effets contradictoires, voir les deux premiers chapitres de Cause commune : l’information entre bien commun et propriété, par Philippe Aigrain, Paris: Fayard, 2005. http://causecommune.org

[ 4 ]

Le vote d’une loi aux États-Unis imposant un tel mandat d’archivage en accès libre des publications de travaux financés par le NIH (National Institutes of Health, agence de recherche médicale du gouvernement fédéral) a donné lieu à des oppositions très vives de la part des intérêts éditoriaux.

[ 5 ]

Lors de mon exposé à la Berlin 6 Open Access Conference, j’ai attiré l’attention sur deux exemples : Chunxi Li et Changia Chen, Initial Offset Placement in P2P Live Streaming Systems, http://arXiv.org/abs/0810.2063v1; & Soubhik Chakraborty, Sandeep Singh Solanki, Sayan Roy, Shivee Chauhan Sanjaya Sharkar Tripathy and Kartik Mahto, A Statistical Approach to modeling Indian Classical Music Performance, http://arXiv.org/abs/0809.3214v2

[ 6 ]

Voir par exemple la Free / Open Source Research Community du MIT qui a joué un rôle important dans la maturation d’une communauté de recherche sur les logiciels et l’information libres. http://freesoftware.mit.edu/

[ 7 ]

On parle de la structure « IMRAD » : Introduction, Méthode, Résultats et (and) Discussion ; http://en.wikipedia.org/wiki/IMRAD

[ 9 ]

On retrouve ce choix dans certains journaux propriétaires, mais cette innovation est cependant à porter au crédit des journaux en accès libre.

[ 12 ]

Les intérêts propres des chercheurs et des institutions jouent également un rôle dans cet émiettement. Il n’est pas aisé de définir l’optimum en matière de taille d’une communauté de travail concrète.

[ 13 ]

Ph. Aigrain, Open Source Software for Research, OECD Global Research Village Conference, Amsterdam, 2000, http://paigrain.debatpublic.net/docs/GRVproceedings.pdf (page 63-66).

[ 14 ]

Voir mes propositions sur ce plan dans Ph. Aigrain, « Towards a positive recognition of commons-based research and innovation in international norms », version développée d’un exposé au séminaire New Tools for the Dissemination and Knowledge and the Promotion of Innovation and Creativity: Global Developments and Regional Challenges, Alexandrie, Egypte, sept. 2006, http://paigrain.debatpublic.net/docs/Aigrain-Alexandria-080906.pdf

[ 15 ]

Si l’on fait exception de l’aberrante protection des bases de données établie dans l’Union européenne par la directive 96/9/CE, et aujourd’hui remise en cause notamment autour de la libre circulation des données publiques et scientifiques.

[ 16 ]

Pour un traitement plus approfondi, voir Ph. Aigrain, « Innovation partagée et biens communs en biologie », in F. Bellivier et C. Noiville, La bioéquité : Batailles autour du partage du vivant, Éditions Autrement, mars 2009 (ISBN : 978-2746712669).

[ 21 ]

Pour des exemples, voir : M. Ezzati, A. B. Freidman, S. C. Kulkrani, C. J. L. Murray, « The Reversal of Fortunes : Trends in County Mortality Disparities in the United States », PLoS Medicine Vol. 5, No. 4, e66 doi:10.1371/journal.pmed.0050066
& D.A. Brand, M. Saisana, L.A. Lynn, F. Pennoni, A. B. Lowenfels, « Comparative Analysis of Alcohol Control Policies in 30 Countries », PLoS Medicine Vol. 4, No. 4, e151 doi:10.1371/journal.pmed.0040151