Le mensonge statistique extrême

On connait la formule attribuée sans doute à tort à Benjamin Disraeli selon laquelle il y aurait trois sortes de mensonges : les mensonges, les fieffés mensonges et les statistisques. Il va falloir créer une quatrième catégorie de mensonges : les mensonges statistiques extrêmes. J’ai découvert cette nécessité en lisant la dernière livraison de l’intéressant hors-série Les chiffres de l’économie que publie chaque année Alternatives économiques. L’une des rubriques de ce hors série est consacrée à la question « Les inégalités mondiales augmentent-elles ? » et contient un encadré sur la mesure des inégalités planétaires (page 65). Cet encadré reproduit un dogme colporté par certains commentateurs de la mondialisation notamment à la Banque mondiale selon lequel les inégalités planétaires auraient plus ou moins régulièrement diminué depuis 1970. Ces analystes (et Alternatives économiques dans la foulée tout en signalant des problèmes liés) utilisent pour cela un indicateur qui justifie à lui seul la création de la quatrième catégorie, indicateur baptisé « inégalités internationales pondérées par le poids démographique ». Or cet indicateur relève de l’erreur de raisonnement statistique pure et simple. Voici un petit exemple qui permettra à chacun de comprendre pourquoi.

Pays 1 Prop. Pays 2 Prop. Population globale Prop. Pays (pondérés) Prop.
Indiv. 1 10000 0,04 200 0 200 0 28000 0,05
Indiv. 2 20000 0,07 700 0 700 0 28000 0,05
Indiv. 3 50000 0,18 1200 0 1200 0 28000 0,05
Indiv. 4 200000 0,71 1700 0,01 1700 0 28000 0,05
Indiv. 5 2200 0,01 2200 0 28000 0,05
Indiv. 6 3000 0,01 3000 0,01 28000 0,05
Indiv. 7 6000 0,02 6000 0,01 28000 0,05
Indiv. 8 15000 0,05 10000 0,02 28000 0,05
Indiv. 9 50000 0,18 15000 0,03 28000 0,05
Indiv. 10 200000 0,71 20000 0,04 28000 0,05
Indiv. 11 50000 0,09 70000 0,13
Indiv. 12 50000 0,09 70000 0,13
Indiv. 13 200000 0,36 70000 0,13
Indiv. 14 200000 0,36 70000 0,13
Moyenne 70000 1 28000 1 40000 1 1
Total 280000 280000 560000 560000
Gini 0,71 0,88 0,78 0,23

Dans cet exemple nous avons deux pays, un moyen pays riche qui a 4 habitants et un grand pays émergent qui a 10 habitants. Les revenus annuels totaux des habitants de chaque pays sont égaux, mais bien sûr le revenu par habitant est bien plus faible dans le « grand » pays[1]. Les inégalités sont extrêmement fortes dans chaque pays, plus élevées encore dans le grand pays émergent que dans le « moyen » pays riche. Ces inégalités sont mesurées en utilisant un indicateur de Gini qui mesure de combien la distribution des revenus s’écarte d’une distribution parfaitement égalitaire. Qui plus est les inégalités sont également très fortes dans la population mondiale toute entière (lorsqu’on considère la planète comme un seul pays). Et voilà maintenant l’indicateur introduit par nos doctes commentateurs : les inégalités « internationales », mesurée à partir des revenus moyens de chaque pays pondérés par la démographie (et donc prétendant tenir compte des populations), sont beaucoup plus faibles, traduisant même dans notre exemple une situation quasi-égalitaire. Voilà un bien bel indicateur qui peut décrire comme relativement égalitaire une situation dans laquelle les inégalités sont extrêmes dans chaque pays tout comme dans la population mondiale. En pratique, cependant l’indicateur ne donne pas des résultats aussi évidemment biaisés dans les situations réelles (le PIB / habitant des pays émergents restant à l’heure actuelle bien inférieur aux chiffres imaginés ici). Au-delà de la sous-estimation intrinsèque des inégalités qu’il entraîne, c’est l’évolution de l’indicateur dans les conditions de la mondialisation qui l’a rendu si attirant pour certains commentateurs.

Considérons maintenant ce que pouvait être la situation quelques années auparavant. Imaginons que dans ces dernières années une partie des revenus des classes moyennes du pays 1 ait été transférée aux riches du pays 2. Voici un second tableau qui résume l’état des revenus avant ce transfert :

Pays 1 Prop. Pays 2 Prop. Population globale Prop. Pays (pondérés) Prop.
Indiv. 1 10000 0,03 200 0 200 0 25000 0,04
Indiv. 2 30000 0,1 700 0 700 0 25000 0,04
Indiv. 3 70000 0,23 1200 0 1200 0 25000 0,04
Indiv. 4 200000 0,65 1700 0,01 1700 0 25000 0,04
Indiv. 5 2200 0,01 2200 0 25000 0,04
Indiv. 6 3000 0,01 3000 0,01 25000 0,04
Indiv. 7 6000 0,02 6000 0,01 25000 0,04
Indiv. 8 15000 0,06 10000 0,02 25000 0,04
Indiv. 9 40000 0,16 15000 0,03 25000 0,04
Indiv. 10 180000 0,72 30000 0,05 25000 0,04
Indiv. 11 40000 0,07 77500 0,14
Indiv. 12 70000 0,13 77500 0,14
Indiv. 13 180000 0,32 77500 0,14
Indiv. 14 200000 0,36 77500 0,14
Moyenne 77500 1 25000 1 40000 1 1
Total 310000 250000 560000 560000
Gini 0,66 0,88 0,77 0,29

On a donc une situation où dans les dernières années, les inégalités dans chaque pays et les inégalités mondiales ont cru, et pourtant, le merveilleux indicateur de la Banque mondiale a décru. Petit exercice pour les lecteurs, voir s’il est possible de fabriquer un exemple dans lequel tous les indicateurs d’inégalités s’accroissent, y compris celui des inégalités « entre pays » non pondérées par la démographie (indicateur non discuté ici, qui malgré ses biais et son manque de pertinence dans le contexte de la mondialisation actuelle a au moins le mérite de ne pas prétendre être autre chose que ce qu’il est et qui progresse significativement depuis 1982) et pour lequel l’indicateur des « inégalités internationales pondérées par le poids démographique » baisse néanmoins (conseils : introduire un 3ème pays, très pauvre et dont la pauvreté s’accroît et effectuer des transferts qui creusent plus encore les inégalités dans les pays concernés). Si l’indicateur des inégalités internationales pondérées par la démographie a été sélectionné, c’est qu’il était le seul capable de faire apparaître un progrès dans une situation d’aggravation désastreuse des inégalités, et pour y parvenir il utilise une erreur mathématique[2] et un artifice (attribuer à tous les habitants d’un pays le revenu moyen de ce pays) qui auraient du faire hurler les chercheurs.

Les auteurs de la section « inégalités mondiales » dans le hors-série ajoutent ce commentaire :

Pour mesurer les […] inégalités mondiales, il faudrait disposer d’une base de données homogènes des revenus de tous les habitants de la planète. Une telle base n’existe pas, c’est pourquoi les différentes estimations sont entachées de nombreuses incertitudes, sans aboutir à des conclusions convergentes

Louable précaution de rigueur. Mais signalons tout de même qu’il existe des estimations assez sérieuses et convergentes, y compris émanant de l’économiste en chef de la Banque mondiale François Bourguignon (qui conclut à un Gini de 0.64) et des travaux de Branko Milanovic qui conclut à un Gini de 0,66 pour 1998 en parité de pouvoir d’achat (0,792 à valeur des taux de change). Les estimations différentes comme celle d’Ajit K. Ghose sont entachées d’erreurs de raisonnement similaires à celles dénoncées ici. Et surtout, plus important encore, une récente et remarquable étude des inégalités mondiales de richesse conduite par le laboratoire WIDER de l’Université des Nations Unies montre pour la première fois de façon détaillée et rigoureuse que les inégalités de richesse (mesurée par la différence entre les actifs et les dettes) sont très nettement supérieures dans chaque pays et mondialement aux inégalités de revenus, atteignant au niveau de la population mondiale le niveau incroyable d’un coefficient de Gini de 0,892.


[1] La banque mondiale raisonne en termes de PIB / habitant mais il parait préférable de penser revenus des ménages ou des individus. Ce point n’a aucune influence sur l’analyse de l’exemple proprement dit, pas plus que le fait que les revenus soient en général exprimés « en parité de pouvoir d’achat » pour gommer les différences de coûts de la vie qui ne sont pas reflétées dans les taux de change officiels entre monnaies.
[2] Négliger la non-distributivité de la moyenne par rapport à la distribution cumulée des revenus ordonnés par revenus croissants qui par nature est concave.


Pour ceux qui voudraient expérimenter un peu avec les chiffres : vous pouvez télécharger (feuilles de calcul Open Document) les données et formules correspondants aux deux exemples : situation de départ et situation d’arrivée. Nota : j’utilise un estimateur du coefficient de Gini qui fonctionne raisonnablement même pour les petites populations. Il est biaisé lorsqu’on l’applique à des échantillons issus de populations aléatoires, mais d’une façon qui est sans importance pour le propos développé ci-dessus.

Aucun commentaire

Laisser un commentaire

Votre courriel ne sera jamais rendu public.Les champs marqués d'un astérisque (*) sont obligatoires