La loi de Benford

Prenez une série de nombres dans la "nature": prix dans un supermarché, longueurs des fleuves du globe, etc. Mesurez les fréquences du chiffre le plus à gauche différent de 0 (autrement dit le premier chiffre significatif). Les neuf chiffres de 1 à 9 apparaissent-ils avec la même probabilité? Eh bien non!

A l'époque où les calculatrices n'existaient pas, les calculs se faisaient à la main, à l'aide de tables. Un jour de 1881, un astronome américain, Simon Newcomb, s'aperçut que les premières pages d'une table de logarithmes étaient plus usées que les autres. Se pouvait-il que les données recherchées dans cette table commençaient plus souvent par le chiffre "1" ? Il tenta de résumer les résultats de son observation dans une formule simple pour mesurer la fréquence d'apparition du premier chiffre C, celui situé le plus à gauche, dans un ensemble de données :

p("1er chiffre significatif est d") = log10(1+1/d), avec d=1, 2, ..., 9

A l'époque, cette formule ne convainquit personne. Cinquante ans plus tard, vers 1938, un physicien américain, Frank Benford, redécouvrit les mêmes fréquences que celles résultant de l'application de la formule de Newcomb, en répertoriant plus de 20 000 données sélectionnées dans des domaines aussi divers que les longueurs de plus de 300 fleuves, les recensements démographiques de plus de 3 000 régions, les masses atomiques des éléments chimiques, les cours de bourse, les constantes de la physique, les couvertures de journaux, etc. Il constata, donc, que le premier chiffre était un "1" près d'une fois sur trois ! Il en fit une loi qui porte aujourd'hui son nom : la loi de Benford, qui reste aujourd'hui encore imparfaitement expliquée.

Attention ! Cette loi ne s'applique qu'aux résultats de mesures. Inutile de l'utiliser pour avoir plus de chance de gagner à la loterie !

Le graphique ci-dessous compare la loi de Benford (en bleu) avec les fréquences observées...

  1. (en rouge) de prix récoltés au hasard par mes élèves (4927 nombres)
  2. (en jaune) des résultats cantonaux d'une votation fédérale parus dans le Quotidien Jurassien du 14 juin 1999, page 4 (828 nombres)
  3. (en vert) des superficies des pays souverains et territoires dépendants en 1974 (204 nombres).

On constate que la loi de Benford marche bien. On voit néanmoins qu'il y a dans les trois exemples un peu plus de 9 que de 8.


Références


Didier Müller, 30.7.2018