La loi de Benford est une loi de probabilité que l’on croise souvent dans notre quotidien sans nous en rendre compte . Découvrons ensemble cette loi de probabilité ! Cette loi de probabilité peut être intéressante en tant que sujet de grand oral !
Eléments de contexte
Commençons par un fait connu de tous : il y a 10 chiffres : 0, 1, 2, 3, 4, 5, 6, 7, 8 et 9. Lorsqu’on écrit des nombres, le premier chiffre ne peut pas être 0. Il est entre 1 et 9.
C’est là ensuite qu’il va falloir me faire confiance mais vous pourriez le reproduire chez vous. Voici les faits : Ouvrez un magazine et regardez le premier chiffre de chaque nombre que vous croisez et regardez leur fréquence. Normalement, ce que vous devriez constater c’est qu’il y a plus de 1 que d’autres chiffres. C’est là qu’intervient la loi de Benford, qui définit la fréquence du 1er chiffre de chaque nombre.
Il y a donc plus de 1 que de 2, puis plus de 2 que de 3, … et enfin plus de 8 que de 9.
Petite anecdote
Lorsqu’on n’utilisait pas ou peu la calculatrice, on disposait de tables de logarithme qui permettait de connaitre ses valeurs. Ce qui a empiriquement était remarqué est que les pages du côté du 1 était plus abimées que celles du côté du 9.
Intuitions
Il est plus facile de passer de 9000 à 10 000 – on doit multiplier par environ 1,1 – que de passer de 1000 à 2000 – on doit multiplier par 2. Pareil, pour passer de 2 à 3, on doit multiplier par 1,5, effort moindre que pour passer de 1 à 2.
C’est un phénomène qu’on va pouvoir représenter sur une échelle logarithmique : au fur et à mesure que le premier chiffre augmente, l’écart diminue.

Enoncé de la loi de Benford
La loi de Benford est définie sur les entiers entre 1 et 9 avec la formule suivante :
\forall i \in \{1,\ldots, 9 \},\mathbb{P}(X=i) = \log_{10} \left(\dfrac{i+1}{i}\right)
Ce qui donne approximativement ces probabilités là :

Conditions d’application de la loi de Benford
Cette loi s’applique bien si les données sont variées. Par exemple, si on prend la taille des personnes. Cette taille des personnes est en centimètres, on aura une fréquence de 1 bien plus grande qu’attendue. Il faut donc que les données soient au choix :
- Issues de diverses sources
- Réparties sur plus ordres de grandeur
Application : détection de fraudes
La loi de Benford peut être utilisée pour détecter des fraudes. En effet, de nombreuses données sont censée suivre cette loi de répartition. Donc, en regardant la fréquence du premier chiffre, si on s’éloigne de ce qui est attendue par cette loi, on peut supposer que des données ont été falsifiées.