7 bonnes raisons d’actualiser votre base de données
Retour au sommaire
blog

Élaborer des modèles de score: cinquante nuances de gris ou feu d’artifice ?

Ennuyeux, vraiment? Élaborer des scores et des modèles capables de prévoir l'évolution, disons les chances de croissance et les risques d'échec d'une entreprise. Réfléchir aux chiffres et aux statistiques. Rechercher des corrélations entre ces masses de données. Passer du stade de l’aiguille dans une botte de foin à celui d’un solide et robuste gratte-ciel. Je peux m'imaginer que vous pensiez que les gens qui font cela ont un côté ‘nerd’ ou remportent un score assez élevé sur l'échelle de l'autisme. C’est bien possible. Et cela s'avérait vrai, j'en serais fier.

Mais honnêtement : souvent, ces chiffres et cette recherche des liens peuvent s’avérer incroyablement passionnants et surprenants. Il fut un temps où l’élaboration de tels modèles était une activité purement artisanale. Vous aviez une idée des liens éventuels entre deux séries de données ou plus. Vous passiez des jours, voire des semaines et des mois, à vérifier si cette idée correspondait à la réalité. Et puis vous alliez un peu plus loin.

Logiciels de datamining

Mais ce n’est plus le cas en 2017. Les masses de données (big data), les flux de données même, ont augmenté de manière exponentielle, et donc aussi les corrélations possibles. Et aujourd’hui, nous disposons de puissants logiciels de datamining. Un peu comme une calculatrice super-intelligente, qui travaille pour vous, qui vous permet de rechercher les liens que vous pensez exister et qui les confirme ou les infirme. Mieux encore, les machines montrent souvent des corrélations dont vous n’aviez aucune idée quelques secondes auparavant. Grâce à des analyses de régression fortement automatisées et des réseaux neuronaux.

Le travail a considérablement changé, en fait. D’une masse de calculs laborieux, nous sommes passés à une situation où nous sommes constamment confrontés à de nouvelles corrélations, parfois surprenantes, qu'il reste alors à explorer. Il faut essayer d’y trouver des explications, de les comprendre et vérifier si elles font vraiment avancer les choses.

La loi de Benford

Je viens encore de tomber dessus. Une théorie circule dans la littérature anglo-saxonne consacrée à l’auditing : la loi de Benford. En bref et résumé, c’est une technique mathématique complexe qui examine la répartition des séries de chiffres dans les données. La théorie stipule que quand on étudie de grandes quantités de chiffres (en tenant compte à chaque fois des deux ou trois premiers nombres), les chiffres bas sont plus fréquents que les chiffres élevés et que les valeurs suivent ensuite un déroulement descendant. Benford dit surtout que les données non manipulées suivront la fréquence présupposée. Lorsque l'on applique cette loi à la détection des fraudes comptables, cela signifie qu’une forte déviation par rapport à ce modèle indique une manipulation des chiffres.

Reconnaître les modèles

La Benford’s Law a prouvé son utilité aux États-Unis dans le cadre de la détection des fraudes. Surtout dans le but d'éliminer les cas ‘Emron’ de ce monde. Des mastodontes que l’on ne rencontre pratiquement pas ici. Mais cela fonctionnerait-il chez nous aussi ? Alors, passons les chiffres dans la machine et examinons les fréquences des chiffres d'affaires en Belgique. Bien entendu, on observe immédiatement une confirmation du modèle. Beaucoup de petits chiffres d’affaires et progressivement des chiffres moins élevés. On observe rapidement aussi un modèle récurrent, divergent. Bien plus d’entreprises avec des chiffres d’affaires dont les trois premiers chiffres sont 240, 300, 360, 500, 600…

 cinquante nuances de gris ou feu d’artifice ?

Voie sans issue, ou pas?

Est-ce un hasard qu’ils comportent plusieurs multiples de 12 ? Ou la machine nous a-t-elle vraiment mis sur la trace d'un modèle qui pourrait indiquer des anomalies ? Nous allons aller plus loin et examiner les caractéristiques des entreprises qui notent ce genre de valeur. Et qu’observe-t-on ? Les sociétés de management, les holdings, les agences d’étude de marché et d’opinion et les agences immobilières constituent le top 5 des activités. Justement ce type d'entreprise où les revenus sont plus facilement générés sur base d'indemnités mensuelles fixes (arrondies). Et aussi le type d'entreprise pour lesquelles beaucoup de faillites sont enregistrées proportionnellement.

Une voie sans issue, donc, pour l’instant. Ou peut-être que nous devons creuser encore un peu plus ? Nous allons poursuivre l’expérience et faire passer le cash-flow et le bénéfice dans la machine. Et voir ce que cela donne. Rechercher des explications. Découvrir des modèles. Passionnant, non ?

Lisez aussi:

Analyse financière: les scores dans un rapport d'entreprise

Publications similaires