STIFATOR Pondéré: nouvel outil de vérification du BEF

Bonjour

Le Blog d’En Face (BEF, enfin depuis le temps que vous nous lisez !), jamais content, toujours soucieux de mettre le doigt là où ça fait mal, ou sur les caténaires (Le BEF dégage toutes responsabilités au cas où un lecteur de ce blog essaierait de voir comment cela fait, 25.000 volts dans les doigts « Oh qu’ils sont moignons …» ) vous présente une nouvelle version de son outil de vérification des indices de ponctualité publié par le STIF

On ne vous rappelle pas le détail de la version « STIFATOR normal », vous pouvez consulter les 4 articles précédents qui vous donneront tout les détails :

Article 1 : ici

Article 2 : ici

Article 3 : ici

Article 4 : ici

L’objectif de STIFATOR est de prouver que :

Les statistiques publiées par le STIF pour les RER C, D et E sont correctes

Les statistiques publiées par le STIF pour les RER A et B sont un peu plus délicates et plutôt à prendre avec des pincettes. Dans la mesure où la ponctualité du tronçon central relève côté STIF comme RATP du Secret Défense (La Défense, terminus, ce train ne prend plus…), nous allons, une nouvelle fois, essayer de vous révéler cette ponctualité centrale (Exclusif BEF)

Jusqu’à présent, nous avions utilisé la méthode de la « Moyenne Arithmétique », la bonne vieille moyenne ordinaire (source Wikipédia) :

« La moyenne arithmétique est la moyenne « ordinaire », c’est-à-dire la somme des valeurs numériques (de la liste) divisée par le nombre de ces valeurs numériques1. » :

MoyenneArithm

Vous savez, cette moyenne, celle qui vous angoisse (« Ah purée, ma moyenne baisse en ce moment ! »), en Maths, en Français, en Sport, en nombre de gars ou de filles conquises en un mois ou en une vie, en nombre de buts ou de points encaissés à domicile par votre équipe préférée, bref, la moyenne (arithmétique) de ce que vous voulez

On a vu que cette moyenne marchait pas trop mal pour les RER C, D et E, mais que pour les RER A et B, cela ne collait pas… Il fallait alors mettre des ponctualités supérieures à 100 pour retrouver ce que publiait le STIF

En préparant un article avec les derniers résultats pour le 2ème semestre 2015, je me suis dit… « Quand même, c’est gênant, ces ponctualités supérieurs à 100%… Et puis pour les RER C, D et E, c’est pas mal, mais on peut mieux faire… » Comme vous le voyez, jamais content au BEF…

Alors, j’ai lu la suite des moyennes sur Wikipédia, et il y a la « Moyenne Arithmétique Pondérée » : elle est plus intéressante celle-ci, plus proche de votre réalité  :

« Étant donné un ensemble de données

EnsembleDonnees

ainsi que les poids non-négatifs correspondants

EnsemblePoids

la moyenne arithmétique pondérée xbarreest calculée suivant la formule :

MoyenneArithmPonderee

quotient de la somme pondérée des xipar la somme des poids »

Attendez ! Attendez ! Ne partez pas !

Je sais c’est des Statistiques, c’est hyper chiant, je suis d’accord ! C’est juste la façon dont elle est enseignée qui est pénible alors qu’en prenant des exemples concrets de la réalité, vous verrez que cela peut être sympa. Et bien justement ici, votre réalité c’est le RER et son calcul de ponctualité faite par le STIF…

Dans le charabia ci-dessus, votre ensemble de données : il s’agit des indices de ponctualités publiés par le STIF tous les mois pour les différentes branches d’un RER. On va prendre le RER E pour commencer par quelque chose de simple

Les poids non-négatifs correspondants : à une station donnée, cela représente la proportion de trains qui y passe, proportion par rapport à l’ensemble des autres stations

Le RER E : ah quel beau RER ! Des rames toutes neuves à 2 étages, une ligne « simple », quand on regarde un plan : une branche unique, Entre Haussmann Saint Lazare et Noisy le Sec, puis une branche de Noisy le Sec vers Chelles-Gournay, et une autre branche, de Noisy le Sec vers Villiers sur Marne/Tournan

Quand vous le prenez à partir d’Haussmann Saint Lazare, vous vous apercevez, à la louche, qu’il y a autant de trains qui partent vers les 2 directions finales. En proportion, il passe donc 2 fois plus de missions entre Haussmann et Noisy le Sec que de Noisy le Sec – Chelles et Noisy le Sec – Tournan (à la louche…) Et cela dans les 2 sens de circulation. Donc, il on compare ces proportions, nous avons, en gros, un poids de 50 pour Haussmann – Noisy le Sec et des poids de 25 pour Noisy le Sec – Chelles et Noisy le Sec – Tournan

Avec un tableau, c’est toujours mieux et plus parlant :

Poids
Branche Haussmann St Lazare Noisy le Sec 50 (W1)
Branche Noisy le Sec   Chelle Gournay 25 (W2)
Branche Noisy le Sec Villiers sur Marne/Tournan 25 (W3)

 

Il faut que le total de vos poids fasse un multiple de 10

Par rapport à la version Arithmétique simple de STIFATOR, la version STIFATOR Pondérée est plus complexe, dû à cette notion de pondération

Pour le RER E par exemple, nous avions ceci avec l’ancien STIFATOR (pour un mois donné, ponctualité totale globale) : =SOMME(x1:x21)/21

Maintenant, toujours pour ce même RER E, (pour un mois donné, ponctualité totale globale) nous avons désormais ceci : =(SOMME(x1:x4)*W1*0,01 +SOMME(x5:x9)*W2*0,01+ SOMME(x10:x21)*W3*0,01)/(4*W1+5*W2+12*W3)*100

Les xi : les ponctualités appliquées à chaque gare suivant sa branche d’appartenance pour un mois donné

Les Wi : les poids donnés dans le tableau

C’est un peu plus compliqué comme formule…

Nous allons donc « jouer » sur ces différents poids pour le RER E pour retrouver les ponctualités globales affichées par le STIF à partir des ponctualités propres à chaque branche

En fait, après avoir fait tourner moult fois notre programme (formule dans Excel…), les pondérations retenues du RER E sont plutôt de cette forme :

Poids
Branche Haussmann St Lazare Noisy le Sec 50
Branche Noisy le Sec   Chelle Gournay 30
Branche Noisy le Sec Villiers sur Marne/Tournan 20

 

En gros, cela signifie que, quand 5 trains partent d’Haussmann, 3 vont vers Chelle Gournay, et 2 vont vers Villiers/marne Tournan

Pour en avoir le cœur net, il faudrait reprendre les horaires de cette ligne et compter le nombre de trains aux commencements et terminus de cette ligne, histoire de valider cette pondération

Avec le RER C, cela va se compliquer, car là on a 8 branches au total (on compte le tronçon central dedans)….

Ce qui est sympa avec cette moyenne arithmétique pondérée, c’est que si vous mettez le même poids pour toutes les branches des différents RER, nous retrouvons exactement les résultats de STIFATOR moyenne arithmétique simple ! Deux calculs différents pour aboutir aux mêmes résultats, c’est bien, non ?

J’avais annoncé péremptoirement (si, si) qu’il n’y avait pas de pondération pour les RER C, D et E, j’étais dans le faux. Il y a une pondération « honnête » appliquée par le STIF, nous allons dire

Pour les RER A et B, une pondération un peu « moins honnête » est appliquée. Ne connaissant pas la ponctualité du tronçon central, il faut à la fois jouer sur les différentes pondérations et sur cette ponctualité centrale

Je me suis basé sur les horaires, dans les 2 sens, des missions en semaine

Et j’ai obtenu ceci :

Poids
Branche Gare du Nord CDG 2 14,99
Branche Gare du Nord Mitry – Claye 10,03
Branche Bourg la Reine – Robinson 7,49
Branche Bourg la Reine – Saint Rémi les Chevreuse (donnée STIF) 17,54
Branche Les Halles – Bagneux (Troncon central) 50

 

J’ai fait tourné STIFATOR pondéré avec ces valeurs, et, pour retrouver la ponctualité globale totale affichée par le STIF, j’ai ajusté cette ponctualité centrale pour trouver un écart nul entre ce que le STIF publie et ce que j’ai calculé

Il y a une bonne nouvelle : cette ponctualité n’est plus supérieur à 100%…

La mauvaise nouvelle, c’est qu’il faut avoir une ponctualité centrale assez élevée

Pour 2014, j’ai obtenu ces 2 tableaux ci-dessous

Les colonnes : les mois considérés (cumulés en fait, cela permet de diluer un peu les mauvais résultats)

La première ligne : la ponctualité centrale jalousement gardée

La deuxième ligne, le résultat obtenu par STIFATOR Pondéré

La troisième ligne, ce qui est publié par le STIF. Je sais, les lignes 2 et 3 sont les mêmes : c’est fait exprès ! Mais il faut suivre un peu, quand même !

RER B :

Premier semestre 2014 :

 RER B 01 2014 01 à 02/2014 01 à 03 /2014 01 à 04 /2014 01 à 05/2014 01 à 06/2014
Ponctualité tronçon central BEF estimée (en %) 88,08 

 

91,3 

 

92,4 

 

92,48 

 

93,18 

 

93,22 

 

Ponctualité globale calculée du BEF (en %) 81,3 

 

84,9 

 

86 

 

86,6 

 

87,2 

 

87,2 

 

Ponctualité globale du STIF (en %) 81,3

 

 

84,9 

 

86 

 

86,6 

 

87,2 

 

87,2 

 

 

Deuxième semestre 2014 :

 RER B 01 2014 à 07/2014 01 à 08/2014 01 à 09 /2014 01 à 10 /2014 01 à 11/2014 01 à 12/2014
Ponctualité tronçon central BEF estimée (en %) 93,58 

 

93,9 

 

94,06 

 

94,08 

 

94,08 

 

94,2 

 

Ponctualité globale calculée du BEF (en %) 87,5  87,9  88,1  88,1  88,1  88,1 
Ponctualité globale du STIF (en %) 87,5  87,9  88,1  88,1  88,1  88,1 

 

Donc, pour obtenir ces ponctualités, nous voyons que la ponctualité centrale du RER B doit être proche de 93% (92,88% moyenne de ces 12 ponctualités) !

Franchement, sérieusement, qui, emprunteur du RER B, peut croire en une telle ponctualité pour la partie centrale !

Allez, la formule utilisée pour calculer cette ponctualité pour le RER B est la suivante :

=(SOMME(B8:B24)*D96*0,01 + SOMME(B25:B27)*D95*0,01+(B28*((D95+D96)/2))*0,01+ SOMME(B29:B38)*D97*0,01 + SOMME(B39:B45)* ((D93+D94)/2)*0,01+ SOMME(B46:B49)* D94*0,01+ SOMME(B50:B54)* D93*0,01)/(17*D96+3*D95+((D95+D96)/2)+10*D97+(7*(D93+D94)/2)+4*D94+5*D93)*100

Nous allons prendre notre temps, nous publierons plusieurs articles mais nous souhaitons vraiment que vous compreniez notre démarche de calcul, en détaillant ce que nous avons fait pour tout les RER (ou presque tous)

Nous commencerons par le RER E, le D, le C, puis nous reviendrons sur le RER B (et aussi le RER A, si j’en n’ai pas marre)

Cordialement

4 commentaires sur “STIFATOR Pondéré: nouvel outil de vérification du BEF

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>