STIFATOR Pondéré: nouvel outil de vérification du BEF

Bonjour

Le Blog d’En Face (BEF, enfin depuis le temps que vous nous lisez !), jamais content, toujours soucieux de mettre le doigt là où ça fait mal, ou sur les caténaires (Le BEF dégage toutes responsabilités au cas où un lecteur de ce blog essaierait de voir comment cela fait, 25.000 volts dans les doigts « Oh qu’ils sont moignons …» ) vous présente une nouvelle version de son outil de vérification des indices de ponctualité publié par le STIF

On ne vous rappelle pas le détail de la version « STIFATOR normal », vous pouvez consulter les 4 articles précédents qui vous donneront tout les détails :

Article 1 : ici

Article 2 : ici

Article 3 : ici

Article 4 : ici

L’objectif de STIFATOR est de prouver que :

Les statistiques publiées par le STIF pour les RER C, D et E sont correctes

Les statistiques publiées par le STIF pour les RER A et B sont un peu plus délicates et plutôt à prendre avec des pincettes. Dans la mesure où la ponctualité du tronçon central relève côté STIF comme RATP du Secret Défense (La Défense, terminus, ce train ne prend plus…), nous allons, une nouvelle fois, essayer de vous révéler cette ponctualité centrale (Exclusif BEF)

Jusqu’à présent, nous avions utilisé la méthode de la « Moyenne Arithmétique », la bonne vieille moyenne ordinaire (source Wikipédia) :

« La moyenne arithmétique est la moyenne « ordinaire », c’est-à-dire la somme des valeurs numériques (de la liste) divisée par le nombre de ces valeurs numériques1. » :

MoyenneArithm

Vous savez, cette moyenne, celle qui vous angoisse (« Ah purée, ma moyenne baisse en ce moment ! »), en Maths, en Français, en Sport, en nombre de gars ou de filles conquises en un mois ou en une vie, en nombre de buts ou de points encaissés à domicile par votre équipe préférée, bref, la moyenne (arithmétique) de ce que vous voulez

On a vu que cette moyenne marchait pas trop mal pour les RER C, D et E, mais que pour les RER A et B, cela ne collait pas… Il fallait alors mettre des ponctualités supérieures à 100 pour retrouver ce que publiait le STIF

En préparant un article avec les derniers résultats pour le 2ème semestre 2015, je me suis dit… « Quand même, c’est gênant, ces ponctualités supérieurs à 100%… Et puis pour les RER C, D et E, c’est pas mal, mais on peut mieux faire… » Comme vous le voyez, jamais content au BEF…

Alors, j’ai lu la suite des moyennes sur Wikipédia, et il y a la « Moyenne Arithmétique Pondérée » : elle est plus intéressante celle-ci, plus proche de votre réalité  :

« Étant donné un ensemble de données

EnsembleDonnees

ainsi que les poids non-négatifs correspondants

EnsemblePoids

la moyenne arithmétique pondérée xbarreest calculée suivant la formule :

MoyenneArithmPonderee

quotient de la somme pondérée des xipar la somme des poids »

Attendez ! Attendez ! Ne partez pas !

Je sais c’est des Statistiques, c’est hyper chiant, je suis d’accord ! C’est juste la façon dont elle est enseignée qui est pénible alors qu’en prenant des exemples concrets de la réalité, vous verrez que cela peut être sympa. Et bien justement ici, votre réalité c’est le RER et son calcul de ponctualité faite par le STIF…

Dans le charabia ci-dessus, votre ensemble de données : il s’agit des indices de ponctualités publiés par le STIF tous les mois pour les différentes branches d’un RER. On va prendre le RER E pour commencer par quelque chose de simple

Les poids non-négatifs correspondants : à une station donnée, cela représente la proportion de trains qui y passe, proportion par rapport à l’ensemble des autres stations

Le RER E : ah quel beau RER ! Des rames toutes neuves à 2 étages, une ligne « simple », quand on regarde un plan : une branche unique, Entre Haussmann Saint Lazare et Noisy le Sec, puis une branche de Noisy le Sec vers Chelles-Gournay, et une autre branche, de Noisy le Sec vers Villiers sur Marne/Tournan

Quand vous le prenez à partir d’Haussmann Saint Lazare, vous vous apercevez, à la louche, qu’il y a autant de trains qui partent vers les 2 directions finales. En proportion, il passe donc 2 fois plus de missions entre Haussmann et Noisy le Sec que de Noisy le Sec – Chelles et Noisy le Sec – Tournan (à la louche…) Et cela dans les 2 sens de circulation. Donc, il on compare ces proportions, nous avons, en gros, un poids de 50 pour Haussmann – Noisy le Sec et des poids de 25 pour Noisy le Sec – Chelles et Noisy le Sec – Tournan

Avec un tableau, c’est toujours mieux et plus parlant :

Poids
Branche Haussmann St Lazare Noisy le Sec 50 (W1)
Branche Noisy le Sec   Chelle Gournay 25 (W2)
Branche Noisy le Sec Villiers sur Marne/Tournan 25 (W3)

 

Il faut que le total de vos poids fasse un multiple de 10

Par rapport à la version Arithmétique simple de STIFATOR, la version STIFATOR Pondérée est plus complexe, dû à cette notion de pondération

Pour le RER E par exemple, nous avions ceci avec l’ancien STIFATOR (pour un mois donné, ponctualité totale globale) : =SOMME(x1:x21)/21

Maintenant, toujours pour ce même RER E, (pour un mois donné, ponctualité totale globale) nous avons désormais ceci : =(SOMME(x1:x4)*W1*0,01 +SOMME(x5:x9)*W2*0,01+ SOMME(x10:x21)*W3*0,01)/(4*W1+5*W2+12*W3)*100

Les xi : les ponctualités appliquées à chaque gare suivant sa branche d’appartenance pour un mois donné

Les Wi : les poids donnés dans le tableau

C’est un peu plus compliqué comme formule…

Nous allons donc « jouer » sur ces différents poids pour le RER E pour retrouver les ponctualités globales affichées par le STIF à partir des ponctualités propres à chaque branche

En fait, après avoir fait tourner moult fois notre programme (formule dans Excel…), les pondérations retenues du RER E sont plutôt de cette forme :

Poids
Branche Haussmann St Lazare Noisy le Sec 50
Branche Noisy le Sec   Chelle Gournay 30
Branche Noisy le Sec Villiers sur Marne/Tournan 20

 

En gros, cela signifie que, quand 5 trains partent d’Haussmann, 3 vont vers Chelle Gournay, et 2 vont vers Villiers/marne Tournan

Pour en avoir le cœur net, il faudrait reprendre les horaires de cette ligne et compter le nombre de trains aux commencements et terminus de cette ligne, histoire de valider cette pondération

Avec le RER C, cela va se compliquer, car là on a 8 branches au total (on compte le tronçon central dedans)….

Ce qui est sympa avec cette moyenne arithmétique pondérée, c’est que si vous mettez le même poids pour toutes les branches des différents RER, nous retrouvons exactement les résultats de STIFATOR moyenne arithmétique simple ! Deux calculs différents pour aboutir aux mêmes résultats, c’est bien, non ?

J’avais annoncé péremptoirement (si, si) qu’il n’y avait pas de pondération pour les RER C, D et E, j’étais dans le faux. Il y a une pondération « honnête » appliquée par le STIF, nous allons dire

Pour les RER A et B, une pondération un peu « moins honnête » est appliquée. Ne connaissant pas la ponctualité du tronçon central, il faut à la fois jouer sur les différentes pondérations et sur cette ponctualité centrale

Je me suis basé sur les horaires, dans les 2 sens, des missions en semaine

Et j’ai obtenu ceci :

Poids
Branche Gare du Nord CDG 2 14,99
Branche Gare du Nord Mitry – Claye 10,03
Branche Bourg la Reine – Robinson 7,49
Branche Bourg la Reine – Saint Rémi les Chevreuse (donnée STIF) 17,54
Branche Les Halles – Bagneux (Troncon central) 50

 

J’ai fait tourné STIFATOR pondéré avec ces valeurs, et, pour retrouver la ponctualité globale totale affichée par le STIF, j’ai ajusté cette ponctualité centrale pour trouver un écart nul entre ce que le STIF publie et ce que j’ai calculé

Il y a une bonne nouvelle : cette ponctualité n’est plus supérieur à 100%…

La mauvaise nouvelle, c’est qu’il faut avoir une ponctualité centrale assez élevée

Pour 2014, j’ai obtenu ces 2 tableaux ci-dessous

Les colonnes : les mois considérés (cumulés en fait, cela permet de diluer un peu les mauvais résultats)

La première ligne : la ponctualité centrale jalousement gardée

La deuxième ligne, le résultat obtenu par STIFATOR Pondéré

La troisième ligne, ce qui est publié par le STIF. Je sais, les lignes 2 et 3 sont les mêmes : c’est fait exprès ! Mais il faut suivre un peu, quand même !

RER B :

Premier semestre 2014 :

 RER B 01 2014 01 à 02/2014 01 à 03 /2014 01 à 04 /2014 01 à 05/2014 01 à 06/2014
Ponctualité tronçon central BEF estimée (en %) 88,08 

 

91,3 

 

92,4 

 

92,48 

 

93,18 

 

93,22 

 

Ponctualité globale calculée du BEF (en %) 81,3 

 

84,9 

 

86 

 

86,6 

 

87,2 

 

87,2 

 

Ponctualité globale du STIF (en %) 81,3

 

 

84,9 

 

86 

 

86,6 

 

87,2 

 

87,2 

 

 

Deuxième semestre 2014 :

 RER B 01 2014 à 07/2014 01 à 08/2014 01 à 09 /2014 01 à 10 /2014 01 à 11/2014 01 à 12/2014
Ponctualité tronçon central BEF estimée (en %) 93,58 

 

93,9 

 

94,06 

 

94,08 

 

94,08 

 

94,2 

 

Ponctualité globale calculée du BEF (en %) 87,5  87,9  88,1  88,1  88,1  88,1 
Ponctualité globale du STIF (en %) 87,5  87,9  88,1  88,1  88,1  88,1 

 

Donc, pour obtenir ces ponctualités, nous voyons que la ponctualité centrale du RER B doit être proche de 93% (92,88% moyenne de ces 12 ponctualités) !

Franchement, sérieusement, qui, emprunteur du RER B, peut croire en une telle ponctualité pour la partie centrale !

Allez, la formule utilisée pour calculer cette ponctualité pour le RER B est la suivante :

=(SOMME(B8:B24)*D96*0,01 + SOMME(B25:B27)*D95*0,01+(B28*((D95+D96)/2))*0,01+ SOMME(B29:B38)*D97*0,01 + SOMME(B39:B45)* ((D93+D94)/2)*0,01+ SOMME(B46:B49)* D94*0,01+ SOMME(B50:B54)* D93*0,01)/(17*D96+3*D95+((D95+D96)/2)+10*D97+(7*(D93+D94)/2)+4*D94+5*D93)*100

Nous allons prendre notre temps, nous publierons plusieurs articles mais nous souhaitons vraiment que vous compreniez notre démarche de calcul, en détaillant ce que nous avons fait pour tout les RER (ou presque tous)

Nous commencerons par le RER E, le D, le C, puis nous reviendrons sur le RER B (et aussi le RER A, si j’en n’ai pas marre)

Cordialement

STIFATOR III Le retour du retour : Quand le RER B est ponctuel à 113% – les corrections Messieurs Plus

aspirine Par Jeannot91, « Terminator » des statistiques pour le BEF…

Bonjour

Oui, vous le savez, quand le BEF a une idée dans la tête, elle ne l’a pas ailleurs (les pieds, par exemple…). Afin d’achever ce triptyque (voir STIFATOR I et STIFATOR II en replay), le BEF tenait à vous communiquer les facteurs « correctifs » et « adaptatifs » que nous avons utilisés pour obtenir les ponctualités globales publiées par le STIF, en prenant en compte le mois de mai 2014, cela vient d’être publié. Oui, oui, ça nous fait plaisir, peut-être pas au STIF, ni non plus à la RATP/SNCF…

Désolé, on remet ça avec des tableaux, mais ça sera plus court. Et on va vous ajouter le RER A, pour le même prix, cadeau maison, c’est pas les soldes au BEF, on est comme ça, si on peut rendre service…

Année 2012 :

01 à 05/2012 01 à 06/2012 01 à 07/2012 01 à 08/2012 01 à 09/2012 01 à 10/2012 01 à 11/2012 01 à 12/2012
Ponctualité centrale adaptéeRERA 127 % 127 % 129 % 129 % 128 % 129 % 130 % 129 %
Ponctualité centrale adaptée rerb 116 % 116 % 116 % 115 % 115 % 116 % 116 % 117 %

 

Année 2013 : Semestre 1 et Semestre 2

01/2013 01 à 02/2013 01 à 03/2013 01 à 04/2013 01 à 05/2013 01 à 06/2013
Ponctualité centrale adaptée RERA 134 % 132 % 131 % 130 % 129 % 130 %
Ponctualité centrale adaptéererb 116 % 114 % 113 % 114 % 116 % 116 %

 

01 à 07/2013 01 à 08/2013 01 à 09/2013 01 à 10/2013 01 à 11/2013 01 à 12/2013
Ponctualité centrale adaptéeRERA 131 % 131 % 132 % 132 % 132 % 132 %
Ponctualité centrale adaptéererb 115 % 114 % 113 % 114 % 113 % 113 %

 

Année 2014 :

01/2014 01 à 02/2014 01 à 03/2014 01 à 04/2014 01 à 05/2014
Ponctualité centrale adaptéeRERA 125 % 127 % 128 % 129 %   128 %
Ponctualité centrale adaptéererb 105 % 107 % 108 % 107 %  108 %

 

Voilà, c’est fait. Comme vous le voyez, les facteurs simulés pour les parties centrales tiennent dans un mouchoir de poche. On pourrait vous rajouter la variance, c’est-à-dire la dispersion des valeurs : plus c’est proche de zéro, plus les valeurs sont dans ce mouchoir de poche.

Mais il fait beau, c’est l’été, il y a eu la Coupe du Monde, on ne va pas vous gâcher vos prochains départs en vacances (si vous partez), et vous en avez sûrement rien à faire!

Deux remarques/questions complémentaires :

  1. Le STIF a publié pour certains mois et sur certaines années les ponctualités entre Gare du Nord et Aulnay sous Bois, en plus des ponctualités Gare du Nord vers Mitry et Gare du Nord vers Aéroport Charles de Gaulle. Depuis le début 2014, la ponctualité Gare du Nord – Aulnay sous Bois n’est plus publiée : pourquoi ?
  2. Il est à noter qu’il s’agit, à chaque mois, d’une ponctualité cumulée qui redémarre depuis le début d’année. Cela permet de diluer un peu certaines choses…

Mais ne vous inquiétez pas ! Le BEF a refait les calculs mois par mois pour les années 2013 et 2014 (pour 2012, on ne peut pas, désolé, car on n’a pas le mois de Janvier 2012), et est capable d’afficher une ponctualité mois par mois. Nous pouvons ainsi comparer ces ponctualités avec les statistiques d’incidents mensuelles aux heures de pointes publiées par le BEF et étudier certaines corrélations…

 Mais ceci est une autre histoire

envelope