Bonjour
Le Blog d’En Face (BEF, enfin depuis le temps que vous nous lisez !), jamais content, toujours soucieux de mettre le doigt là où ça fait mal, ou sur les caténaires (Le BEF dégage toutes responsabilités au cas où un lecteur de ce blog essaierait de voir comment cela fait, 25.000 volts dans les doigts « Oh qu’ils sont moignons …» ) vous présente une nouvelle version de son outil de vérification des indices de ponctualité publié par le STIF
On ne vous rappelle pas le détail de la version « STIFATOR normal », vous pouvez consulter les 4 articles précédents qui vous donneront tout les détails :
Article 1 : ici
Article 2 : ici
Article 3 : ici
Article 4 : ici
L’objectif de STIFATOR est de prouver que :
Les statistiques publiées par le STIF pour les RER C, D et E sont correctes
Les statistiques publiées par le STIF pour les RER A et B sont un peu plus délicates et plutôt à prendre avec des pincettes. Dans la mesure où la ponctualité du tronçon central relève côté STIF comme RATP du Secret Défense (La Défense, terminus, ce train ne prend plus…), nous allons, une nouvelle fois, essayer de vous révéler cette ponctualité centrale (Exclusif BEF)
Jusqu’à présent, nous avions utilisé la méthode de la « Moyenne Arithmétique », la bonne vieille moyenne ordinaire (source Wikipédia) :
« La moyenne arithmétique est la moyenne « ordinaire », c’est-à-dire la somme des valeurs numériques (de la liste) divisée par le nombre de ces valeurs numériques1. » :
Vous savez, cette moyenne, celle qui vous angoisse (« Ah purée, ma moyenne baisse en ce moment ! »), en Maths, en Français, en Sport, en nombre de gars ou de filles conquises en un mois ou en une vie, en nombre de buts ou de points encaissés à domicile par votre équipe préférée, bref, la moyenne (arithmétique) de ce que vous voulez
On a vu que cette moyenne marchait pas trop mal pour les RER C, D et E, mais que pour les RER A et B, cela ne collait pas… Il fallait alors mettre des ponctualités supérieures à 100 pour retrouver ce que publiait le STIF
En préparant un article avec les derniers résultats pour le 2ème semestre 2015, je me suis dit… « Quand même, c’est gênant, ces ponctualités supérieurs à 100%… Et puis pour les RER C, D et E, c’est pas mal, mais on peut mieux faire… » Comme vous le voyez, jamais content au BEF…
Alors, j’ai lu la suite des moyennes sur Wikipédia, et il y a la « Moyenne Arithmétique Pondérée » : elle est plus intéressante celle-ci, plus proche de votre réalité :
« Étant donné un ensemble de données
ainsi que les poids non-négatifs correspondants
la moyenne arithmétique pondérée est calculée suivant la formule :
quotient de la somme pondérée des par la somme des poids »
Attendez ! Attendez ! Ne partez pas !
Je sais c’est des Statistiques, c’est hyper chiant, je suis d’accord ! C’est juste la façon dont elle est enseignée qui est pénible alors qu’en prenant des exemples concrets de la réalité, vous verrez que cela peut être sympa. Et bien justement ici, votre réalité c’est le RER et son calcul de ponctualité faite par le STIF…
Dans le charabia ci-dessus, votre ensemble de données : il s’agit des indices de ponctualités publiés par le STIF tous les mois pour les différentes branches d’un RER. On va prendre le RER E pour commencer par quelque chose de simple
Les poids non-négatifs correspondants : à une station donnée, cela représente la proportion de trains qui y passe, proportion par rapport à l’ensemble des autres stations
Le RER E : ah quel beau RER ! Des rames toutes neuves à 2 étages, une ligne « simple », quand on regarde un plan : une branche unique, Entre Haussmann Saint Lazare et Noisy le Sec, puis une branche de Noisy le Sec vers Chelles-Gournay, et une autre branche, de Noisy le Sec vers Villiers sur Marne/Tournan
Quand vous le prenez à partir d’Haussmann Saint Lazare, vous vous apercevez, à la louche, qu’il y a autant de trains qui partent vers les 2 directions finales. En proportion, il passe donc 2 fois plus de missions entre Haussmann et Noisy le Sec que de Noisy le Sec – Chelles et Noisy le Sec – Tournan (à la louche…) Et cela dans les 2 sens de circulation. Donc, il on compare ces proportions, nous avons, en gros, un poids de 50 pour Haussmann – Noisy le Sec et des poids de 25 pour Noisy le Sec – Chelles et Noisy le Sec – Tournan
Avec un tableau, c’est toujours mieux et plus parlant :
Poids | |
Branche Haussmann St Lazare Noisy le Sec | 50 (W1) |
Branche Noisy le Sec Chelle Gournay | 25 (W2) |
Branche Noisy le Sec Villiers sur Marne/Tournan | 25 (W3) |
Il faut que le total de vos poids fasse un multiple de 10
Par rapport à la version Arithmétique simple de STIFATOR, la version STIFATOR Pondérée est plus complexe, dû à cette notion de pondération
Pour le RER E par exemple, nous avions ceci avec l’ancien STIFATOR (pour un mois donné, ponctualité totale globale) : =SOMME(x1:x21)/21
Maintenant, toujours pour ce même RER E, (pour un mois donné, ponctualité totale globale) nous avons désormais ceci : =(SOMME(x1:x4)*W1*0,01 +SOMME(x5:x9)*W2*0,01+ SOMME(x10:x21)*W3*0,01)/(4*W1+5*W2+12*W3)*100
Les xi : les ponctualités appliquées à chaque gare suivant sa branche d’appartenance pour un mois donné
Les Wi : les poids donnés dans le tableau
C’est un peu plus compliqué comme formule…
Nous allons donc « jouer » sur ces différents poids pour le RER E pour retrouver les ponctualités globales affichées par le STIF à partir des ponctualités propres à chaque branche
En fait, après avoir fait tourner moult fois notre programme (formule dans Excel…), les pondérations retenues du RER E sont plutôt de cette forme :
Poids | |
Branche Haussmann St Lazare Noisy le Sec | 50 |
Branche Noisy le Sec Chelle Gournay | 30 |
Branche Noisy le Sec Villiers sur Marne/Tournan | 20 |
En gros, cela signifie que, quand 5 trains partent d’Haussmann, 3 vont vers Chelle Gournay, et 2 vont vers Villiers/marne Tournan
Pour en avoir le cœur net, il faudrait reprendre les horaires de cette ligne et compter le nombre de trains aux commencements et terminus de cette ligne, histoire de valider cette pondération
Avec le RER C, cela va se compliquer, car là on a 8 branches au total (on compte le tronçon central dedans)….
Ce qui est sympa avec cette moyenne arithmétique pondérée, c’est que si vous mettez le même poids pour toutes les branches des différents RER, nous retrouvons exactement les résultats de STIFATOR moyenne arithmétique simple ! Deux calculs différents pour aboutir aux mêmes résultats, c’est bien, non ?
J’avais annoncé péremptoirement (si, si) qu’il n’y avait pas de pondération pour les RER C, D et E, j’étais dans le faux. Il y a une pondération « honnête » appliquée par le STIF, nous allons dire
Pour les RER A et B, une pondération un peu « moins honnête » est appliquée. Ne connaissant pas la ponctualité du tronçon central, il faut à la fois jouer sur les différentes pondérations et sur cette ponctualité centrale
Je me suis basé sur les horaires, dans les 2 sens, des missions en semaine
Et j’ai obtenu ceci :
Poids | |
Branche Gare du Nord CDG 2 | 14,99 |
Branche Gare du Nord Mitry – Claye | 10,03 |
Branche Bourg la Reine – Robinson | 7,49 |
Branche Bourg la Reine – Saint Rémi les Chevreuse (donnée STIF) | 17,54 |
Branche Les Halles – Bagneux (Troncon central) | 50 |
J’ai fait tourné STIFATOR pondéré avec ces valeurs, et, pour retrouver la ponctualité globale totale affichée par le STIF, j’ai ajusté cette ponctualité centrale pour trouver un écart nul entre ce que le STIF publie et ce que j’ai calculé
Il y a une bonne nouvelle : cette ponctualité n’est plus supérieur à 100%…
La mauvaise nouvelle, c’est qu’il faut avoir une ponctualité centrale assez élevée
Pour 2014, j’ai obtenu ces 2 tableaux ci-dessous
Les colonnes : les mois considérés (cumulés en fait, cela permet de diluer un peu les mauvais résultats)
La première ligne : la ponctualité centrale jalousement gardée
La deuxième ligne, le résultat obtenu par STIFATOR Pondéré
La troisième ligne, ce qui est publié par le STIF. Je sais, les lignes 2 et 3 sont les mêmes : c’est fait exprès ! Mais il faut suivre un peu, quand même !
RER B :
Premier semestre 2014 :
RER B | 01 2014 | 01 à 02/2014 | 01 à 03 /2014 | 01 à 04 /2014 | 01 à 05/2014 | 01 à 06/2014 |
Ponctualité tronçon central BEF estimée (en %) | 88,08
|
91,3
|
92,4
|
92,48
|
93,18
|
93,22
|
Ponctualité globale calculée du BEF (en %) | 81,3
|
84,9
|
86
|
86,6
|
87,2
|
87,2
|
Ponctualité globale du STIF (en %) | 81,3
|
84,9
|
86
|
86,6
|
87,2
|
87,2
|
Deuxième semestre 2014 :
RER B | 01 2014 à 07/2014 | 01 à 08/2014 | 01 à 09 /2014 | 01 à 10 /2014 | 01 à 11/2014 | 01 à 12/2014 |
Ponctualité tronçon central BEF estimée (en %) | 93,58
|
93,9
|
94,06
|
94,08
|
94,08
|
94,2
|
Ponctualité globale calculée du BEF (en %) | 87,5 | 87,9 | 88,1 | 88,1 | 88,1 | 88,1 |
Ponctualité globale du STIF (en %) | 87,5 | 87,9 | 88,1 | 88,1 | 88,1 | 88,1 |
Donc, pour obtenir ces ponctualités, nous voyons que la ponctualité centrale du RER B doit être proche de 93% (92,88% moyenne de ces 12 ponctualités) !
Franchement, sérieusement, qui, emprunteur du RER B, peut croire en une telle ponctualité pour la partie centrale !
Allez, la formule utilisée pour calculer cette ponctualité pour le RER B est la suivante :
=(SOMME(B8:B24)*D96*0,01 + SOMME(B25:B27)*D95*0,01+(B28*((D95+D96)/2))*0,01+ SOMME(B29:B38)*D97*0,01 + SOMME(B39:B45)* ((D93+D94)/2)*0,01+ SOMME(B46:B49)* D94*0,01+ SOMME(B50:B54)* D93*0,01)/(17*D96+3*D95+((D95+D96)/2)+10*D97+(7*(D93+D94)/2)+4*D94+5*D93)*100
Nous allons prendre notre temps, nous publierons plusieurs articles mais nous souhaitons vraiment que vous compreniez notre démarche de calcul, en détaillant ce que nous avons fait pour tout les RER (ou presque tous)
Nous commencerons par le RER E, le D, le C, puis nous reviendrons sur le RER B (et aussi le RER A, si j’en n’ai pas marre)
Cordialement
Tres bon article comme d’hab. Tu en as de la chance de ne plus subir quotidiennement nos grevistes professionnels preferes.
Merci Mr Plouf!
C’est certain, j’ai du bol!
… mais tu pourrais te sacrifier pour nous en continuant à prendre cette ligne, juste pour comprendre notre douleur. :-p
Plouf,
Je ne pousserai pas le masochisme jusqu’à ce point!