# Réunions de suivi du changement de base IPC - base 2025
## Comité de suivi "interne" DPCEM du 06/10/2023
*Présents : EB, AD, SF, JK, MM*
### Objectifs de la réunion
- Faire le point sur où nous en sommes sur les différents sujets, en particulier COICOP et renouvellement de l'échantillon
- Discuter organisation et calendrier :hourglass:, notamment dans la perspective du **passage en CD du 20/11** et de la note qu'il faudra écrire
- Cette date arrive vite pour présenter des travaux aboutis mais elle arrive tard si certains sujets doivent être traiter à l'échelle de l'Insee, comme par exemple, revoir les NCEE
- A l'issue de la réunion :
- SF fera un premier jet de la note CD
- AD fera un premier jet de calendrier général et un premier jet de note de comitologie
Autre élément de contexte : *Price Statistic Working Group* d'Eurostat début novembre, avec des probables prises de position sur le changement de Coicop.
<!--
#### Calendrier d'ensemble
Aurélien a fait une verion "martyre".
-->
### Echantillon
#### **Calibrage du nombre d'agglos**
- Choisir les agglos mi-2024, avec répartition des variétés et du nombre de relevés dans la foulée. **Pourquoi ce calendrier** :question:
- Laisse du temps aux sites-prix pour s'organiser aux probables fermetures d'agglomérations, pour s'organiser avec le nouvel échantillon
- Laisse la campagne d'OR de l'automne 2024 pour suivre les créations de variétés dans le nouvel échantillon et éventuellement commencer à re-répartir les anciennes séries (si on concentre la collecte, il faudra faire des OR aussi pour des produits auparavant suivis dans des agglos qui ont été fermées), ainsi que la campagne de 2025 pour terminer la mise en oeuvre du nouvel échantillon (cela pourra peut-être également se faire sur une année supplémentaire si faisable et nécessaire - cela avait été fait sur 3 ans en 2015)
- Sera intéressant de retrouver de la documentation sur ce qui avait été fait en 2015 :eyes::microscope: :open_file_folder:
- :warning: Sur le nombre de relevés (relevés courants + OR) qui peuvent être absorbés, il faudra bien anticiper. SF aimerait bien une hausse temporaire de la force de frappe. Il faudrait un *nombre max* de relevés/OR qu'on peut gérer (collecte *et apurement*).
- Sur le choix de l'échantillon d'agglomérations :
- La DG devra être assez directive et proposer un scénario central duquel les sites-prix pourront demander à dévier sous réserve d'un argumentaire détaillé.
- Il faudra prévoir de consulter les sites-prix sur les outils à leur mettre à disposition dans le cadre de cette analyse du nouvel échantillon.
- L'idée est de solliciter un **accord de principe du CD pour la concentration de la collecte**
- Premier calibrage à partir du nombre total de relevés actuel et le nombre de relevés moyen par tranches d'agglo avant introduction des DDC, on passerait de 99 à 71 ou 80 agglomérations selon si on applique la concentration aux tranches B, C, D ou seulement C, D. Les premiers éléments sont [ici](http://methodo-ipc.gitlab-pages.insee.fr/changement-de-base-2025/renouvellement-echantillon/premier_calibrage_agglos.html)
#### **Part d'internet**
Deux points pratico-organisationnels cruciaux qui vont de pair :
- Possibilité de confier de la collecte aux enquêteurs ?
- Possibilité de confier de l'apurement aux gestionnaires des sites-prix plutôt qu'au seul pôle ?
**Point sur lequel on attend un positionnement du CD : une direction pour les relevés internet**. Pour cela, il faut des éléments concrets pour le CD. Faire une première simulation, il faudra faire des hypothèses sur le coût d'un relevé internet (collecte+apurement). Il y a peut-être des éléments à retrouver de la crise sanitaire (attention au contexte de mars 2020, outil direct access donc qui ramait, le temps de collecte d'un relevé IT a très certainement été surestimé...). Attention à bien prendre en compte les coûts fixes journaliers.
Premier exercice : on prend l'échantillon actuel comme donné, on suppose des coûts de collecte et apurement pour relevés internet --> quantifier cette réallocation vers internet (sans révision de la part de la conso, sans ouverture de nouvelles variétés internet).
### Divers
- Prolongation du **label** pour 2025 : ok. Il faut prolonger l'avis d'opportunité du CNIS :arrow_right: on passerait au Label en 2025 pour les 5 années à venir.
- Réunir le **comité utilisateurs**. Attention, point épineux : la mise à disposition des données. A voir quand on le fera...
- On ne peut pas attendre Aldi et Lidl pour l'échantillon : trop incertain. Les deux sujets avancent en parallèle, on peut anticiper certaines conséquences de l'intro d'Aldi et Lidl dans les DDC mais ce n'est pas le scénario central.
### COICOP
- Double production sur toute l'année 2025. Faire le double calcul.
- Présentation de Julien sur ses travaux réalisés et à venir.
- Objectif d'avoir un premier bilan de cette nouvelle coicop et des intrants des comptes à présenter au CD, avec une note bilan adressée aux comptes en amont
- D'ores et déjà, identification d'une sous-classe `07.4.9.2` pour laquelle nous n'avons pas de montants issus de la comptabilité nationale (Ubereats, deliveroo, click&collect, etc)
(Rapide rappel du changement de base des comptes et des conséquences pour la production de l'IPC dès 2024).
### Comitologie
Aurélien fait un projet de note. La sortir en octobre, trouver des volontaires, notamment dans les DR et les SES.
Prévoir ensuite une date de copil.
### Sujet recrutement Eurostat
Abordé rapidement.
Information à vérifier, mais d'après Sébastien seuls 3 (ou 4) pays ont demandé un financement via le grant : plutôt de bonne augure pour nous :sunny:.
### Relevés de conclusions d'Aurélien
- Note au CD. Préparer une première version avant les congés. Finalisation pour la rentrée, envoi et présentation à C Colin (idéalement avant le PSWG). Viser un format comme sur les nouvelles sources, 4-5 pages maximum (il faut comprendre la synthèse et les questions posées au CD, avec ce qu’il faut de technique et de détail pour se prononcer ; on peut mettre des choses en annexe, par ex. le calendrier) (SF) ;
- Ecrire un calendrier. Circuler une première version (AD). NB : sera utile également pour les échanges avec la DSI ;
- Note de comitologie, recherche de DR et chefs de SES volontaires et programmation d’une première réunion du Copil le plus tôt possible après le CD (AD) ;
- Cnis et Label. Accord de principe du secrétariat du Label pour prolonger d’un an et passer en 2025 pour un Label couvrant les années 2026 et suivantes. Formaliser auprès du Cnis (prolonger l’avis d’opportunité) puis du Label (prolonger l’avis de conformité). Il faudra sans doute réunir un comité utilisateurs pour la concertation demandée par le Label (AD avec SF) ;
- Circuler les documents existants sur le changement de base 2015 (fond, process) et sur la base 2025 (documents Eurostat sur le changement de COICOP, etc.). Créer un espace dans le répertoire division sous N : ;
- Grant : réponse attendue en novembre. Poste : fiche de poste à relire (AD). Sujet abordé avec le DAF : attendre le CD PTT (dans 10 jours) pour mettre en ligne ;
- Nouvelles sources (Lidl/Aldi, Booking) : on choisit de ne pas lier le raisonnement sur l’échantillon. On peut faire des approximations « sans nouvelle source » puis décider ensuite sur les nouvelles sources ;
- Echantillon d’agglos et internet : importance d’expliciter un raisonnement méthodo sous contrainte de coûts (que ce soit pour le CD, le Label…) et expliquer pourquoi on choisit la piste de l’échantillon « raisonné ». Pour le CD, un raisonnement à coût total inchangé (en incluant plus de relevés par internet) est un scénario « central »
- Relevés internet : chiffrer ce que représente la cible de relevés internet et l’arbitrage entre internet et terrain, avec des paramètres provisoires et en tenant compte du temps d’apurement (un temps de relevés internet et (moins de) terrain, le temps d’apurement). Aspects NCEE + organisation de l’apurement à expliciter dans la note ;
- Concentration de l’échantillon dans moins d’agglomérations. Les DDC et, dans une moindre mesure, la réalisation de certains relevés par téléphone, conduit à concentrer l’échantillon là où les DDC pèsent moins. Principe de minimisation d’un « coût moyen par relevé y compris temps de déplacement » en choisissant par exemple de rester à « 600 relevés par agglo ». Selon ce critère, on aboutit en première analyse (à affiner) à 71 agglomérations au lieu de 99 (de 38 à 29 B, de 27 à 19 C et de 33 à 22 D) ;
- Ensuite,
- <span style="color:red;"> **Corse** (j’oubliais en réunion) : nous devons étudier ce que cela impliquerait de forcer une agglo ou deux en Corse. Il y a surtout une question d’organisation (quel site prix et quel coût au total ?) ; </span>
- En calendrier, il apparaît important d’étaler sur 2 ans, ie de finaliser l’échantillon d’agglos mi-2024 pour : (i) commencer sans attendre à relever de nouvelles variétés s’il y en a, (ii) donner le temps au réseau de s’adapter/d’adapter le réseau (enquêteurs et sites prix), (iii) pour faire simplement la double production à partir de l’indice de janvier 2025 ;
- En plus du raisonnement en nombre de relevés par agglo, réfléchir et expliciter dans la note des critères qui pourraient pris en compte pour l’analyse des cas particuliers ou problématiques avec les DR (DR/SES/sites prix/DEM).
- COICOP :
- Cf. diaporama de Julien
- Très important de bien préparer la position de l’Insee en PSWG des 8 et 9 novembre (actes délégués) ;
- Réunion prévue avec le DCN (section conso de la division SBS). En particulier, identifier ce qui nous manque, « sous-classes COICOP 2018 vides dans les comptes » (par ex : poids des frais de livraisons). La question peut se poser de passer commande au DCN ou à d’autres pour nos besoins (à mettre dans la note CD) ;
- Principe de « double table de passage » : Coicop actuelle/produits/Coicop nouvelle ;
- Penser à faire simple ou à simplifier ce qui peut l’être.
## Notes réunion du 07/09/2023 : "brainstorming"
*DMS :* Patrick Sillard, Pascal Ardilly,
*DPCEM/IPC :* Aurélien Daubaire, Sébastien Faivre, Julien Kfoury, Emmanuelle Bascheri, Martin Monziols.
### Contexte
**AD :**
- Janvier 2026 : premier indice en base 2025.
- Changement de coicop, avec probablement de nouvelles variétés. Passage à la COICOP 2018 (règlement européen) prévu pour fin 2024. Coicop révisée en profondeur car logique d'économie universelle plutôt qu'uniquement occidentale. Diffusion de séries rétropolées dans la nouvelle coicop pour Eurostat. Eté 2025 au plus tard pour la double diffusion d'indice (démarrer dès janvier 2025?)
- Projet d'intégrer de nouvelles sources de données :
- Robot booking
- Hards discounters (Aldi et Lidl)
- "Optimiser" l'échantillon suite à l'introduction des DDC et internet
Question sous-jacente quant à l'évolution du NCEE. D'importance pour ces travaux : possibilité de faire faire des relevés de prix sur internet aux enquêteurs ou non ? Actuellement ils sont faits par les gestionnaires en bureau et apurés uniquement par le pôle prix de Bordeaux.
La comitologie à monter. Les DR souhaitent en être. Au-delà d'un comité de pilotage, de suivi, certaines orientations seront soumises à la validation de Christel Colin et du CD.
**SF**, plusieurs points complémentaires (en essayant de les structurer...) :
- On est passé de 150k à 110k relevés terrain suite à l'introduction des DDC. On pourrait avoir comme objectifs d'avoir 100k sur le terrain (10K de moins) et 10k de plus qu'aujourd'hui, soit 15K au total, sur internet (part de conso internet estimée à environ 12-13%).
- Volatilité des prix sur intenet beaucoup plus importante que sur le terrain.
- Remarque Martin : au-delà de l'intuition, c'est à documenter. Sources possibles :
- Les relevés des variétés internet
- Les prix des robots de web scraping
- De la "documentation professionnelle"
- On ne cherche pas à optimiser uniquement la performance (que ce soit par les coûts ou la précision) de l'indice d'ensemble, mais aussi certains "sous-indices". Par exemple, attention sur les **produits frais**, une trop grande concentration de la collecte pour s'accompagner d'une perte de précision à cause d'effets de grappes
- En essayant d'expliciter le raisonnement : tous les relevés de produits frais seront faits dans un faible nombre d'agglo et donc les potentielles erreurs de mesure très corrélées entre-elles alors que ce sont des produits pour lesquels la volatilité est forte (et donc besoin d'observations nombreuses et indépendantes autant que possible pour bien estimer l'évolution)
- La pertinence de la collecte dans les petites agglo (les agglos D) est quelque chose que l'on souhaite questionner dans certte démarche de renouvellement de l'échantillon.
- Il n'est pas question de supprimer toutes les agglos D mais d'en avoir potentiellement moins et de les "choisir" avec suffisamment de points de vente pour pouvoir y concentrer la collecte
- La collecte sur internet est en pratique compliquée. On est bien loin des objectifs fixés par le Maiol, on arrive à la moitié de ce qui était prévu.
- A la question de Pascal Ardilly sur ce qu'on veut optimiser, on cherche plutôt à optimiser les coûts. Mais notre démarche est encore à préciser, "tout est sur la table".
- Ce qui est ("quasiment" précise AD) acté c'est
- qu'on va réduire le nombre d'agglomérations à 60 ou 70 en les choisissant au sein des 100 agglos actuelles.
- qu'on ne fera pas de double-collecte
Enjeu de l'investissement des enquêteurs + enjeu des enquêteurs bi-réseaux. Des choix RH. Coordination avec les zones Nautile.
==> Comment associer le terrain ? Transfert des bi-réseaux dans le management aux DEM (les purs prix sont côté site-prix). Le management des enquêteurs est plus compliqué qu'auparavant.
## Réflexions
**Patrick Sillard** : Tirage des agglos : pas le gros sujet. Exercice du tirage relativement simple. Pas de perte de temps. Il vaut mieux se concentrer sur :
- Déterminer le vrai poids de conso des agglos entre le terrain (hors conso DDC), internet et les DDC semble plus essentiel et fondamental. Sélection raisonnée : le meilleur choix.
- Le nombre de relevés par variété
- La répartition des relevés par agglo/variétés pour maximiser la précision
Sur la façon de faire la réduction du nombre d'agglo : choix raisonné à privilégier. Probablement plus simple, tout est déjà empirique (*Pascal Ardilly*).
Les contraintes pour ce choix raisonné :
- pratique pour la gestion des enquêteurs
- socialement acceptable (tout type de commune représenté)
**Pascal Ardilly** 3 éléments :
- Nous sommes sur de petits échantillons
- Il y a beaucoup de contraintes
- Le poids du passé : ce qui a été fait est déjà fondamentalement empirique/raisonné (il y a 30 ans c'était empirique). Oublier l'aléatoire, il n'y en a jamais eu.
==> Rester fondamentalement dans l'esprit. Donc suppression par choix raisonné avec justifications à l'appui.
Ce sont les étapes qui suivent qui comptent vraiment : répartition des relevés dans les agglos.
- Par ailleurs, tirage au 1er degré : on n'a pas d'information auxiliaire pour le 1er degré sur la dispersion des prix dans les agglos qui n'ont jamais été tirées.
On pourrait s'orienter vers une sélection raisonnée avec des critères à haut niveau (AD).
**Sur les relevés internet** faits manuellement :
- Possible de confier cette activité aux enquêteurs (si réécriture du NCEE)
- Quel coût associé à ce type de relevé ? pour la collecte ? et pour l'apurement. A ce stade, l'apurement des relevés Internet est fait par le pôle prix uniquement.
- D'une manière générale, le poids d'internet est fixé à 10 %.
**Sur le calendrier** :
- PS met en avant le caractère très très tendu du calendrier. Il y a nécessité de structurer et prioriser nos travaux ;
- Incertitude sur l'évolution du NCEE (facteur "institutionnel" sur lequel on n'a pas vraiment la main...)
- Objectif d'avoir le nouvel échantillon à l'été / automne 2024 pour pouvoir passer des OR pour 2025.
- Mention du PTT à venir : AD : il n'est pas question de demander de moyens supplémentaires.
### "Programme de travail"
Rassembler l'ensemble des éléments pour faire un premier travail d'*optimisation de précision sous contraintes de ressources* (les formules à utiliser ensuite seront celles du papier de 2015) :
- poids de la conso terrain (hors DDC, hors internet)
- poids de la conso internet (**probablement la partie très difficile par manque de source**)
- poids de la conso DDC
- dispersion des prix terrain
- dispersion des prix internet
- éléments de coûts terrain et coûts internet (relevé + apurement)
PS et PA se tiennent à dispo pour relectures et réunions de suivi.
### Divers
- *Patrick Sillard* : Au niveau de l'agglo : concurrence entre pdv, substuabilité (hétérogène) ==> moyenne géo. Cobb-douglas. si pas de substituabilité (baguette) (homogène) ==> moyenne arithmétique. Des fonctions d'utilité différente. Leonteif. Derrière il y a des fonctions d'utilité avec des comportements de consommateurs.
- Moyenne de rapports de prix = pas un indice de prix. Formule qui est proscrite. Certaines propriétés ne sont pas satisfaites.
- Concurrence sur internet plus forte (hypothèse).
- Sur le passage des montants compta nat à la COICOP : la façon dont on passe des classes/sous-classes aux postes. On n'a pas d'éléments sur ce qui avait été fait en 2015. Probablement BDF. PS ne s'en souvient pas précisément en tout cas.