Vite Ma Dose

Informations Générales

Sources ici : https://github.com/CovidTrackerFr/vitemadose/blob/main/README.md (Demandez à @guillaumerozier en Message privé avec votre pseudo si vous voulez être ajouté).

Chaînes de discussion

ViteMaDose

CovidTracker

5 Services de gestion de rendez-vous en ligne Doctolib, Keldoc, Ordoclic, Pandalab et Maiia. On recherche a recuperer les rendez-vous disponibles pour tous les centres pour l'afficher sur https://covidtracker.fr/vitemadose/.

Figma (maquette graphique) de "Vite MA Dose !" web :
https://www.figma.com/file/ISBVZxqhgxylKucAsldoe1/ViteMaDose?node-id=0%3A1

Table des matières

Trello Backend - https://trello.com/invite/b/sKJvPLBH/0a8af06a81b5cc2772142ec4f523ccae/vite-ma-dose-backend

Répartition des tâches

Voir les tâches archivées (terminées)

  • 🟠 Scrap Pandalab (en cours)

    • Priorité très haute
    • Objectif : récupérer le prochain RDV dispo dans chaque pharmacie Pandalab
    • Statut : todo
    • Assignés :
      • Epidemik en cours - api non testée encore et 900/3000 pharmacies qui remontent du rdv
      • Christopher DQ en cours - attente retour Pandalab pour accès API et autres ressources
  • 🟠 Statistiques (en cours)

    • Priorité haute
    • Objectif : obtenir des statistiques à afficher sur le front. Exporter dans un fichier stats.jsondans data/output sur la branche data-auto.
      Idées prioritaires de statistiques :
      • ✅ (stats.json) Nombre total de centres de vaccination
      • ✅ (stats.json) Nombre de centres ayant des disponibilités
      • 🟠 (stats_by_date.json & stats_by_date_dep.json) Graphiques des dispo de centres par date (total & par département) -> ok en back, need intégration front
        Autres idées:
      • ✅ Generer un info_centres.json avec toutes les données brutes
      • pie avec les URL valides, pas d'URL et invalides (ce qui permettra de nettoyer)
      • 🟠 (stats_center_types.json) Pie repartition des plateformes -> ok en back, need intégration front
      • Pie avec le type (en fonction du nom genre si c’est un cabinet, pharmacie etc.)
      • Carte de france avec disponibilités
      • 🟠 (stats.json) Carte de france des départements avec repartition des plateformes -> ok en back, need intégration front
    • Assignés :
      • Back : aureliancnx.
      • Front : Aymerik (PR)
  • 🔴 Filtres (todo)

    • Priorité basse
    • Objectif : filtrer les RDV en fonction de l'égibilité (prof. santé, + 70 ans etc.)
    • Statut : todo
    • Assignés :
  • 🔴 Alerte mail (todo)

    • Priorité basse
    • Objectif : être alerté par mail d'une nouvelle disponibilité dans son département
    • Statut : todo
    • Assignés :

Principe technique

  • Un script (scrape.py) tourne régulièrement et exporte les données sur le repo GitHub (data/output/).
    • La liste des départements et centres de vaccination est récupérée via data.gouv.fr (open data).
    • Pour chaque département, on récupère les RDV en appelant l'API de différentes plateformes.
    • Les résultats sont enregistrés par département dans le repo au format JSON.
    • Une GitHub Action exécute le script périodiquement. (GHA est pool-based, donc on ne maîtrise pas absolument la fréquence d'exécution. Les tests indiquent qu'on est sur du 2x par heure en moyenne.)
  • Un front lit les données du repo GitHub.
  • Le scraping doit récupérer le premier rendez-vous de chaque centre, sans aucune restriction d'éligibilité, sauf : "1ère injection".

Documentation API

Doctolib:

Exemple URL WebUI

API

Keldoc

Exemple URL WebUI

API

Maiia

Exemple URL WebUI

API

Ordoclic

Exemple URL WebUI

API

Pandalab

Le site check l'IP d'origine (ne fonctionne pas aux Pays-Bas)

Exemple URL WebUI

API

Mapharma

Le site ne propose pas d'annuaire, il faut donc chercher toutes les urls possibles

Exemple URL WebUI

API

Autres resources

Specifications

Output

Un fichier JSON par département, nommé <N° dep>.json (exemple : 38.json pour l'Isère), exporté dans le dossier data/output avec les champs :

  • version : 1
  • last_updated : date de dernière modification des données, YYYY-MM-DD HH:MM'T'Z (format ISO pour les DOM-TOM).
  • centres_disponibles
    • nom : nom du centre
    • url : url du centre vers la plateforme de réservation
    • prochain_rdv : YYYY-MM-DD HH:MM'T'Z (format ISO pour les DOM-TOM).
    • plateforme : "Doctolib", "Maiia", "Keldoc", "Autre"
  • centres_indisponibles
    • nom : nom du centre
    • url : url du centre vers la plateforme de réservation
    • plateforme : "Doctolib", "Maiia", "Keldoc", "Autre"

Exemple fictif pour l'Isère, 38.json :

{
    "version": 1,
    "last_updated": "2021-04-03 14:16",
    "centres_disponibles": [
            {
                "nom": "CH Grenoble", 
                "url": "www.truc/toto", 
                "prochain_rdv": "2021-04-10 10:22", 
                "plateforme": "Doctolib"
            },
            {
                "nom": "CHU truc", 
                "url": "www.truc/toto", 
                "prochain_rdv": "2021-05-18 09:19", 
                "plateforme": "Doctolib"
            }
        ], 
        
    "centres_indisponibles": [
        {
            "nom": "Stade Grenoble", 
            "url": "www.truc/toto",
            "plateforme": "Maiia"
            }
    ]
}

Raisonnement pour cette structure de données, basée sur le parcours utilisateur :

  • L'utilisateur choisit son département, par ex "59 Nord" -> On va regarder dans 59.json
  • On affiche deux listes :
    • RDV dispo, chaque carte doit montrer : prochaine date, nom du centre, lien vers la plateforme pour prendre rdv, nom de la plateforme (pour associer un logo).
    • RDV pas dispo pareil : mais sans prochaine date
  • Version : au cas où le schéma du fichier change plus tard.

Annexes

Tâches archivées

Voir les tâches en cours

  • ✅ Scrap Doctolib (fait)

    • Priorité très haute
    • Objectif : récupérer le prochain RDV dispo dans chque centre de vaccination Doctolib
    • Statut : done
    • Assignés : floby, florimondmanca, dalf
    • Historique: #1
  • ✅ Mise en production (fait)

    • Priorité haute
    • Objectif : faire tourner les scripts régulièrement (avec Github Actions (GHA) ?)
    • Statut : done
    • Historique PRs: #1, #3
  • ✅ Scrap Maiia (fait)

    • Priorité haute
    • Objectif : récupérer le prochain RDV dispo dans chque centre de vaccination Maiia
    • Statut : done (cf PR)
    • Assignés : kindras, V0lantis,
  • ✅ Scrap Keldoc (fait)

    • Priorité haute
    • Objectif : récupérer le prochain RDV dispo dans chque centre de vaccination Keldoc
    • Statut : done
    • Assignés : aureliancnx
  • ✅ Adaptation du frontend (done)

    • Priorité très haute
    • Objectif : récupérer le prochain RDV dispo dans chque centre de vaccination Maiia + Keldoc + Doctolib
    • Statut : done
    • Assignés : rozierguillaume, Aymerik
  • ✅ Scrap Ordoclic (done)

    • Priorité haute
    • Objectif : récupérer le prochain RDV dispo dans chque centre de vaccination Ordoclic
    • Assignés : Epidemik, Maijin,
    • Notes:
      • Un confondateur de ordoclic Thibault Court nous a donné ses coordonnées mail+phone. Il est disponible pour toutes questions techniques.
      • Seules les pharmacies pour le moment sont gérées correctement le reste ne sont que des tests et donc a recommandé de ne pas intégrer les données non-pharmacie pour éviter les remontés incorrect
      • Le scrape ne devrait s’effectuer que sur les pharmacies et pas sur les individus. Les individus sont normalement rattachés aux Pharmacies. Donc, scraper les deux équivaudra a générer des doublons.
      • Si d’autres entités (autres que pharmacies deviennent disponibles) il nous a indiqué qu’il transmettrait l’info
      • Il a suggéré qu'une mise à jour prochaine du site contiendra une API permettant de récupérer l'information directement sans besoin de scrape/tri et il nous tiendra au jus pour nous filer les infos
      • Il a indiqué qu’il ne voit pas d’inconvénient à intégrer les algo de l’état notamment pour aligner la demande de rdv avec l’éligibilité
      • Il pense que la prochaine étape risque d’être le manque de personne qui souhaite se vacciner (d’ici deux mois) et pense qu’il faudrait réfléchir à ce problème
  • ✅ Doctolib liste des centres scraper (done)

  • ✅ Scrap MaPharma (done)

    • Priorité très haute
    • Objectif : récupérer le prochain RDV dispo dans chaque pharmacie MaPharma
Select a repo