# Projet immo: realestate-guillaume-nicos-pierre-silvia Point sur avancement: - 1 document par groupe à partager à Louis avec infos (au niveau groupe et au niveau individuel) sur - Ce que vous avez fait jusqu'à présent - Où vous en êtes - Ce que vous prévoyez pour la suite - Organisez ces infos sur les thèmes suivants: collecte de données, préparation de données, création de modèle, APIfication du modèle (possible de rajouter des thèmes ou sous-thèmes) # En équipe: - Où on en est: - Modèle de prédiction sur les prix des loyers à Bordeaux - Mise en prod sur container docker - Implémentation partielle de la mise à jour continue du modèle - Ce qui a été fait: - Containers - Base de données - Prédiction, API Rest et formulaire web - Entraînement continu du modèle une fois par semaine avec cron - Ce que l'on prévoit pour la suite : - Container scrapping Selenium chrome headless - Insertion automatique dans la BDD des nouvelles entrées - Mettre à jour README - BDD des modéles et des métriques pour suivi des performances - Versionnement du pipeline # Individuellement ## Guillaume - Pipeline Sklearn - Classe Annonce qui sert de lien entre le scrapper la BDD et l'export csv - Fichier docker-compose.yml - fichiers Dockerfile: BDD, flask et entraînement - Fonction de scrapping sur fichiers html obtenu avec selenium ## Nicolas S - Modification du script de création de la base de données - Gitignore - Script de requêtage avec la base de données - Fonctions de scraping - Requirements des containers - Commentaires pour une Pydoc - Tous les readme ## Silvia - Ajoute de la class "description" dans le scrapping - Travaille en binome avec Pierre pour API Rest et formulaire web ## Pierre - Scraping des urls de la page d'accueil de Seloger.com avec Selenium puis téléchargement des annonces au format html en local - Page formulaire web (template flask avec Boostrap) - Page résultats - API JSON avec flask - Container docker pour deployer - Source: - https://stackoverflow.com/questions/53657215/running-selenium-with-headless-chrome-webdriver - https://developers.google.com/web/updates/2017/04/headless-chrome - https://chromium.googlesource.com/chromium/src/+/lkgr/headless/README.md - https://chromedriver.storage.googleapis.com/index.html?path=80.0.3987.106/ - https://www.google.com/chrome/beta/thank-you.html?platform=linux&statcb=0&installdataindex=empty&defaultbrowser=0