# Projet immo: realestate-guillaume-nicos-pierre-silvia
Point sur avancement:
- 1 document par groupe à partager à Louis avec infos (au niveau groupe et au niveau individuel) sur
- Ce que vous avez fait jusqu'à présent
- Où vous en êtes
- Ce que vous prévoyez pour la suite
- Organisez ces infos sur les thèmes suivants: collecte de données, préparation de données, création de modèle, APIfication du modèle (possible de rajouter des thèmes ou sous-thèmes)
# En équipe:
- Où on en est:
- Modèle de prédiction sur les prix des loyers à Bordeaux
- Mise en prod sur container docker
- Implémentation partielle de la mise à jour continue du modèle
- Ce qui a été fait:
- Containers
- Base de données
- Prédiction, API Rest et formulaire web
- Entraînement continu du modèle une fois par semaine avec cron
- Ce que l'on prévoit pour la suite :
- Container scrapping Selenium chrome headless
- Insertion automatique dans la BDD des nouvelles entrées
- Mettre à jour README
- BDD des modéles et des métriques pour suivi des performances
- Versionnement du pipeline
# Individuellement
## Guillaume
- Pipeline Sklearn
- Classe Annonce qui sert de lien entre le scrapper la BDD et l'export csv
- Fichier docker-compose.yml
- fichiers Dockerfile: BDD, flask et entraînement
- Fonction de scrapping sur fichiers html obtenu avec selenium
## Nicolas S
- Modification du script de création de la base de données
- Gitignore
- Script de requêtage avec la base de données
- Fonctions de scraping
- Requirements des containers
- Commentaires pour une Pydoc
- Tous les readme
## Silvia
- Ajoute de la class "description" dans le scrapping
- Travaille en binome avec Pierre pour API Rest et formulaire web
## Pierre
- Scraping des urls de la page d'accueil de Seloger.com avec Selenium puis téléchargement des annonces au format html en local
- Page formulaire web (template flask avec Boostrap)
- Page résultats
- API JSON avec flask
- Container docker pour deployer
- Source:
- https://stackoverflow.com/questions/53657215/running-selenium-with-headless-chrome-webdriver
- https://developers.google.com/web/updates/2017/04/headless-chrome
- https://chromium.googlesource.com/chromium/src/+/lkgr/headless/README.md
- https://chromedriver.storage.googleapis.com/index.html?path=80.0.3987.106/
- https://www.google.com/chrome/beta/thank-you.html?platform=linux&statcb=0&installdataindex=empty&defaultbrowser=0