# Cours open data CEREMA <!-- Put the link to this slide here so people can follow --> Retrouvez les slides sur : https://hackmd.io/@cecileLG/cours-opendata-cerema#/ --- # La Data --- ## Au quoditien Notre quotidien est baign� par les donn�es. - Dans la sph�re intime, notre consommation �nerg�tique est transmise � notre fournisseur d'�lectricit�, nos revenus sont d�clar�s sur des feuilles d'imposition. Nous donnons des informations personnelles via les mails que nous �changeons, recevons. Des donn�es transitent au sujet des achats que nous r�alisons sur Internet et sur le montant et la nature de nos transactions bancaires. - Dans la sp�re professionnelle, nous �changeons des courriels, exploitons des documents, des tableaux, remplissons des formulaires sur applications web m�tier. --- class: center, middle #De quelle langue vient data ? --- <style> img { margin-top : 30px; } .pull-left{ width: 35% } .pull-right{ width: 65% } </style> ## �tymologie, racines <!--[Image de C�sar]--> .pull-left[ <center><img src=https://idalab.de/wp-content/uploads/1_Euclid_Data_BnF.jpeg width=80%></img></center> ] .pull-right[ > L'un des premiers usages scientifiques connus du terme � data � (issu du verbe latin � dare � : donner) remonte au IIIe si�cle avant J.-C. dans un trait� de math�matiques d'Euclide o� il �tait d�montr� des propri�t�s g�om�triques � �tant donn� � d'autres propri�t�s g�om�triques - autrement dit des axiomes. Son sens a ensuite �volu� en deux branches. D'une part, il a donn� le mot � date �, que l'on retrouve dans des documents m�di�vaux officiels pour signifier le � moment � o� ceux-ci ont �t� produits ; d'autre part, � compter du XVIIe si�cle, le sens de � donn�es � en r�f�rence � des � principes accept�s de tous �, par l'interm�diaire du divin en th�ologie, puis par l'exp�rimentation en math�matiques. <div class=reference><a href=https://business-analytics-info.fr/11666/histoire-sciences-data/>Histoire des sciences de la Data</a></div> On retrouve dans la d�finition des data un caract�re **"gratuit"** et imm�diat, ainsi que d'objectivit� et de **factualit�**. ] <!--ADN arctique, conservation --> --- layout: false ## A quoi ressemble une donn�e ? Une sp�cialiste de la donn�e en donne une description assez originale : >Il s'agit d'une masse abstraite de nombres, sans poids et non identifi�e (la plupart du temps encod�e num�riquement), ayant une influence puissante sur nos vies. Concr�tement, ces donn�es nous apparaissent structur�es au travers de tableaux, de tables de donn�es. --- Voici quelques exemples visuels de donn�es : <center><img src= "https://github.com/CEREMA/dtermed.cours_opendata_ente/blob/master/presentations/images/csv.png" width=36%></img></center> <center><img src=../images/csv.png width=80%></img></center> <center><img src=../images/pg.png width=80%></img></center> --- # Citez trois modes de communication --- ## Naissance de la data - En premier lieu �tait **la transmission orale** des connaissances <center><img src=https://upload.wikimedia.org/wikipedia/commons/thumb/d/d3/Homo_floresiensis_cave.jpg/640px-Homo_floresiensis_cave.jpg></img></center> --- - Puis vint l'**�criture** <!--[premier alphabet] https://fr.wikipedia.org/wiki/%C3%89criture https://www.lemonde.fr/archeologie/article/2017/08/29/les-mesopotamiens-as-de-la-trigonometrie_5177828_1650751.html--> <center><img src=https://upload.wikimedia.org/wikipedia/commons/d/db/Ritmal-Cuneiform_tablet_-_Kirkor_Minassian_collection_-_Library_of_Congress.jpg></img></center> --- - L'**imprimerie**, n�e avec Gutenberg, qui permit de reproduire et, ainsi, de favoriser la diffusion des �crits <!-- https://www.google.fr/search?q=arriv%C3%A9e+imprimerie+gutenberg&source=lnms&tbm=isch&sa=X&ved=0ahUKEwjt38rK86XcAhXLDOwKHVPtAxEQ_AUICygC&biw=1680&bih=917 --> <center><img src=https://1.bp.blogspot.com/-QgcKsMQ5X4A/VBV9xchLXHI/AAAAAAABKhU/iNLka6dK-wI/s1600/Tableau%2Bd%27histoire%2BCE%2B15%2BL%27atelier%2Bde%2BGutenberg.JPG width=70%></img></center> --- - Le **num�rique** a permis, quant � lui, de confier le stockage et l'interpr�tation des savoirs � des machines. <!-- <center><img src=https://upload.wikimedia.org/wikipedia/commons/c/ca/AVIDAC_--_First_Argonne_Computer_%281953%29.jpg width=50%></img></center> --> <center><img src=https://upload.wikimedia.org/wikipedia/commons/c/ca/AVIDAC_--_First_Argonne_Computer_%281953%29.jpg width=50%></img></center> --- - **Internet** et la corr�lation des savoirs, qu'illustre le web (*toile* en fran�ais), sont n�es de cette r�volution technologique. <!-- https://royal.pingdom.com/2008/04/08/the-history-of-computer-data-storage-in-pictures/ --> <center><a data-flickr-embed="true" href="https://www.flickr.com/photos/jurvetson/916142" title="Internet Splat Map"><img src="https://farm1.staticflickr.com/1/916142_ddc2fd0140.jpg" width="500" height="375" alt="Internet Splat Map"></a></center> --- # Le Big Data --- ### Dans quoi sont stock�es les donn�es ? ### Par quelle voie transitent-elles ? ### Quel �l�ment de l'ordinateur permet de faire des calculs ? --- ### Le courant du Big Data suit celui de l'accroissement : - des *flux* - des capacit�s de *stockage* des donn�es - des capacit�s de *calcul* des ordinateurs --- ## Flux L'accroissement des flux de donn�es concerne par exemple celui des r�seaux de t�l�phonie mobile, de l'internet, qui permettent tout un tas d'applications telles que la t�l�m�decine, l'information en temps r�el pour les agriculteurs, d'autres modalit�s de travail (t�l�travail),.... Les donn�es circulent entre des machines soit via les airs, en particulier via les ondes via les satellites et antennes �mettrices, soit via des c�bles comme la fibre optique. <center><img src=https://upload.wikimedia.org/wikipedia/commons/e/ea/%D9%85%D8%AE%D8%A7%D8%A8%D8%B1%D8%A7%D8%AA_%D9%81%DB%8C%D8%A8%D8%B1_%D9%86%D9%88%D8%B1%DB%8C.jpg width=50%></img></center> --- ## Stockage L'augmentation du stockage des donn�es est une des plus grandes caract�ristiques du big data. Celle-ci permettra de d�mat�rialiser de plus en plus de donn�es, et en corollaire des proc�dures, telles que les d�clarations d'imp�t. Les donn�es sont stock�es sur des supports tels que les disques durs, des cl�s USB � usage souvent personnel. M�me log�es dans le cloud, les donn�es sont sur ces supports. <center><img src=https://upload.wikimedia.org/wikipedia/commons/thumb/d/de/Fc-disk.jpg/640px-Fc-disk.jpg width=50%></img></center> --- ## Calcul Les ordinateurs sont dot�s de capacit�s de calcul allant grandissant (loi de Moore). Les calculs, sur un ordinateur, sont r�alis�s gr�ce aux **processeurs**, parfois aussi gr�ce � la carte graphique, sur la base d'une binarisation de l'information. Ceci, en attendant l'arriv�e de l'ordinateur quantique qui consid�rera des �tats interm�diaires (ou plut�t simultan�s) entre le 0 et 1. --- # Quelqu'un peut-il me dire comment il calcule 256 + 125 ? --- Les **algorithmes** sont des s�quences ordonn�es d'op�rations informatiques. Ils automatisent le traitement de masses d'information et parfois en r�v�lent des motifs. Certains de ces algorithmes appel�s r�seaux de neurones miment m�me le fonctionnement du cerveau humain et sont en plein d�veloppement (intelligence artificielle). <center><img src=https://www.arl.army.mil/www/articles/3179/image.1.large.jpg width=30%></img></center> --- class: center, middle #Quelles sont les diff�rentes �tapes de la "vie" d'un produit de consommation ? --- ## L'�cosyst�me de la donn�e ### La cha�ne des donn�es La cha�ne des donn�es se compose des �tpaes suivantes : - produire - mettre en circulation - ouvrir - r�utiliser - gouverner --- ### Les acteurs Dans l'�cosyst�me de la donn�e, on distingue plusieurs acteurs : - les **producteurs** de donn�es qui g�n�rent des donn�es, de fa�on active ou pas (capteurs) - les **collecteurs** qui rassemblent les donn�es �mises sur le web - les **administrateurs** qui classent et documentent la donn�e collect�e - les **r�utilisateurs** qui exploitent, "font parler" les donn�es - les **contributeurs** qui, le plus souvent de leur propre fait, participent � l'alimentation d'une base de donn�es (comme wikipedia) --- class: center, middle, inverse # La Data, liant d'un monde connect� --- class: center, middle #Citez quelques objets connect�s --- ## Les objets connect�s L'internet des objets concerne des objets du quotidien capables de transmettre, d'�mettre et de r�agir � des informations circulant sur le r�seau internet. Le premier usage est **domotique**, pour la maison avec le pilotage � distance de la climatisation d'un logement, la surveillance... --- Il peut aussi concerner des **v�hicules**, des r�frig�rateurs, des objets r�cr�atifs tels que des enceintes... ...voire m�me des poup�es [![](https://i.guim.co.uk/img/media/783fe7d61f364d4034f04b073cae77a9a4da8e7e/0_27_3300_1980/master/3300.jpg?width=620&quality=85&auto=format&usm=12&fit=max&s=d9b16e14f9d78cc200e3add177a6ab27)](https://www.theguardian.com/world/2017/feb/17/german-parents-told-to-destroy-my-friend-cayla-doll-spy-on-children) <div class=reference><a href=https://www.theguardian.com/world/2017/feb/17/german-parents-told-to-destroy-my-friend-cayla-doll-spy-on-children>Article de The Guardian : "German parents told to destroy doll that can spy on children"</a></div> <!-- [amazon dash](https://www.amazon.fr/Dash-Button-Amazon/b?ie=UTF8&node=10909388031) --> --- ## La Smart City ou ville intelligente La Smart City, ou ville intelligente, est une ville dans laquelle de multiples **capteurs**, voire des **donn�es issues des t�l�phones des citoyens**, remontent � un si�ge central des informations sur la ville : congestion routi�re, pollution de l'air, consommation �nerg�tique, ... On lui appose le pr�fixe smart car elle est cens�e s'adosser, pour diriger ses op�rations, sur la **synth�se de donn�es** factuelles vari�es, pr�sentes en tr�s grand nombre. L'objet de la Smart City est de cr�er une cit� harmonieuse quasiment autog�r�e par les algorithmes et les donn�es capt�es et �mises par le r�seau. --- <center><img src=https://www.fournisseurs-electricite.com/sites/fournisseurs-electricite.com/files/images/compteur-elec-linky.png></img></center> Le compteur Linky peut �tre consid�r� comme une brique possible de la smart city puisque ce dernier est un �l�ment des *smart grids*, r�seaux d'�lectricit� capables de r�guler localement le d�bit d'�lectricit� en fonction de l'�tat des diff�rents noeuds du r�seau. --- Pour certains, Smart City rime aussi avec *Big Brother*, notamment vid�osurveillance et s�curit� publique. Les images peuvent �tre interpr�t�es par des ordinateurs afin d'identifier des attroupements mais aussi des individus. [Article de la Quadrature du Net : "La Smart City polici�re se r�pand comme une tra�n�e de poudre"](https://www.laquadrature.net/fr/nice-smart-city-surveillance) [Reconnaissance faciale en Chine, r�alis�e par une startup de Shanghai :](https://www.technologyreview.com/s/611815/who-needs-democracy-when-you-have-data/) <center><img src=https://cdn.technologyreview.com/i/images/so18-china-3.jpg?sw=1080&cx=0&cy=0&cw=2109&ch=1406 width=70%></img></center> --- class: center, middle, inverse # Les donn�es et le citoyen --- class: center, middle #A votre avis, quelles donn�es transmettez-vous, parfois � votre insu ? --- ## L'individu base de donn�es Un citoyen connect� � internet alimente, parfois sans le savoir, les bases de donn�es de soci�t�s ayant monopole sur le r�seau. Les donn�es qu'il �met peuvent concerner : -- - Tout d'abord, ses **envies**, ses d�sirs, ses besoins et ses interrogations, par le biais d'un moteur de recherche tel que Google. -- - Les **informations personnelles** partag�es sur un r�seau social comme Facebook ou bien Gmail. -- - Sa **localisation**, s'il a activ� le GPS de son smartphone -- - Ses **go�ts**, notamment musicaux, s'il se connecte � Spotify ou a command� des disques sur Amazon. --- Le citoyen est tellement connect� et parfois si mal inform� que des donn�es personnelles �chappent � sa vigilance et sont transmises � des tiers. Les cons�quences en cascade de ces fuites peuvent largement s'�tendre hors de sa sph�re intime. En l'occurrence, peu de personnes lisent les Conditions G�n�rales d'Utilisation d'applications Internet avant de les approuver. ![](https://017qndpynh-flywheel.netdna-ssl.com/wp-content/uploads/2018/04/military-base-mali.png) [La soci�t� Bellingcat a r�ussi � d�terminer les zones d'entra�nement de militaires](https://www.bellingcat.com/resources/articles/2018/07/08/strava-polar-revealing-homes-soldiers-spies/) --- ## Impact des donn�es ### Pour ceux qui s'int�ressent aux citoyens L'essor d'internet et de ses grands groupes est intimement li� � l'acc�s aux donn�es personnelles des individus, d'o� le fait de qualifier les donn�es comme de l'*or noir du XXIe si�cle*. Les GAFA et BATX en tirent b�n�fice en **personnalisant** les pubs que nous recevons et en recueillant des informations au sujet de nos envies et pr�f�rences. **Les donn�es individuelles sont pr�cieuses pour les villes intelligentes**. En effet, la coh�rence des d�cisions prises par l'ordinateur central d�pendra de la qualit�, de la fra�cheur et de la fr�quence des donn�es recueillies aupr�s des individus eux-m�mes ou de l'environnement plus ou moins proche de ces derniers : immeuble, bloc, quartier, ville,... --- class: center, middle #A votre avis, quel avantage peut avoir un gouvernement ou une soci�t� � ouvrir ses donn�es ? --- ### Pour les citoyens qui s'int�ressent � la soci�t� ou � leur environnement Enfin, la livraison de donn�es est un des �l�ments de la d�mocratie o� les citoyens ont le **droit d'avoir acc�s** � certaines d�cisions publiques, aux budgets. De plus en plus, l'ouverture des donn�es conf�re aux pays, voire, aux collectivit�s qui la mettent en oeuvre, un caract�re d'**exemplarit�**. Nous le verrons plus tard : les donn�es, lorsqu'elles sont ouvertes, permettent m�me de voir fleurir des entreprises qui b�tissent des services bas�s sur leur exploitation. **L'ouverture des donn�es dynamise l'�conomie**. --- ## Protection des donn�es ### CNIL La Commission Nationale de l'informatique et des libert�s est une autorit� administrative fran�aise charg�e de veiller � ce que l'informatique soit au service du citoyen et **qu'elle ne porte atteinte ni � l'identit� humaine, ni aux droits de l'Homme, ni � la vie priv�e, ni aux libert�s individuelles ou publiques**. ### RGPD Face au commerce lucratif des **donn�es personnelles** r�alis� parfois � l'insu des utilisateurs et la sensibilit� de certaines donn�es � caract�re personnel, l'Union Europ�enne s'est dot�e cette ann�e du R�glement G�n�ral sur la Protection des donn�es (RGPD) --- ## La culture des donn�es ou Data Literacy Ce n'est pas parce qu'une donn�e est en libre acc�s qu'elle est accessible. L'acc�s et l'exploitation des donn�es est **souvent l'affaire de sp�cialistes de la donn�e** alors que le contenu de celles-ci est cens� int�resser tout le monde. Afin de se d�partir d'une vision �litiste de la donn�e, la Data Literacy (Litt�ratie des donn�es, ou plus simplement la culture de la donn�e), a pour but d'amener � s'int�resser aux donn�es des personnes non-sp�cialistes. Cela passe par la **formation**, la **sensibilisation** des individus. `r icon::fa("mouse-pointer", size = 1)` [Testez votre culture des donn�es avec dataposition](https://dataposition.accatone.net/)
{"metaMigratedAt":"2023-06-15T00:37:57.564Z","metaMigratedFrom":"YAML","title":"Talk slides template","breaks":true,"description":"View the slide with \"Slide Mode\".","contributors":"[{\"id\":\"1b0be3e9-b738-425f-8b57-875a84d567d0\",\"add\":15457,\"del\":2206}]"}
    172 views