<style>
.reveal section img { background:none; border:none; box-shadow:none; }
.reveal {
font-size: 30px;
}
.reveal p {
text-align: left;
}
.reveal ul {
display: block;
}
.reveal ol {
display: block;
}
</style>
# Introducció
## Taller Nous Usos de la Informàtica
<h1><img width="150" src="https://i.imgur.com/vvZMy0I.png"></h1>
---
## El context de l'assignatura: Dades i algorismes.
---
### Què ens diuen les ciències socials?
El curs de la història de la humanitat es pot agrupar en tres periodes temporals separats per "revolucions":
+ La **Revolució Cognitiva** va iniciar la **història** fa uns [50.000,...,70.000] anys.
+ La **Revolució Agrícola** la va accelerar fa uns 12.000 anys.
+ La **Revolució Científica**, que va començar fa només 500 anys, ha fet possible l'era industrial i el món tal i com el coneixem avui.
Una *Revolució* està associada a algun canvi, sovint de caire tecnològic, que fa que l'espècie humana canvii la seva forma de viure (organització del treball, organització social, pràctiques culturals, etc.)
Conceptes com ara *big data*, aprenentatge automàtic, intel·ligència artificial i ciència de dades esten fent possible una nova Revolució, la **Digital**, que pot tenir consecuències tant o més profundes que les anteriors.
---
### La Revolució Digital
Hi ha tres raons principals al darrera de la revolució que ha tingut lloc en els darrers anys:
+ La **dataficació** del món i la **digitalització** de la informació. Això significa que al món digital dispodem d'un registre cada vegada més exhaustiu del que passa al món físic i que podem prendre decisions automàtiques.
+ La **llei de Moore** i les seves conseqüències: la democratització de les infraestructures de la informació (programari i maquinari), que posa a l’abast de quasi tothom aquestes tecnologies.
+ El canvi en la **demanda** dels usuaris, que busquen productes i serveis disponibles a l'instant i personalitzats per satisfer les seves necessitats.
---
### El paper de les dades, la informació i els algorismes
---
Hi ha una subtil diferència entre **dades** i **informació**. Les dades són els fets o detalls (escrits en un format compatible amb els llenguatges de programació) dels quals es deriva la informació. Les dades poques vegades són útils per si soles. Perquè les **dades** esdevinguin **informació** (i siguin **accionables**), cal posar-les en context i analitzar-les.
:::info
Les lectures de temperatura a totes les estacions metereològiques de tot el món durant els darrers 100 anys són dades. Si aquestes dades s’organitzen i s’analitzen per trobar que la temperatura global augmenta, llavors això és informació.
:::
Els **algorismes** són un element crític per convertir les dades en informació i fins i tot per accionar-les.
---
### Dades i algorismes
La condició necessària per la Revolució Digital és la convergència de les tecnologies associades a les dades (des de la digitalització a la seva organizació, passant per la seva gestió, compartició, etc.) i als algorismes d'anàlisi de dades (ciència de dades, *machine learning*, IA, etc).
---
### Dades i algorismes
Aquests algorismes són una "mica" especials en molts casos (*Machine Learning*, Optimització):
+ La seva entrada són dades, però la seva sortida pot ser un conjunt de paràmetres d'un altre algorisme.
+ Les seves sortides depenen molt de certes hipòtesis *a priori* i per tant la validesa de la sortida depen d'elles.
+ Les sortides poden tenir un caràcter aproximat (que pot dependre de les dades concretes) i cal valorar el seu nivell d'incertesa abans de fer-les servir.
---
### Temàtica de l'assignatura
<h1><img width="350" src="https://i.imgur.com/m5XkcXL.png"></h1>
---
## Com serà l'assignatura
### Professorat
+ Professors de Teoria:
+ Jordi Vitrià, Email: jordi.vitria@ub.edu
+ Professors de Pràctiques:
+ Blai Ras
+ Aina Ferrà
:::info
<i class="fa fa-eye fa-fw"></i> **Enllaç de l'assignatura**: [Campus Virtual UB](https://campusvirtual.ub.edu/course/view.php?id=74655)
:::
---
### Què aprendreu en aquesta assignatura?
+ Com **trobar** informació en dades textuals.
+ Com anar més enllà de la cerca: el **descobriment** d’informació.
+ Com dirigir processos d’**explotació-exploració** per decidir la millor acció al món.
+ Com analitzar fonts d'informació textual (dades textuals) i extraure'n informació.
+ Etc.
---
### Quins llenguatges farem servir?
+ Farem servir un llenguatge (Python) i
+ una sèrie de mòduls (IPython, pandas, matplotlib, numpy, etc.) que constitueixen un dels entorns més desenvolupats de ciència de dades.
---
### Com s’organitza l’assignatura?
+ L’assignatura s’imparteix en classes teòriques i classes de pràctiques.
+ L’assignatura es coordinarà mitjançat el Campus Virtual de la UB. A través d’aquest entorn tindreu: anuncis, apunts, notes, fòrum, calendari, enllaços a la bibliografia, etc.
---
### Com seran les classes teòriques?
+ Les classes es dedicaran a l’exposició del temari teòric de l’assignatura.
+ Durada: 2 hores **presencials** a la setmana.
---
### Com seran les classes pràctiques?
+ Es fan **presencialment** amb l’ajut dels professors de pràctiques durant els horaris d'Aules d’Informàtica.
+ Durada: 2 hores a la setmana.
+ Els estudiants s’han d’organitzar en grups de 2 persones i comunicar-ho als professors de pràctiques abans de la segona sessió.
---
### Com s’avaluarà l’assignatura?
+ L’assignatura seguirà un esquema d’avaluació continuada, amb dos elements principals: proves presencials i lliurament remot de problemes.
+ Lliurament via web de pràctiques (LP): Els professors proposaran una sèrie de pràctiques que hauran de ser lliurades via campus virtual per l’alumne dins del període assenyalat.
+ Cada un dels lliuraments serà avaluat pel professor amb una nota que pot anar de 0 (nota mínima) a 10 (nota màxima). En cas de no lliurar les pràctiques dins del període assenyalat, l’alumne obtindrà un 0.
+ La nota final (LP) de la part de lliurament de pràctiques serà la mitja de tots els lliuraments.
---
### Com s’avaluarà l’assignatura?
+ (continuació)
+ Proves presencials (PP): durant el curs, l’alumne realitzarà dues proves escrites davant del professor. Les proves s’avaluaran amb una nota de 0 (nota mínima) a 10 (nota màxima). La nota final (PP) d’aquesta part serà la mitja de totes les proves realitzades (una prova no realitzada = 0).
---
### Com s’avaluarà l’assignatura?
+ La nota segons l’avaluació continuada (NF) es calcularà de la següent manera:
+ Si $(LP>4,0$ i $PP>4,0)$ llavors $NF = PP * 0,5 + LP * 0,5$
+ Sinó, si $NF = min(4.0, PP * 0,5 + LP * 0,5)$.
---
### Com s’avaluarà l’assignatura?
+ Durant la segona prova presencial (Gener) es donarà l’opció de presentar-se de tota l’assignatura o només de la segona part.
+ Tots aquells alumnes que obtinguin una $NF>=3,5$ tenen dret a una re-avaluació al cap d’un dies de la publicació de $NF$. La reavaluació serà equivalent a un examen final. En aquests casos, la nota final de l’assignatura serà llavors la nota de la reavaluació.
---
### Temari
18.09 Introducció
02.10 Optimització
09.10 Recomanació I
16.10 Recomanació II
23.10 Ítems frequents
30.10 Hipòtesis i inferències
Examen parcial
13.11 Exploració i Explotació
20.11 El Teorema de Bayes
27.11 Recuperació d'informació
04.12 Xarxes Neuronals
11.12 Xarxes Neuronals
18.12 Aspectes Ètics
Examen final
---
### Pràctiques
Pràctica 1: Anàlisi exploratòria de dades.
Pràctica 2: Recomanadors.
Pràctica 3: Optimització / Llenguatge Natural.
---
### Com s'avaluaran les pràctiques?
+ Per considerar un lliurament vàlid, s'ha de fer abans de la data límit de lliurament i el codi de les pràctiques ha de ser correcte (ha de retornar el resultat correcte), eficient i llegible, seguint un estil adequat (per exemple, https://peps.python.org/pep-0008/).
+ Les pràctiques es fan en parelles. Cal comunicar les parelles als professors de pràctiques abans de la segona sessió de pràctiques.
+ Tot i que les pràctiques es fan en parelles, tots els estudiants han de lliurar la pràctica de forma individual al campus virtual.
---
### Com s'avaluaran les pràctiques?
Els alumnes poden usar qualsevol tipus d'eina d'IA (ChatGPT, Copilot, etc.) pel desenvolupament de les pràctiques i com a eina d'aprenentatge, però han de ser conscients de les seves limitacions i perills:
+ Les respostes donades per aquestes eines poden tenir una aparença de correcció però ser formalment incorrectes. Per aquest motiu, l'ús d'aquestes eines està recomanat només en els casos en els que el criteri i el coneixement de l'alumne pugui determinar de forma crítica si la resposta proporcionada per l'eina és aprofitable.
+ Les respostes donades per aquestes eines poden fer ús de recursos que queden fora de les eines usades en aquest curs. Aquestes respostes no seran considerades correctes.
+ L´us intensiu d'aquestes eines poden generar a l'alumne una falsa percepció de coneixement. Això pot tenir conseqüències durant les avaluacions, en les quals no es permetrà l'ús d'eines d'IA.
---
### Com s'avaluaran les pràctiques?
L'avaluació de les pràctiques es farà de manera presencial, i el professor valorarà aquests aspectes de forma individual per cada alumne:
+ La comprensió del codi de les solucions dels exercicis lliurades a la pràctica.
+ La justificació de les decisions que s'han pres durant la resolució dels exercicis i també de les conclusions quantitatives i qualitatives a les que s'arriba durant el desenvolupament de la pràctica.
+ La qualitat analítica de les solucions aportades.
---
### Com s'avaluaran les pràctiques?
Les sessions d'avaluació de pràctiques seran:
Pràctica 1: Data de Lliurament al CV: 17 d'octubre. Data avaluació: Dies 23/10 i 24/10, durant l'horari de pràctiques de cada grup.
Pràctica 2: Data de Lliurament al CV: 21 de novembre. Data avaluació: Dies 27/11 i 28/11, durant l'horari de pràctiques de cada grup.
Pràctica 3: Data de Lliurament al CV: 12 de desembre. Data avaluació: Dies 18/12 i 19/12, durant l'horari de pràctiques de cada grup.
---
### Entorn de treball
<h1><center><img width="550" src="https://i.imgur.com/nmXCJ0j.png"></center></h1>
---
### Eines
+ Jupyter notebooks/Colab: entorn de treball.
+ numpy: mòdul de Python per treballar amb matrius i vectors.
+ pandas: mòdul de Python per treballar amb taules heterogènies de dades.
+ scikit learn: mòdul de Python amb algorismes d’aprenentatge.
+ Matplotlib: mòdul de Python amb algorismes de visualització.
+ Etc.
{"metaMigratedAt":"2023-06-16T09:10:59.729Z","metaMigratedFrom":"YAML","breaks":true,"slideOptions":"{\"theme\":\"white\",\"transition\":\"fade\"}","description":"El curs de la història de la humanitat es pot agrupar en tres periodes temporals separats per “revolucions”:","title":"Introducció","contributors":"[{\"id\":\"27c1cf26-ef2c-44cb-8ae1-2edc488d3f8e\",\"add\":46428,\"del\":35708}]"}