
# Intel·ligència Artificial i la transformació del sector salut
# Introducció
La **Intel·ligència Artificial** (IA) està emergint com una **eina transformadora** en el camp de la salut, oferint solucions amb un gran potencial tant en el **diagnòstic** com en el **tractament** de malalties i també en els aspectes de **gestió**. Aquesta tecnologia, que permet a les màquines aprendre de grans volums de dades i prendre decisions intel·ligents, pot sentar les bases per a un futur on la cura de les persones sigui més precisa, personalitzada i accessible en un entorn on els professionals de la salut puguin concentrar-se en els processos de més valor afegit.
# Intel·ligència Artificial i Salut
Tal i com seria el cas en l'aparició de qualsevol tecnologia transformadora, cal que la societat i especialment aquelles persones que hi estan directament involucrades tinguin una visió crítica i informada sobre l’ús de la intel·ligència artificial (IA) en el camp de la salut i per tant és essencial comprendre tant els seus **avantatges** com els **desafiaments** que presenta. Aquest equilibri ha de permetre als professionals de la salut, als pacients i als ciutadans en general aprofitar els beneficis de la IA, tot mantenint una perspectiva realista i conscient dels seus límits i implicacions ètiques.
El llistat de preguntes que ens podem fer sobre l'ús i l'impacte de la IA en el món de la salut és molt gran i caldrà anar donant resposta a cada una d'elles per minimitzar les incerteses i preocupacions, però abans cal entendre de l'abast real de la tecnologia, separant la realitat de les espectatives exagerades que es generen des de certs sectors.
:::success
## Incerteses, inquietuts, temors i preocupacions sobre la IA
A continuació teniu un llistat no exhaustiu de les incerteses, inquietuts, temors i preocupacions que de forma totalment lícita pot tenir qualsevol actor del sistema de salut.
1. Preocupació sobre la possibilitat que la IA pugui substituir o minimitzar el rol del professional de la salut.
2. Incertesa sobre la fiabilitat i la precisió dels sistemes d'IA, i preocupació per errors potencials que podrien tenir repercussions negatives en els pacients.
3. Inquietud sobre la seguretat i la privacitat de les dades dels pacients, especialment en el context de la recopilació i l'ús de grans quantitats de dades clíniques per part dels sistemes d'IA.
4. Temor a la possible pèrdua de la relació personal i la confiança entre el professional de la salut i el pacient si la IA introdueix una distància o una sensació d'impersonalitat en la atenció sanitària.
5. Preocupació sobre la presència de biaixos en els algoritmes d'IA i com aquests podrien afectar de manera desigual els diferents grups de pacients, contribuint a disparitats en la atenció sanitària.
6. Temor a dilemes ètics relacionats amb la presa de decisions automatitzades per part de sistemes d'IA, com ara qui és responsable quan hi ha errors o conseqüències no desitjades.
7. Inseguretat sobre la necessitat d'adaptar-se a nous sistemes, tecnologies i protocols de treball associats amb la integració de la IA en la pràctica clínica.
8. Inseguretat sobre la preparació i les competències necessàries per utilitzar eficaçment les tecnologies d'IA en la pràctica assistencial, així com la preocupació per a la formació.
9. Temor a la pèrdua de control i autonomia professional, especialment si les decisions clíniques es veuen influïdes o dictades per algoritmes d'IA o polítiques institucionals.
10. Inquietud sobre els costos associats amb la implementació i l'ús de la IA en la salut, i la possible exacerbació de les desigualtats en l'accés a la atenció sanitària si aquesta tecnologia no està disponible de manera equitativa per a tots els pacients i proveïdors de serveis de salut.
**Exercici:**
+ Llegiu amb atenció aquest llistat i ompliu el formulari FORM sobre el vostre ranking.
+ Al final del curs tornarem a preguntar quin és el ranking de preocupacions i si després del curs ha canviat alguna d'elles.
:::
La millor manera de resoldre aquestes incerteses, inquietuts, temors i preocupacions és entendre la tecnologia i per això començarem explicant què és la intel·ligència i explorar la possibilitat de la seva automatització, per acabar amb una descripció de l'estat de l'art avui en dia.
## Què és la intel·ligència?
Per entendre de forma realista que pot aportar la IA i quins desafiaments ens planteja cal fer un pas enrera i entendre de què estem parlant quan fem servir la paraula **intel·ligència**.
No hi ha una definició generalment acceptada d'aquesta paraula, però en podem fer una que ens serveixi de referència:
:::success
**Definició**
La intel·ligència és una facultat natural que permet a certs organismes vius assolir objectius complicats en situacions complexes d'una manera racional, especialment quan s’enfronten a circumstàncies noves i s'hi han d'adaptar.
:::
La intel·ligència no és una característica exclusiva dels humans i podriem dir que qualsevol organisme viu una mica complex té un cert nivell d’intel·ligència. Tenint en compte això, podem afirmar que la facultat de la intel·ligència es manifesta de moltes maneres possibles, sent la intel·ligència humana una de les manifestacions més complexes i àmplies d’aquesta facultat.
Tal com hem dit, a causa de la seva complexitat i varietat el concepte d’intel·ligència no té una definició precisa i els seus límits no estan clarament establerts. Sí que hi ha però un cert consens que en el cas dels humans es pot descompondre en una sèrie de **competències**.
:::success
**Definició**
Una competència és una habilitat específica, o un conjunt d'habilitats, que permet a un individu o sistema resoldre cert tipus de problemes o adaptar-se a noves situacions mitjançant el processament d'informació.
:::
En el context de la intel·ligència humana, les competències poden ser múltiples i variades, abastant àrees cognitives, emocionals, socials i pràctiques.
Si ens centrem en el cas de les **competències cognitives** (aquelles que es refereix a la capacitat d'una persona per **processar la informació**, entendre-la, recordar-la i utilitzar-la per resoldre problemes i prendre decisions), les més importants pels humans són la percepció, la capacitat d’aprenentatge, el raonament, la planificació i la presa de decisions.
:::success
**Definició**
La **percepció** és el procés cognitiu que ens permet interpretar i donar sentit a la informació sensorial del nostre entorn per entendre i interactuar amb el món. Aquesta informació pot procedir de qualsevol dels nostres sentits, la vista, l'oïda, el tacte, l'olfacte i el gust, i té per objectiu informar-nos sobre l’estat del nostre entorn.
:::
> Exemples de processos perceptius humans:
> + La capacitat de reconèixer cares conegudes entre una multitud demostra com el cervell processa i interpreta complexos patrons visuals.
> + La nostra capacitat per determinar la direcció i la distància d'un so es basa en la percepció auditiva, utilitzant diferències subtils en el temps i la intensitat del so que arriba a cada oïda.
> + La percepció de la calor i el fred es basa en la interpretació cerebral de les senyals provinents dels receptors de la pell.
> + El sistema vestibular de l'orella interna és clau per a la percepció del moviment i l'equilibri, permetent-nos mantenir-nos drets i coordinar els nostres moviments amb precisió.
:::success
**Definició**
La capacitat d’**aprenentatge** és el conjunt de processos que permeten adquirir, processar, comprendre i retenir coneixements o habilitats noves. Aquesta capacitat permet a un individu millorar o adaptar les seves accions i comportaments en resposta a noves informacions o experiències durant la seva vida.
:::
> Exemples de la capacitat d'aprenentatge en els humans:
> + Des de molt joves, els humans són capaços d'aprendre una o més llengües simplement estant exposats a elles. Això inclou comprendre la gramàtica complexa i un vast vocabulari sense ensenyament formal.
> + Aprendre llengües addicionals més enllà de la llengua materna, tant a través de l'educació formal com de l'immersió cultural o la pràctica independent.
> + Aprendre a llegir i escriure, desenvolupant la capacitat de comprendre textos complexos i expressar idees clarament a través de l'escritura.
> + El procés d'aprendre i adaptar-se a les normes socials i els comportaments acceptables dins d'una societat o cultura.
:::success
**Definició**
El **raonament** i la **planificació** són dos processos cognitius estretament relacionats que juguen un paper clau en la forma en què els humans aborden problemes i prenen decisions. El raonament és el procés que ens permet arribar a conclusions, judicis o inferències a partir de fets, informació o arguments.
:::
> Exemples de la capacitat de raonament:
> + La capacitat de fer servir el raonament lògic per resoldre equacions, enigmes i problemes matemàtics complexos demostra la nostra habilitat per seguir processos lògics i arribar a conclusions vàlides.
> + Els advocats i jutges utilitzen el raonament deductiu per aplicar lleis generals a casos específics i el raonament inductiu per inferir principis generals a partir de casos particulars.
:::success
**Definició**
La **planificació** és el procés implicat en la formulació d'una seqüència d'accions per assolir un objectiu específic. La planificació requereix la capacitat de preveure el resultat de diferents accions i de predir quins passos són necessaris per passar de l'estat actual a l'estat desitjat.
:::
> Exemples de la capacitat de planificació:
> + La negociació i la resolució de conflictes requereixen comprendre els punts de vista dels altres, anticipar reaccions i planificar estratègies que conduiran a una solució acceptable per a totes les parts.
> + La capacitat de gestionar un pressupost, planificar per a la jubilació o decidir sobre la compra d'una casa implica raonament pràctic i la capacitat de preveure i planificar per al futur.
:::success
**Definició**
La **presa de decisions** és el procés que ens permet seleccionar de forma efectiva una determinada acció entre les diverses alternatives que han estat proporcionades per processos de raonament i planificació. Implica l'avaluació i la selecció entre opcions basades en la valoració dels seus possibles resultats.
:::
> Exemples de la capacitat de presa de decisions:
> + Decidir què menjar per esmorzar implica considerar factors com preferències personals, disponibilitat d'aliments, consideracions de salut i restriccions de temps.
> + Decidir en quins fons o accions invertir requereix analitzar informació de mercat, previsions econòmiques, i el propi perfil de risc.
> + Decidir quan evacuar davant d'un desastre natural imminent implica avaluar la informació disponible, el risc potencial i els plans de contingència.
## Es poden "dissenyar" artefactes intel·ligents?
L’ésser humà s’ha preguntat des de fa molt temps sobre la possibilitat de construir artefactes intel·ligents, o al menys, artefactes que mostrin certes capacitats cognitives. Les històries de golems, autòmats, i altres figures semblants a humans es troben en moltes cultures, reflectint la fascinació per imitar les capacitats humanes mitjançant la creació d’artefactes, però en el nostre cas hem de fer una menció especial a Ramon Llull.
Ramon Llull, un filòsof, lògic i escriptor mallorquí del segle XIII, s’associa sovint amb els orígens conceptuals de la computació i, per extensió, de la intel·ligència artificial. Tot i que Llull no va desenvolupar màquines intel·ligents com les entenem avui, la seva obra va ser pionera en la idea d'utilitzar processos mecànics o algorísmics per amplificar el pensament humà. Llull és conegut per la seva "Ars Magna" o "Art Combinatòria", un mètode per generar conclusions sobre diversos temes mitjançant la combinació de conceptes bàsics. Utilitzava un sistema de figures geomètriques amb símbols que representaven diferents atributs o conceptes teològics i filosòfics. Mitjançant la rotació i la interacció d'aquestes figures, podia combinar els símbols de maneres que generaven noves afirmacions o arguments. L'aproximació de Llull era notablement sistemàtica i pot ser vista com una anticipació primitiva de la lògica simbòlica i els algorismes, els quals són fonamentals en la programació d'ordinadors i la IA. A més, l'interès de Llull per la universalitat i l'automatització del coneixement reflecteix una actitud que és central en la IA: la recerca de regles generals que poden ser aplicades per processar informació i resoldre problemes en una àmplia gamma de dominis.
:::info

**Figura**: Dibuixos del llibre "Ars Magna" de Ramon Llull. Llull va introduir el seu famós mètode de combinació de termes, que va permetre generar combinacions de conceptes bàsics per a la investigació de la veritat en temes filosòfics i teològics. Aquest mètode va tenir un impacte significatiu en la metodologia filosòfica de l'època i va influir en el pensament posterior.
:::
Haurem d’esperar però fins al segle XX per presenciar els primer intents seriosos per replicar de forma artificial les competències cognitives i la creació d’una disciplina acadèmica dedicada a aquest objectiu: la **intel·ligència artificial**. I és així perquè en aquells anys es crea l’eina indispensable, els **ordinadors electrònics programables**, i els científics comencen a preguntar-se sobre la possibilitat que aquests enginys puguin ser el medi idoni per crear sistemes intel·ligents no naturals.
:::warning
### Com reconeixerem una màquina intel·ligent quan siguem capaços de contruir-la?
El Test de Turing, proposat per Alan Turing el 1950, és un dels criteris més coneguts per avaluar la capacitat d'una màquina per exhibir un comportament intel·ligènt. La seva proposta original, detallada en el seu article "Computing Machinery and Intelligence", planteja la pregunta "Les màquines poden pensar?" i ofereix una forma pràctica de tractar aquest dilema filosòfic.
Alan Turing va proposar el que ell anomenava el "joc de la imitació" com a substitut de la pregunta sobre si les màquines poden pensar. En aquest joc, un interrogador humà fa preguntes a través d'una terminal de text a dos participants ocults: un humà i una màquina. L'objectiu de l'interrogador és determinar quin dels dos és la màquina. Si l'interrogador no pot determinar o s'equivoca de manera consistent sobre quina és la màquina, llavors la màquina es considera que ha passat el test, demostrant una forma d'intel·ligència artificial (IA).

Malgrat la seva influència, el Test de Turing ha rebut crítiques, principalment perquè se centra en la imitació de la conducta humana més que en la comprensió real del fenòmen de la intel·ligència. A més, alguns argumenten que el test no proporciona una mesura completa o adequada de la intel·ligència, ja que una màquina pot ser dissenyada per passar el test sense realment ser intel·ligent. Aquesta crítica apunta al fet que el test mesura la capacitat de la màquina per simular comportament humà de manera convincent. El fet que els humans siguin fàcilment "enganyables" planteja diverses limitacions sobre l'ús efectiu d'aquest test.
:::
:::warning
### Sóm els humans un mitjà fiable per mesurar el nivell d'intel·ligència d'una màquina?
El fenomen pel qual les persones tendeixen a atribuir nivells d'intel·ligència, emocions o intencions més elevats dels que realment té una màquina es coneix com a **efecte ELIZA**.
Aquest terme va ser acunyat a partir de l'experiència amb ELIZA, un dels primers programes d'ordinador dissenyats a mitjans dels anys 60 per simular una conversa. ELIZA, creat per Joseph Weizenbaum, va utilitzar un model de reconeixement de patrons per imitar el llenguatge d'un psicoterapeuta, fent preguntes obertes basades en les entrades dels usuaris. El que va sorprendre Weizenbaum va ser com els usuaris ràpidament van començar a atribuir comprensió i emocions reals a ELIZA, malgrat saber que era simplement un programa d'ordinador amb capacitats molt limitades.
Aquí podeu implementació d'Eliza i experimentar una conversa amb ella: http://deixilabs.com/eliza.html
:::
> Exercici sobre IA basat en documentals (Nextus)
## Ordinadors i algorismes
La intel·ligència artificial (IA) no existiria tal com la coneixem avui sense els conceptes fonamentals d'**ordinador** i d'**algorisme**. Els ordinadors proporcionen la infraestructura física necessària per processar i emmagatzemar grans quantitats de dades, mentre que els algorismes són els procediments o les fórmules matemàtiques que guien aquests processos, permetent així la realització de tasques complexes de forma automàtica.
El concepte d’ordinador va ser inventat per Charles Babbage i Ada Lovelace al segle XIX per operar amb números seguint un procediment ben definit i fer càlculs numèrics. Els seus dissenys estaven pensats per ser implementats sobre màquines mecàniques, amb engranatges i eixos per fer els càlculs, ja que encara no existia la tecnologia electrònica.
:::info

**Figura**: Reconstrucció d'una de les màquines que va dissenyar C.Babbage. Les seves idees van ser revolucionàries perquè van permetre pensar en la possibilitat de mecanitzar processos mentals, o almenys parts d'ells, que fins aleshores es feien de forma manual.
:::
Els dissenys de Babbage i Lovelace van ser els antecessors dels ordinadors electrònics moderns. Tot i que no va arribar a construir-les completament durant la seva vida, els principis que van guiar els seus treballs han influït profundament en el desenvolupament de la tecnologia computacional. La seva visió va anticipar moltes de les funcions realitzades per les màquines computacionals d'avui dia, com el processament de dades i l'execució de càlculs complexos seguint algorismes específics.
La història dels ordinadors electrònics comença a la primera meitat del segle XX, marcada per la transició des de dispositius mecànics cap a màquines completament electròniques. Aquest procés va ser impulsat per la necessitat de processar informació a una escala i velocitat que els mecanismes purament mecànics no podien oferir. Alan Turing proposa durant la segona dècada dels anys 30 del segle passat el concepte de la màquina de Turing, un model teòric per a una màquina capaç de realitzar qualsevol càlcul computable, sent una base teòrica per a la informàtica moderna, però no és fins a principis dels anys 40 que Konrad Zuse, a Alemanya, construeix el Z3, considerat un dels primers ordinadors electrònics programables, que constitueixen el model d’ordinador que encara usem avui.
:::info

**Figura**: L'ordinador Z3, creat per Konrad Zuse, va ser el primer ordinador programable i completament automàtic. Es va construir amb 2200 relés electromecànics, pesava 1000 kg, i trigava 0,7 segons a fer una suma i 3 segons a fer una divisió.
:::
La segona meitat del segle XX és l’època dels gran desenvolupament de la informàtica, que comença el 1951 amb l’UNIVAC I, el primer ordinador comercial, que la viabilitat dels ordinadors per a aplicacions comercials i governamentals, passant per la creació de les microcomputadors el 1960 fins al concepte de l’ordinador personal al 1980.
:::success
**Definició**
Un **ordinador electrònic programable** és una màquina dissenyada per executar conjunts d'instruccions o programes, els quals detallen operacions específiques per processar dades.
:::
:::success
**Definició**
Un **programa** és la implementació d'un o diversos algorismes en un llenguatge de programació específic, de manera que pot ser executat per un ordinador.
:::
A diferència dels dispositius mecànics o els ordinadors que realitzen una sola tasca o un conjunt limitat de funcions, els ordinadors electrònics programables poden ser reprogramats per realitzar una àmplia varietat de tasques, gràcies al seu disseny basat en l'arquitectura de programari emmagatzemat.
Quan volem que un ordinador electrònic programable resolgui una tasca concreta, el primer que hem de fer és dissenyar un **algorisme**.
:::success
**Definició**
Un **algorisme** és un conjunt d'instruccions o passos clars i seqüencials que ens porten des d'unes dades inicials fins a una resposta final. Aquests passos han de ser prou simples perquè, siguin executats per una persona o una màquina, el resultat sigui sempre el mateix davant de la mateixa pregunta.
:::
Els algorismes són una peça fonamental en la programació d'ordinadors, ja que permeten a les màquines realitzar tasques complexes descomposades en operacions més petites i gestionables.
:::warning
### Els algorismes són "receptes" per solucionar problemes
Els algorismes són una recepta per resoldre un problema i des d'aquest punt de vista no són útils només pels ordinadors, sinó també per les persones.
Suposem que volem solucionar un problema (fer un bon pa de pita) i que tenim els ingredients necessaris (dades d'entrada). El que necessitem és una seqüència de passos a seguir (instruccions de l'algorisme) per obtenir pa de pita d'una certa qualitat (resposta final).

:::
Els algorismes són independents del mitjà que farem servir per executar-lo. És a dir, un algorisme pot ser expressat en llenguatge natural o elements gràfics per ser executat per un humà, o es pot expressar amb qualsevol llenguatge de programació per ser executat per un ordinador, mantenint la seva essència i la seva lògica. Els algorismes que fem servir per fer càlculs aritmètics (suma, multiplicació, divisió, etc.) són un bon exemple d'aquesta qualitat dels algorismes.
:::warning
### Els algorismes de la multiplicació
Prenem, per exemple, l'algorisme de la multiplicació, una operació bàsica però fonamental. Quan multipliquem manualment dos nombres, seguim un conjunt específic de passos: multipliquem cada dígit del segon nombre per tot el primer nombre, desplacem adequadament cada resultat parcial segons la seva posició, i finalment sumem tots els resultats parcials per obtenir el resultat final.
Aquest algorisme pot ser seguit per un humà, permetent a les persones fer multiplicacions amb paper i llapis. Però també es pot traduir fàcilment a un programa que un ordinador pot seguir, permetent a la màquina realitzar multiplicacions ràpida i acuradament.
És interessant observar també que un determinat problema no té perque tenir una forma de solucionar-se única i això vol dir que poden haver-hi diferents algorismes per resoldre’l. Aquest és el cas de la multiplicació.
L'algorisme de multiplicació japonès, també conegut com a multiplicació amb línies o multiplicació gràfica, és un mètode visual antic per a multiplicar nombres que es creu que té orígens en el Japó. Aquest mètode converteix els nombres en conjunts de línies i després calcula el producte comptant els punts d'intersecció entre aquests conjunts. És particularment interessant per la seva simplicitat visual i perquè no requereix saber les taules de multiplicar, fet que el fa especialment interessant per alumnes de curta edat.

Si a partir del gràfic antenior pots calcular el resultat de 12x11 has sigut capaç de seguir l'algorisme de la multiplicació japonesa. Prova-ho!
:::
## Tenim algorismes per resoldre tots els problemes?
Els algorismes, com les receptes de cuina, són el producte del coneixement acumulat per moltes persones sobre la resolució d'un problema de forma metòdica. Aquest coneixement queda condensat en una sèrie de passos o instruccions que ens porten d'unes dDES d'entrada a una resposta sense necessitat de pensar res a cada pas: només cal fer el que especifica cada instrucció.
L'origen dels algorismes es remunta a l'antiguitat, però un moment clau en la seva història és l'obra del matemàtic persa Muhammad ibn Mūsā al-Khwārizmī al segle IX, que es va centrar en els algorismes dedicats a les operacions aritmètiques.
Amb el temps, la noció d'algorisme s'ha expandit per abastar qualsevol conjunt definit de regles o procediments per a processar informació, resoldre problemes o prendre decisions. Així, mentre que els algorismes tenen arrels que es remunten a mil·lennis enrere, la seva aplicació i desenvolupament han continuat evolucionant fins a l'era moderna, jugant un paper central en la informàtica i la intel·ligència artificial.
Des del naixement de la informàtica els programadors han escrit milions d’algorismes que resolen problemes molt útils i que van molt més enllà de les operacions aritmètiques, però hi algunes tasques que no hem sabut resoldre de manera explícita i per tant no sabem escriure algorismes que automatitzin la seva resolució.
Imagineu que volem determinar si una taca a la pell és cancerígena només mirant una fotografia d’ella. Tal i com aprenem a estimar l'edat d'una persona per la seva fotografia gràcies a l'experiència de veure moltes imatges de persones de diferents edats, un dermatòleg expert ha vist durant la seva vida moltes imatges de taques a la pell, tant benignes com malignes. Tot i així, explicar pas a pas com distingeix unes de les altres o programar un ordinador amb les regles necessàries perquè prengui aquesta decisió és extremadament difícil. Això il·lustra un dels tipus de desafiaments que motiva el camp de la intel·ligència artificial.
:::warning
### Problemes i algorismes
L'algorísmica és el camp científic que estudia els algorismes que dissenyem els humans quan volem resoldre un problema. Aquest camp és fonamental en la informàtica i la matemàtica, donant lloc a solucions eficients per a problemes de diversa índole. L'algorísmica es centra no només en el disseny d'aquests algorismes sinó també en l'anàlisi de la seva eficiència i efectivitat.
Hi ha problemes que poden ser resolts eficientment amb algorismes relativament simples. Quan planegem el **millor camí** per anar de casa al treball, tenint en compte la distribució de carrers de la nostra ciutat, estem utilitzant principis semblants als de l'algorisme que va proposar E.Dijkstra al 1959 per trobar el camí més curt en un graf, que és un algorisme conegut i molt usat.
Altres problemes són molt més complexes i només sóm capaços d'escriure algorismes que ens donen solucions aproximades, sense cap garantia de ser la millor solució. El **problema del viatjant de comerç** consisteix a trobar la ruta més curta possible que un viatjant ha de seguir per visitar una sèrie de ciutats exactament una vegada i retornar a la ciutat d'origen, optimitzant la distància total recorreguda o el cost associat al viatge. Malgrat la seva aparent simplicitat, aquest problema és complicat per diverses raons, entre les que podem destacar que el nombre de rutes possibles entre les ciutats creix de manera molt amb l'augment del nombre de ciutats, fent que el problema es torni computacionalment intratable fins i tot per a nombres relativament petits de ciutats.
Fins l'adveniment de la IA, i més especificament de l'aprenentage automàtic, hi havia una sèrie de problemes pels quals no havien trobat una solució mínimament satisfactòria i eren per tant problemes no resolts des d'un punt de vista algorismic:
+ Quin és l'algorisme que donada una frase en català com a dada d'entrada em retorna la frase en una altra llengua com a resultat?
+ Quin és l'algorisme que donada una fotografia em retorna el nombre de persones qui hi apareixen?
+ Quin és l'algorisme que donades les imatges de video d'una càmara frontal pot conduïr un cotxe de manera segura i eficient fins una destinació?
+ Quin és l'algorisme que donada una posició concreta de les peces durant una partida d'escacs em retorna la millor jugada possible?
+ Quin és l'algorisme que donades totes les dades d'un pacient em retorna el millor tractament conegut pel seu cas?
+ Etc.
:::
## L’era de la Intel·ligència Artificial
El terme **intel·ligència artificial** es va utilitzar per primera vegada en una escola d'estiu, la Dartmouth Summer Research Project on Artificial Intelligence, realitzada el 1956 al Dartmouth College, una universitat d'elit dels EUA.
La conferència va reunir 20 de les ments més brillants en informàtica i ciències cognitives de l'època per discutir la conjectura següent:
> "...que cada aspecte de l'aprenentatge o qualsevol altra característica de la intel·ligència pot, en principi, descriure's amb tanta precisió que es pot fer una màquina per simular-lo. S'intentarà trobar com fer que les màquines usin el llenguatge, formin abstraccions i conceptes, resolguin tipus de problemes que ara estan reservats per als humans i es millorin a si mateixes. Creiem que es pot aconseguir un avenç significatiu en un o més d'aquests problemes si un grup acuradament seleccionat de científics hi treballa durant un estiu".
> *McCarthy et al, 1955*.
Actualment som lluny encara d’aquest objectiu (tot i que McCarthy pensava que era feina d'un estiu) i encara no sabem construir sistemes intel·ligents artificials amb objectius complexos en entorns complexos que siguin capaços de manejar situacions desconegudes.
:::success
**Definició**
Un "sistema d'IA" és un sistema informàtic dissenyat per funcionar amb diferents nivells d'autonomia, que pot mostrar capacitat d'adaptació després del seu desplegament i que, a partir d'objectius explícits o implícits, dedueix a partir de l'entrada que rep com generar sortides...
[AI Act, Final Text, 2024]
to do: comentar aquesta definició
+ Un algorisme adaptatiu és qualsevol programari que actualitza regularment el seu propi comportament en funció dels resultats que també influeix.
+ L'autonomia d'un sistema:
10 L'ordinador ho decideix tot i actua amb autonomia total
9 L'ordinador informa l'ésser humà només si ell, l'ordinador, ho decideix
8 L'ordinador informa l'humà només si se li demana
7 L'ordinador executa i després informa l'humà
6 L'ordinador permet als humans un temps restringit per vetar
5 L'ordinador executa el suggeriment si l'home ho aprova
4 L'ordinador suggereix una alternativa
3 L'ordinador suggereix un conjunt reduït d'alternatives
2 L'ordinador ofereix totes les alternatives
1 L'ordinador no ofereix cap ajuda
:::
El fet d'estar lluny de solucionar el problema de la IA no significa que no hi hagi certes àrees de recerca de la IA que hagin assolit alguns resultats parcials força interessants. Les àrees més importants són:
+ L'**aprenentatge automàtic** a partir de dades, conegut en anglès com a "*Machine Learning*", és una branca de la intel·ligència artificial que se centra en la construcció d'algorismes que permeten a les màquines aprendre i fer prediccions o prendre decisions basades en dades. Els sistemes d'aprenentatge automàtic construeixen models matemàtics que s'ajusten o entrenen a partir de les dades d'entrada perquè puguin, **sense ser explícitament programats per a cada cas**, prendre decisions raonables quan s'exposen a noves dades.
:::warning
### Els detectors de correus *spam*
El cas del correu brossa, o *spam mail*, és un bon exemple de l'ús l'aprenentatge automàtic per abordar un problema quotidià que h afectat i afecta milions d'usuaris d'internet arreu del món. El problema a resoldre en aquest cas és predir quins correus electrònics són *spam* i quins no a partir d'una descripció del seu contingut.
El primer pas és determinar com describim o representarem els correus electrònics. Els primers sistemes, desenvolupats a principis dels 2000, es basaven en un diccionari de paraules representatives i comptar la freqüència amb què cada una d'aquestes paraules apareixia en el text. Aquest mètode ignora l'ordre de les paraules i la gramàtica, però pot ser efectiu per detectar patrons comuns en el spam.
El segon pas és entrenar un model d'aprenentage automàtic amb un conjunt de dades que conté exemples de correus electrònics degudament representats, tant de *spam* com de *no spam*. Aquestes dades d'entrenament ajuden el model a aprendre quines característiques (com ara les freqüencies de les paraules clau específiques) són indicatives de *spam*.
Un cop entrenat, el model pot començar a fer prediccions sobre correus electrònics nous o desconeguts, classificant-los com a *spam* o *no spam*. Aquests models són típicament implementats com a part dels sistemes de correu electrònic, treballant en temps real per filtrar el spam abans que arribi a la safata d'entrada de l'usuari.
:::
+ La **percepció visual** de l’entorn és una font d'informació que ens permet explorar el nostre entorn i fer-nos una de de l’estat del món. Aquest camp combina mètodes de l'aprenentatge automàtic, el processament d'imatges i la visió artificial per permetre a les màquines "veure" i processar imatges i vídeos de manera similar a com ho fan els humans, fins i tot a escala i velocitats que superen les capacitats humanes en algunes ocasions.
:::warning
#### Visió per Computador
L'aplicació de la visió artificial a la conducció ha revolucionat la manera com pensem la mobilitat i la seguretat en carretera. Un dels exemples més destacats és el desenvolupament i implementació de sistemes avançats d'assistència al conductor (ADAS) i vehicles semi-autònoms. Aquestes tecnologies utilitzen càmeres i algorismes de visió per computador per interpretar l'entorn del vehicle en temps real, permetent una sèrie de funcionalitats (com la detecció de senyals, el control de creuer adaptatiu o l'assistència per manteniment de carril) que milloren la seguretat i la comoditat del conductor.
:::
+ El **reconeixement i producció de la parla** a partir del sóns és un element clau com a forma de comunicació amb els humans i obre la porta a un estil de col·laboració molt més natural entre humans i ordinadors.
:::warning
#### Assistents virtuals
Els assistents virtuals com Siri (Apple) o Alexa (Amazon) són exemples d'ús del reconeixement de la parla. Permeten als usuaris realitzar consultes, controlar dispositius intel·ligents de la llar, posar música, configurar alarmes, i molt més, tot usant comandes de veu.
:::
+ L’àrea de la percepció, l'anàlisi, la generació i la traducció del **llenguatge natural** s’ocupa de la interacció entre els ordinadors i els humans mitjançant el llenguatge humà. L'objectiu és permetre als ordinadors comprendre, interpretar i produir llenguatge humà d'una manera útil.
:::warning
#### Processament del Llenguatge Natural
Potser l'exemple més omnipresent de processament del llenguatge natural fins fa poc ha estat Google Translate, que permet als usuaris traduir textos o pàgines web completes a gairebé qualsevol idioma. Google Translate va aprofitar models de llenguatge avançats basats en IA predictiva per democratitzar les eines de traducció automàtica.
:::
+ El **raonament i la planificació** són àrees de recerca clau en el camp de la intel·ligència artificial, enfocades en dotar les màquines de la capacitat de prendre decisions lògiques i elaborar plans d'acció per assolir objectius específics. Aquestes àrees aborden alguns dels desafiaments més complexes i fascinants en la creació de sistemes intel·ligents que poden actuar de manera autònoma.
:::warning
#### Raonament i planificació
El Go és un antic joc de tauler que ha estat particularment desafiador per a la IA a causa de la seva enorme complexitat i l'alt nombre de possibilitats de joc. L'empresa DeepMind que va fer història al 2016 quan va derrotar a Lee Sedol, un dels millors jugadors de Go del món amb un programa anomenat AlphaGo. Això va ser possible gràcies a l'ús de xarxes neuronals profundes i algoritmes d'aprenentatge per reforç, que li van permetre aprendre estratègies de joc a partir de partides humanes i optimitzar la seva jugada a través de la pràctica contra si mateix.
AlphaFold, també desenvolupat per DeepMind, és un sistema que utilitza l'IA per predir l'estructura tridimensional de les proteïnes basant-se en la seva seqüència d'aminoàcids. Això representa un gran avenç en la biologia estructural, ja que la forma d'una proteïna és clau per entendre la seva funció. Com AlphaGo, AlphaFold utilitza xarxes neuronals profundes per analitzar i aprendre de dades complexes, en aquest cas, dades biològiques, per fer prediccions precisas.
Tant en el cas del Go com en la predicció de l'estructura de proteïnes, hi ha un element fonamental de **planificació**. En el Go, AlphaGo ha de planificar estratègies i anticipar els moviments del contrincant per guanyar la partida. Això requereix la capacitat d'imaginar diferents escenaris futurs basats en els moviments actuals.
En la biologia i la química computacionals, AlphaFold ha de "planificar" com s'ajustaran plegades les cadenes d'aminoàcids per formar una estructura tridimensional estable, basant-se en les lleis físiques i químiques que regeixen les interaccions entre els àtoms. Tot i que no es tracta de planificació en el sentit tradicional de preveure i executar accions en un entorn, implica la predicció d'una "sèrie d'esdeveniments" (en aquest cas, plegaments) que conduiran a un resultat òptim (l'estructura correcta de la proteïna).
:::
Aquests resultats s'han anat produïnt durant els darrers 70 anys de forma progressiva, amb molts alts i baixos que han fet que la IA es vagin incorporant de forma progressiva a les nostres vides.
En l'actualitat, i simplificanet una mica, podriem dir que cada un dels artefactes tecnològics basats en IA que podem trobar en la nostra vida quotidiana formen part d'una les quatre onades de la IA que s'han generat a partir dels seus altibaixos.
:::info

**Figura**: Les "4 onades de la IA" són una manera de categoritzar el desenvolupament històric de la intel·ligència artificial i les seves aplicacions. Avui en dia podem trobar fàcilment productes de les 4 onades en la nostra vida quotidiana.
:::
### La primera onada: la IA simbòlica (1953-2000).
Prenent com a punt de partida l'escola d'estiu de Dartmouth, la primera onada tecnològica de la IA va ser anomenada l'onada de la IA Simbòlica.
L'enfocament simbòlic a la intel·ligència artificial (IA) es basa en l'ús de símbols per representar problemes i dades, i en l'aplicació de regles lògiques per manipular aquests símbols i arribar a conclusions. L'artefacte tecnològic més reixit que adopta aquest enfocament és la tecnologia de **sistemes experts**.
:::success
**Definició**
Els **sistemes experts** són una branca de la intel·ligència artificial que tenen com a objectiu proporcionar capacitats de presa de decisions automàtiques similars a les d'un expert humà en un domini específic. Estan dissenyats per resoldre problemes complexos mitjançant un conjunt de regles o algorismes que poden imitar processos de raonament humà.
:::
Per exemple, un sistema expert mèdic pot diagnosticar malalties basant-se en els **símptomes**, la **història clínica** del pacient, i els **resultats de proves** mèdiques. El sistema utilitza una base de coneixement que conté fets (com *"febre alta pot indicar infecció"*) i regles (*"si el pacient té febre alta i mal de cap, considera la possibilitat d'una grip"*) per fer deduir conclusions i proporcionar un diagnòstic.
:::warning
### El sistema expert MYCIN
Un exemple clàssic de sistema expert és MYCIN, desenvolupat a principis dels anys 70 a la Universitat de Stanford. MYCIN va ser dissenyat per diagnosticar malalties bacterianes greus, com la meningitis, i recomanar tractaments basats en els símptomes, la història del pacient i els resultats de laboratori.
MYCIN utilitzava una extensa base de coneixement que contenia informació sobre bacteriologia i malalties infeccioses. Aquesta base de coneixement estava formada per centenars de regles que podien aplicar-se per interpretar les dades mèdiques del pacient.
A través del seu motor d'inferència, MYCIN aplicava les regles de la seva base de coneixement a la informació específica de cada cas. Aquest procés d'inferència permetia a MYCIN fer diagnòstics i recomanar tractaments antibiòtics, ajustant la dosi en funció de factors com el pes del pacient i possibles interaccions entre medicaments.
Exemple de regla de MYCIN aplicada a l'anàlisi al microscopi d'una mostra d'un pacient:
>SI la tinció de l'organisme és gram-positiva
I la morfologia de l'organisme és coccus
I la conformació de creixement de l'organisme són grumolls
LLAVORS la identitat de l'organisme és estafilococ en un 70% de casos
Els metges interactuaven amb MYCIN a través d'un sistema de preguntes i respostes. El sistema podia demanar més informació o clarificacions, permetent així ajustar les seves recomanacions de manera més precisa.
Tot i que MYCIN mai no es va desplegar de forma àmplia en entorns clínics, va ser un dels primers exemples del potencial dels sistemes experts en medicina. Va demostrar la possibilitat d'aplicar la intel·ligència artificial per suportar decisions clíniques complexes, i va establir un precedent per al desenvolupament futur de sistemes similars en altres àmbits mèdics i industrials.
:::
Tanmateix, aviat va quedar clar que l’enfocament dels sistemes experts no escala bé i això va portar a l'anomenat "Hivern de la IA" a finals dels anys 70, el final de la primera onada de la IA. Els sistemes experts requereixen una base de coneixement molt detallada i exhaustiva per funcionar eficaçment. Aquest coneixement ha de ser recopilat i estructurat per experts humans, un procés que pot ser llarg i costós. A més a més, actualitzar la base de coneixement per reflectir nous descobriments o canvis en el camp d'expertesa pot ser complicat i requereix intervenció humana. Això fa que els sistemes experts siguin menys adaptatius a entorns canviants o a situacions no previstes durant la seva concepció.
:::success
**Definició**
L'enfocament **simbòlic** s'associa normalment a una modelització de la intel·ligència **de dalt a baix**.
Un enfocament de dalt a baix modela la manera com una persona raona per resoldre un problema, a partir dels conceptes i les relacions que la persona utilitza per resoldre el problema. Implica extreure coneixement d'un ésser humà i representar-lo en una forma llegible per ordinador.
:::
### La segona onada: la IA predictiva (2000-2012).
Els problemes associats a la tecnologia simbòlica va fer que una part de la comunitat de recerca centrés el seu interès en altres àrees de la intel·ligència artificial, com l'**aprenentatge automàtic**, que buscava superar algunes d'aquestes limitacions permetent a les màquines aprendre de grans quantitats de dades sense necessitar una programació detallada de regles o lògiques específiques i per tant minimitzant l’intervenció humana.
:::warning
### Sistemes específics i sistemes generals d'IA
Quan parlem d’intel·ligència artificial hem de diferenciar entre:
+ **Sistemes específics d'IA** (*Narrow AI* en anglès), que es refereix a sistemes d'intel·ligència artificial dissenyats per a realitzar una tasca específica o un conjunt limitat de tasques. No tenen capacitat per aplicar el coneixement adquirit en una àrea a una altra de manera independent. En el camp de la salut, els sistemes específics d'IA es poden veure en sistemes que ajuden a interpretar imatges radiològiques, predir reingressos hospitalaris, o proporcionar recomanacions de tractament basades en dades específiques del pacient. Per exemple, un sistema d'IA que analitza mamografies per detectar càncer de mama és un tipus de sistema específic: està altament especialitzat i molt efectiu en la seva tasca específica, però no pot realitzar ni entendre tasques fora d'aquest àmbit.
+ **Sistemes d'IA General** (*Articial General Intelligence* o *AGI* en anglès), també coneguda com a AI forta, es refereix a un tipus teòric d'IA que té la capacitat d'entendre, aprendre i aplicar la intel·ligència de manera similar a un ésser humà. Això inclou l'habilitat per raonar, planificar, resoldre problemes, pensar abstractament, entendre idees complexes, aprendre ràpidament, i aprendre de l'experiència. Actualment, la IA General no existeix en una forma pràctica o aplicable, però el concepte implica que podria realitzar qualsevol tasca mèdica que un humà pugui fer, des de fer diagnòstics complexos fins a realitzar cirurgies delicades i prendre decisions ètiques sobre l'atenció dels pacients. A diferència dels sistemes específics, una IA General podria, en teoria, traslladar el coneixement i les habilitats d'una àrea de la medicina a una altra sense necessitat d'una programació específica.
:::
### La terdera onada: l'aprenentage profund (2012-avui).
L'**aprenentatge profund** és un subcamp de l'aprenentatge automàtic que utilitza **xarxes neuronals** per analitzar diversos tipus de dades (imatges, videos, texts) amb una alta precisió.
L'origen de les xarxes neuronals el podem situar en la dècada de 1950 amb el naixement del *perceptró*. Desenvolupat per Frank Rosenblatt, el perceptró es va dissenyar com un model computacional inspirat en la biologia per simular el comportament d'una neurona en el cervell humà. Aquest model simple va establir les bases per al desenvolupament posterior de les xarxes neuronals.
El 2012 és considerat sovint com l'any de despertar per l'aprenentatge profund, principalment gràcies al treball de Geoffrey Hinton i el seu equip en la competició ImageNet Large Scale Visual Recognition Challenge (ILSVRC). El seu model, anomenat "AlexNet", va utilitzar una xarxa neuronal convolucional (CNN) per classificar imatges en 1000 categories diferents amb una precisió sense precedents. AlexNet va superar els mètodes existents per un marge substancial, marcant l'inici d'una nova era on l'aprenentatge profund es convertiria en l'eina dominant en el camp de la visió per computador i el processament del llenguatge natural.
:::success
**Definició**
L'**aprenentatge profund** és, o *deep learning* en anglès, és un subcamp de l'aprenentatge automàtic que implica xarxes neuronals amb moltes capes. Aquestes xarxes neuronals profundes són capaces d'aprendre nivells complexos de representació i característiques de les dades, passant de les característiques més simples a les més complexes. El terme "profund" fa referència a la quantitat de capes a través de les quals passen les dades per a la seva transformació i anàlisi.
:::
L'aprenentatge profund ha trobat aplicacions en una àmplia gamma de camps, incloent:
+ Visió per Computador: Reconèixer objectes en imatges i vídeos.
+ Processament del Llenguatge Natural (PLN): Traducció automàtica, generació de text i comprensió lectora.
+ Reconeixement de Veu: Assistents de veu com Siri, Alexa i l'Assistent de Google.
+ Jocs: Desenvolupament de sistemes que poden jugar i competir a nivells superhumans en jocs complexos com el Go o els videojocs.
Els avantatges de l'aprenentatge profund inclouen la seva capacitat per processar i aprendre de grans quantitats de dades no estructurades i la seva habilitat per realitzar tasques de classificació i predicció amb alta precisió. No obstant això, també presenta desafiaments, com ara la necessitat de grans conjunts de dades per entrenar els models de manera efectiva, el seu alt cost computacional, i la dificultat per interpretar els models (el problema de la "caixa negra").
:::success
**Definició**
L'enfocament **predictiu**, incloses les xarxes neuronals profundes, s'associa normalment a una modelització de la intel·ligència **de baix a dalt**.
Un enfocament de baix a dalt assumeix com a punt de partida les dades crues (imatges, paraules, nombres, etc.) i intenta construir els conceptes que ens permeten construïr de forma automàtica la solució d'un problema, assumint que alguns dels conceptes generals potser no podran ser entensos pels humans.
:::
### La quarta onada: la IA generativa (2023-avui).
Les xarxes neuronals profundes (i en particular les anomenades xarxes neuronals recurrents) van millorar significativament el processament del llenguatge natural respecte a les tecnologies basades en els models predictius o les basades en el model simbòlic, permetent la representació del significat del text d'una manera més precisa i útil per moltes aplicacions. Això va permetre l'existència dels assistents virtuals nascuts a la primera dècada del segle XIX, capaços d'interpretar alguns aspectes del llenguatge humà com identificar una necessitat i realitzar una acció per satisfer-la, o com ara respondre amb un guió predefinit a una determinada pregunta.
:::warning
### Xatbots
Els xatbots van guanyat popularitat en diverses indústries, oferint assistència, resolent dubtes i millorant l'experiència d'usuari.
En el sector de l'ensenyament, Duolingo utilitza un chatbot per ajudar els usuaris a practicar llengües noves de manera interactiva. El bot simula converses en la llengua que l'usuari està aprenent, oferint una manera divertida i efectiva de practicar habilitats de parla i escriptura.
En el món de les finances, el xatbot Erica ajudava els clients de Bank of America a realitzar transaccions bancàries, com a transferències i pagaments de factures, a través de comandes de veu o text. També proporcionava informació financera personalitzada, com revisions de despeses.
:::
Però l'any 2017 hi va haver un descobriment important dins del camp de l'aprenentatge profund que va revolucionar el món del processament del llenguatge natural: el disseny d'un tipus de xarxes neuronals profundes anomenades **Models Grans de Llenguatge** o *Large Language Models* (LLM) en anglès.
Els models grans de llenguatge són sistemes avançats d'intel·ligència artificial accepten qualsevol text escrit en llenguatge natural com entrada i generen text semblant al que hauria estat escrit per un ésser humà com a resposta. S'entrenen primer analitzant grans quantitats de texts i creant una estructura interna que els modela adequadament. Un cop desenvolupada aquesta estructura interna, els models processar qualsevol entrada en forma de llenguatge natural i aproximar una bona resposta.
El llançament de ChatGPT va obrir la porta d'aquesta tecnologia a qualsevol persona amb accés a Internet, que pot interactuar amb una interfície web senzilla. Això va posar en relleu els impressionants avenços dels LLM, ja que anteriorment aquests LLM més potents només estaven disponibles per a investigadors amb grans quantitats de recursos i aquells amb un coneixement tècnic molt profund.
Posteriorment aquests models s'han generalitzat i són capaços d'acceptar entrades multimodals (text, imatges, video) i també de generar sortides multimodals.
# Conclusions
En aquest mòdul hem vist la importància que té la IA pel món de la salut i hem repassat una mica la seva història i les diferents aproximacions científiques que han dirigit el seu desenvolupament.
També hem vist que el cor d'aquesta tecnologia està format per dos elements importants: les dades i els algorismes. Els mòduls següents aprofundeixen en aquests dos aspectes i ens permeten entendre els requeriments i les limitacions d'aquestes tecnologies.
{"description":"Intel·ligència Artificial i SalutLa Intel·ligència Artificial (IA) està emergint com una eina transformadora en el camp de la salut, oferint solucions potencials tant en el diagnòstic com en el tractament de malalties. Aquesta tecnologia, que permet a les màquines aprendre de grans volums de dades i prendre decisions intel·ligents, pot sentar les bases per a un futur on la cura de les persones sigui més precisa, personalitzada i accessible.","title":"M1: Intel·ligència Artificial i Salut","contributors":"[{\"id\":\"27c1cf26-ef2c-44cb-8ae1-2edc488d3f8e\",\"add\":92047,\"del\":40751}]"}