![Captura de pantalla 2024-03-26 a les 12.47.44](https://hackmd.io/_uploads/HkNVIExk0.png) # La IA com a tecnologia habilitadora en salut. # Les tecnologies del coneixement i la salut Durant les dues darreres décades el món ha viscut un procés molt accelerat ha estat una de les bases del desenvolupament de la IA, la **datificació**. :::success **Definició** La **datificació** és el procés tecnològic que converteix aspectes del món o de la vida real en dades quantificables que son emmagatzemades en repositoris informatitzats. Aquesta tendència ha tingut un impacte profund en diversos àmbits com la indústria, la medicina, l'educació, entre altres, facilitant la presa de decisions i l’optimització de processos mitjançant eines informàtiques. ::: La datificació del nostre món ha revolucionat àmbits com el personal, familiar, d'estudi, i laboral, impulsant tecnologies emergents com la ciència de dades i la intel·ligència artificial. Aquestes tecnologies no només volen automatitzar tasques que fins ara eren pròpies dels humans, sinó que també inicien un nou paradigma en la presa de decisions. :::warning ### Exemples del procés de datificació + Empreses com Amazon i Netflix recullen dades sobre les interaccions dels usuaris amb els seus serveis per personalitzar recomanacions de productes o contingut. Això es basa en la comprensió profunda dels hàbits de consum i preferències individuals. + Les plataformes de xarxes socials utilitzen dades recollides dels usuaris sobre el seu comportament per oferir publicitat hiper-personalitzada. + Les ciutats utilitzen sensors i càmeres per monitoritzar el flux de trànsit en temps real, optimitzant els senyals de trànsit i reduint els embussos. + Sensors i imatges per satèl·lit recullen dades sobre condicions del sòl, humitat, i creixement de cultius, permetent als agricultors optimitzar l'ús de recursos com aigua i fertilitzants. Com a resultat de molts processos de datificació com aquests podem afirmar que avui en dia el funcionament del món està representat en repositoris d'informació a un nivell de precisió i amb una varietat d'aspectes que mai s'havien conegut. ::: En l'àmbit de la salut, els rellotges intel·ligents que monitoritzen indicadors com els passos caminats, les calories cremades, la freqüència cardíaca, i els patrons de son, són un bon exemple de procés de datificació d'alguns aspectes de la vida personal. Aquestes dades poden ser utilitzades tant per l'usuari per millorar el seu estil de vida com per professionals de la salut per ajustar tractaments o recomanacions. L’existència d’aquestes dades, afegides a les que són pròpies del sistema de salut, fan possible el desenvolupament d’aplicacions de la intel·ligència artificial, que poden anar des de l’àmbit de la recerca a l’assistència primaria, passant per l’optimització de processos administratius. :::warning # Aplicacions de la IA a l'àmbit de la salut La capacitat de les aplicacions d'IA per processar dades i extreure'n coneixement ens ofereix un ampli ventall de possibilitats. A continuació, es destaquen alguns dels àmbits on les aplicacions d'IA poden ser útils: + **Recerca**: L'anàlisi de grans quantitats de dades pot facilitar la identificació de patrons i correlacions en les malalties, ajudant a la investigació mèdica i al desenvolupament de nous tractaments. + **Assistència Primària**: Les aplicacions d'IA poden ser utilitzades per a la detecció precoç de malalties, l'optimització dels protocols de tractament i la millora de la gestió dels pacients en els serveis d'atenció primària. + **Optimització de Processos Administratius**: Mitjançant l'ús d'IA, es poden automatitzar i optimitzar processos administratius com la programació de visites la gestió de les històries clíniques i la gestió d'inventaris, reduint la càrrega de treball i millorant l'eficiència dels serveis de salut. ::: ## Com es crea i gestiona coneixement amb la IA? La IA és una tecnologia habilitadora per la creació i gestió de coneixement en l'àmbit de la salut perquè ens permet millorar l'accés i l'anàlisi de la informació, ens permet descobrir detectar patrons i tendències, ens permet calcular les decisions òptimes i ens obre la porta a millorar els processos assistencials. Tal com hem vist en el primer mòdul d'aquest curs, la tecnologia de la IA s'ha materialitzat en quatre onades diferents que en l'actualitat s'apliquen al mateix temps. ### Com crea coneixement la IA Simbòlica? El desenvolupament d'un sistema com aquest seguiria els següents passos: + **Definició de Símbols**: El procés comença amb la definició de **símbols** que representen conceptes o objectes del món real per part d'un enginyer d'IA, en col·laboració amb experts en la matèria. Aquests símbols són els blocs bàsics de construcció amb els quals la IA simbòlica treballa, permetent-li representar dades i coneixements de manera abstracta. + **Definició de Regles**: El procés continua per la definiciño de **regles lògiques** que es poden expressar en funció dels símbols. Les regles lògiques es defineixen amb l'ajuda d'experts humans en el camp d'aplicació i es tradueixen a un llenguatge que l'ordinador pot entendre per part d'un enginyer d'IA. Aquestes regles dicten com els símbols poden interactuar o ser transformats, simulant el raonament lògic. Les regles poden incloure inferències, relacions causa-efecte, i processos de decisió basats en el coneixement previ. + **Construcció de Bases de Coneixement**: El conjunt de símbols i regles s'organitza en una **base de coneixement**. Aquesta base actua com un repositori d'informació sobre el domini específic, permetent a la IA accedir i manipular el coneixement de manera estructurada. + **Motor d'Inferència**: És un programa informàtic que combina les regles de la base de coneixement amb els símbols per realitzar raonaments i arribar a conclusions. El motor d'inferència és un programa que pot generar noves conclusions, realitzar prediccions o solucionar problemes aplicant seqüencialment les regles a les dades disponibles. + **Validació i Revisió**: Abans de fer servir el sistema en el món ral, els experts revisen les conclusions i prediccions que realitza el sistema per assegurar-se que són vàlides dins del context del domini d'aplicació. Aquest procés pot implicar ajustar les regles o afegir-ne de noves per millorar l'exactitud i la fiabilitat del sistema fins que els experts li donim el vist-i-plau. + **Desplegament i Ús**: Un cop el sistema ha estat validat, quan es presenten noves dades al sistema, les dades d'entrada són convertides en símbols que es poden processar amb les regles existents per arribar a conclusions sobre casos concrets. :::warning # Model Simbòlic Imaginem un sistema de IA simbòlica dissenyat per ajudar en el diagnòstic de condicions mèdiques basat en els símptomes dels pacients. Els símbols identificats per un enginyer d'IA amb l'ajuda dels especialistes podrien ser d'aquest tipus: + Símbols per a símptomes: ``febre alta``, ``mal de cap``, ``erupcions cutànies``, ``dolor muscular``, ``tos seca``, etc. + Símbols per a malalties: ``grip``, ``dengue``, ``zika``, ``COVID-19``, etc. Les regles serien d'aquest tipus: + ``Si un pacient té febre alta, mal de cap, dolor muscular, i tos seca, llavors podria tenir grip``. + ``Si un pacient presenta febre alta, mal de cap, erupcions cutànies, i dolor muscular, llavors podria ser dengue``. Finalment, emmagatzariem fets i regles en una base de coneixements: + Fet 1: ``Els pacients amb grip sovint experimenten febre``. + Fet 2: ``Els pacients amb al·lèrgies sovint tenen esternuts freqüents``. + Fet 3: ``Els pacients amb grip poden tenir dolors musculars``. + ... + Regla 1: ``Si un pacient té febre i dolors musculars, llavors és probable que tingui grip``. + Regla 2: ``Si un pacient té esternuts freqüents sense febre, llavors és probable que tingui al·lèrgies``. + ... Donat un cas concret representat per una sèrie de fets que representen les característiques i simptomes d'un pacient concret, el motor d'inferència executaria de forma automàtica els següents passos: 1. Afegiria el cas a la llista de fets de la base de coneixement com a fets addicionals. 2. Aplicaria les regles fins arribar a una conclusió que representi un diagnòstic pel pacient. ::: Mitjançant aquest procés, la IA simbòlica pot transformar dades i informació proporcionada per experts en un tema en coneixement estructurat i accionable que pot ser gestionat per un ordinador. A diferència de l'aprenentatge automàtic, que aprèn de grans volums de dades, la IA simbòlica crea coneixement a partir de la comprensió lògica i la manipulació de conceptes abstractes, oferint explicacions clares i raonades de les seves conclusions. Aquest enfocament és especialment útil en àrees on el raonament basat en regles és predominant o on són necessàries explicacions detallades del procés de decisió. :::warning # Ontologies Les **ontologies** són un exemple destacat de producte de la Intel·ligència Artificial Simbòlica. Són estructures de dades que representen coneixement conceptual i relacions entre els diferents elements d'un domini específic. Les ontologies són fonamentals per a la comprensió i el raonament en molts sistemes d'IA, especialment en aquells basats en el paradigma simbòlic. Aquí podeu trobar alguns aspectes rellevants sobre com les ontologies es relacionen amb la Intel·ligència Artificial Simbòlica: + Les ontologies serveixen com a mitjà per representar coneixement en forma de conceptes, relacions i restriccions. Aquesta representació facilita la comprensió i el raonament sobre el domini al qual pertanyen. + Les ontologies són utilitzades per a sistemes d'IA que es basen en raonament basat en regles. Aquest tipus de raonament implica la manipulació de símbols i l'aplicació de regles lògiques per arribar a conclusions. + Les ontologies també s'utilitzen en sistemes d'IA per millorar la recuperació de la informació. Proporcionen una estructura semàntica per organitzar i relacionar les dades, el que facilita la cerca i l'extracció d'informació rellevant. + Les ontologies faciliten la interoperabilitat semàntica entre diferents sistemes d'IA i aplicacions. Permeten estandarditzar la representació del coneixement i assegurar que diferents sistemes puguin entendre i intercanviar informació de manera coherent. ::: ### Com crea coneixement amb la IA Predictiva? La IA predictiva és un subconjunt de la intel·ligència artificial que s'enfoca en l'ús de models estadístics i d'aprenentatge automàtic per predir resultats futurs basats en dades històriques. La font d'informació que la IA predictiva usarà per generar coneixement no seran fets i regles extrets d'experts, sinó conjunts de dades corresponents a casos concrets que estan emmagatzemades en bases de dades convencionals. :::warning # Conjunt de dades Aquest exemple il·lustra un conjunt de dades mèdiques que podria ser utilitzat per construir un model predictiu que inferís si un pacient té o no una certa malaltia. El conjunt podria estar estructurat de la següent manera: ![Captura de pantalla 2024-03-27 a les 13.53.46](https://hackmd.io/_uploads/rywJD5WJC.png) Cada una de les files d'aquesta taula és un cas o **exemple**, cada una de les columnes (excepte la darrera) és una **característica** de l'exemple i la darrera columna és l'**etiqueta** de l'exemple. En la pràctica, els conjunts de dades mèdiques poden ser molt més grans i complexos, amb milers de pacients i una àmplia gamma de variables, incloent història mèdica, genètica, resultats de laboratori, imatges mèdiques, etc. ::: La creació de coneixement a partir de dades amb la IA predictiva implica diverses etapes per transformar les dades brutes en models computacionals accionables. + **Recollida del conjunt de Dades**: El primer pas és la recollida de dades brutes des de múltiples fonts, com ara sensors, registres en línia, bases de dades, entre d'altres. Aquestes dades poden ser estructurades (com ara taules de bases de dades) o no estructurades (com ara textos). + **Preprocessament i Neteja de Dades**: Les dades sovint contenen errors, valors perduts o inconsistències. El preprocessament inclou la neteja de dades, la normalització, la transformació, i la imputació de valors perduts, preparant les dades per a l'anàlisi. + **Anàlisi Exploratòria**: L'anàlisi exploratòria de dades (AED) utilitza estadístiques descriptives i eines de visualització per comprendre millor les dades, identificar patrons i anomalies, i formular hipòtesis. + **Modelat**: En aquesta etapa, s'utilitzen tècniques d'aprenentatge automàtic i estadístiques per construir models que puguin aprendre dels conjunts de dades. Això pot incloure classificació, regressió i agrupació. + **Entrenament i Validació**: Els models s'entrenen utilitzant conjunts de dades d'entrenament i després es validen o testen amb conjunts de dades separats. Això ajuda a avaluar la precisió del model i ajustar-lo per millorar el seu rendiment. + **Desplegament i Integració**: Una vegada el model és satisfactòriament entrenat i validat, es pot implementar en un entorn de producció on pot començar a fer prediccions o reconeixements sobre noves dades. Això pot incloure la integració amb sistemes existents o el desenvolupament de noves aplicacions. + **Retroalimentació i Aprenentatge Continu**: El coneixement generat pel model es pot utilitzar per prendre decisions. A més, la retroalimentació de l'ús real del model pot ajudar a identificar àrees de millora. L'aprenentatge continu, actualitzant el model amb noves dades i ajustant-lo segons la retroalimentació, és clau per mantenir la seva relevància i precisió. :::warning # El modelat La classificació, la regressió i l'agrupació són els tres tipus fonamentals de tasques en el camp de l'aprenentatge automàtic. La **classificació** és un tipus d'aprenentatge en el que l'objectiu és assignar una etiqueta o categoria a una observació basada en les seves característiques. En un problema de classificació, l'algoritme d'aprenentatge rep un conjunt de dades d'entrenament on cada observació està associada amb una etiqueta coneguda. L'algoritme apren a partir d'aquestes dades i crea un model que pot predir les etiquetes per a noves observacions. La detecció d'*spam* és un exemple de procés de classificació. La **regressió** també és un tipus d'aprenentatge, però en aquest cas, l'objectiu és predir un valor numèric o continu en lloc d'una categoria o etiqueta. En un problema de regressió, l'algoritme d'aprenentatge rep un conjunt de dades d'entrenament on cada observació està associada amb una o més variables independents i una variable dependent (o objectiu) que és una variable numèrica. L'algoritme crea un model que pot predir el valor de la variable dependent per a noves observacions. La predicció de la temperatura a Barcelona a 5 dies vista és un problema de regressió. L'**agrupació** és un tipus d'aprenentatge on l'objectiu és agrupar de forma automàtica les observacions en subconjunts basats en la seva similitud. En un problema d'agrupació l'algoritme d'aprenentatge no rep cap informació sobre les etiquetes o els valors de sortida; en lloc d'això, agrupa les observacions basant-se en les seves característiques. L'algoritme busca agrupar les observacions de manera que les observacions dins del mateix grup siguin més similars entre si que amb les d'altres grups. L'anàlisi de gens en biologia molecular fa un ús intensiu dels mètodes d'agrupació. Aquests mètodes són clau per comprendre les relacions i els patrons entre les seqüències genètiques, i per identificar grups de gens amb comportaments similars o funcionalitats compartides. ::: L'element crític d'aquest tipus d'IA són les tècniques d'aprenentatge automàtic que usem durant l'etapa de modelat per "aprendre" de les dades i representar el coneixement que en podem extreure. De moment deixem obert aquest punt, que recuperarem en apartats d'aquest curs més endavant. ### Aprenentatge Profund La IA predictiva mostra un rendiment particularment bó amb dades tabulars com les que hem vist al punt anterior, però te un rendiment moderat o dolent quan les característiques de les nostres dades són valors de píxels (que representen el contingut d'una imatge) o identificadors de paraules (que representen el contingut d'un text). Els passos que hem de seguir per crear coneixement en el cas de l'aprenentatge profund és pràcticament el mateix que per la IA predictiva, amb dues petites diferències: + La **quantatitat de dades** necessaries per entrenar un model d'aprenentatge profund sol ser molt més gran que pels models d'IA predictiva. Si volem classificar una raiografia de torax o determinar si una cèl·lula és maligna a partir de les seves imatges, cal que disposem de molts milers o milions de casos. + Les models que entrenarem per realitzar tasques de classificació, regressió o agrupació seran exclusivament **xarxes neuronals**. Aquest tipus de models s'han mostrat especialment bons per representar el coneixement relacionat amb les imatges, els videos i altra informació no estructurada (text). ### IA Generativa El terme "IA generativa" descriu una categoria de sistemes d'IA que no estan tant orientat a "predir" el valor d'una sortida (p.e. una malaltia) a partir d'una entrada (p.e. els símptomes d'una pacient) com a crear "contingut" a partir d'interaccions amb un usuari en llenguatge natural. Les aplicacions d'IA generativa tenen com **entrada** algun tipus de pregunta en forma de llenguatge natural i generen **sortides** en diversos formats, com ara llenguatge natural, imatges o codi. :::warning # Generació de contingut amb IA generativa Per oferir recomanacions dietètiques per a algú que gestiona la hipertensió, es podria fer una consulta a una eina d'IA generativa simplement entrant el text següent: `` > Oferiu tres àpats aptes per a la hipertensió que incorporin pebrots``. Una eina d'IA generativa centrada en la salut podria generar directament una sortida com aquesta: `` > Sens dubte, aquí teniu tres àpats que incorporen pebrots, adaptats per al control de la hipertensió: (a) Truita de pebrots i espinacs: comenceu saltejant els pebrots picats en una paella antiadherent amb un mínim d'oli, assegurant-vos que conserven els seus nutrients i siguin baixos en sodi. Afegiu espinacs frescos per augmentar el ferro. Serviu aquesta truita amb un costat de rodanxes d'alvocat riques en potassi per ajudar a controlar els nivells de pressió arterial. (b) Pebrots farcits de quinoa: prepareu una barreja de quinoa cuita, mongetes negres baixes en sodi, blat de moro i una mica d'espècies baixes en sodi. Ompliu aquesta barreja en pebrots morrons a la meitat i coure. La quinoa és rica en magnesi i potassi, essencials per a la regulació de la pressió arterial, fent que aquest àpat sigui nutritiu i satisfactori. (c) Amanida de pebrots a la planxa amb vinagreta de llimona: talleu els pebrots a rodanxes i feu-los a la planxa lleugerament per millorar la seva dolçor i conservar el seu contingut nutricional. Aboqueu-los en una amanida amb verdures de fulla verda, tomàquets cherry i una vinagreta de llimona casolana (suc de llimona, oli d'oliva i un toc d'all). Aquesta amanida és baixa en sodi i alta en antioxidants, ajudant a controlar la hipertensió.`` Si el que vulguéssim és generar una imatge que ens serveixi per il·lustrar aluna comunicació, podriem demanar-ho així: `` > Crea una imatge d'un metge atenent a un infant. Estil còmic.`` El que obtindriem seria una imatge d'aquest estil: ![0f165a7d-86e5-432d-927d-fcbce5684a86 còpia](https://hackmd.io/_uploads/HkeTACWJR.jpg) ::: La tecnologia que hi ha darrera de la IA generativa s'anomena "grans models de llenguatge" (LLM, *Large Language Models* en anglès), que són un tipus especialitzat de model d'aprenentatge automàtic basats en grans xarxes neuronals. Tot i que els models matemàtics en que es basen els LLM poden ser complexos, una comprensió bàsica de l'arquitectura utilitzada per implementar-los us pot ajudar a obtenir una comprensió conceptual de com funcionen. # IA Predictiva: dades, estratègia d'aprenentatge i models. En el context de la intel·ligència artificial predictiva, un **model** es refereix a una model computacional que ha estat entrenat a partir de conjunts de **dades** mitjançat un **algorisme d'aprenentatge automàtic** per realitzar una certa tasca. És per tant, el principal resultat del desenvolupament d'un sistema d'IA. La seva eficàcia i fiabilitat depenen de diversos factors, com la qualitat de les dades d'entrenament, la selecció d'algorismes adequats per crear-los, i el mateniment adequat durant el seu cicle de vida. ::: warning # Com m'he d'imaginar un model i el seu aprenentatge? Imaginar un model d'intel·ligència artificial pot ser una tasca abstracta, però intentem fer-ho més tangible amb una analogia i més endavant descriurem el funcionament bàsic d'alguns models en termes més tècnics. Suposem una orquestra (el model) que vol aprendre a interpretar una nova simfonia que no ha practicat mai (l'entrada). El director d'orquesta (l'algorisme d'aprenentatge) té l'experiència de moltes altres obres musicals anteriors (dades d'entrenament) i utilitza aquest coneixement per guiar l'orquestra. Inicialment, el director fa servir la seva intuïció basada en obres similars per donar instruccions a l'orquestra sobre com tocar la nova simfonia (inicialització del model). A mesura que comencen a assajar (entrenament), el director escolta (avalua el rendiment del model) i ajusta les seves instruccions sobre dinàmica, tempo i expressió (ajust de paràmetres) per millorar la interpretació (el resultat del model). Amb el temps, i després de molts assajos (iteracions d'entrenament), l'orquestra i el director aprenen conjuntament com interpretar la simfonia de la manera més fidel possible al que creuen que va ser la intenció del compositor (optimització). Finalment, quan es troben amb una part de la simfonia que no havien vist abans (dades no vistes), el director és capaç d'utilitzar el que han après per guiar l'orquestra en la interpretació correcta d'aquesta nova secció (generalització i predicció). ::: Donat que l'eficàcia i fiabilitat dels models és determinant a l'hora d'avaluar l'ús d'aquesta tecnologia, cal entendre aquesta relació de forma detallada, i més concretament: + Quin és el paper i la importància de les dades que farem servir per entrenar els models. + Quina estratègia d'aprenentatge fa servir la IA predictiva i quins són els seus límits? + Quin és el cicle de vida d’un sistema d’IA? Amb tot això podrem avaluar de forma informada quin tipus de preguntes pot contestar la IA en el sector de la salut. ## Sobre les dades Les dades són el punt de partida i la base sobre la qual es construeixen els models d'IA predictiva i per tant hi ha una relació molt estreta entre les dades i el resultat d'un sistema d'IA. Aaquest fet s'il·lustra amb l'anomenat principi del "*garbage in, garbage out*", que es pot traduir com "*escombraries d'entrada, escombraries de sortida"*. Aquest principi subratlla la importància de la qualitat de les dades d'entrenament d'un model en la generació de resultats fiables i útils. En altres paraules, si l'informació que s'alimenta a un sistema d'IA és incorrecta, irrellevant o plena d'errors, els resultats produïts per aquest sistema també seran defectuosos o de poca utilitat. ::: warning # Com construir un conjunt de dades? Suposem que la tasca que volem resoldre és la **detecció de melanomes** utilitzant intel·ligència artificial. Un conjunt de dades d'entrenament ideal contindria imatges dermatoscòpiques (fotografies de alta resolució preses amb un dermatoscopi) de lesions cutànies, amb una varietat d'exemples que incloguin: + Melanoma: Imatges de lesions diagnosticades com melanomes. Aquestes imatges mostren característiques típiques del melanoma, com ara asimetria, límits irregulars, canvis de color, diàmetre superior a 6mm, i evolució en el temps. + Benignes: Imatges de lesions que han estat diagnòstiques com a benignes, incloent nevus (pigues) i altres lesions cutànies no canceroses. Cada imatge ha d'anar acompanyada d'una etiqueta que indica si la lesió és un melanoma o una lesió benigna, basant-se en el diagnòstic d'un dermatòleg o en la confirmació histopatològica (biòpsia). També podem incloure la localització de la lesió en el cos, l'edat i el sexe del pacient, i qualsevol història clínica rellevant que pugui afectar l'aparença de les lesions cutànies. Idealment, el conjunt de dades ha d'estar balancejat entre imatges de melanomes i lesions benignes per evitar biaixos en l'entrenament del model. Les imatges han de representar una àmplia gamma de tipus de pell, des de molt clara a molt fosca, per assegurar que el model sigui efectiu en diverses poblacions i una àmplia gamma d'edats i proporcions equilibrades de sexe masculí i femení. Un conjunt de dades com aquest requeriria un procés rigorós de recollida i etiquetatge, així com l'aprovació ètica per a l'ús de les imatges i dades dels pacients. La qualitat i diversitat d'aquestes dades són clau per desenvolupar un model d'IA que sigui precís, fiable i just, capaç de detectar melanomes en estàdis inicials i contribuir significativament al diagnòstic precoç i el tractament del càncer de pell. ::: Durant el procés d'entrenament, el model aprèn a identificar patrons i a fer prediccions o decisions basades en les dades que rep. Si aquestes dades d'entrenament estan biaixades, incompletes o corruptes, el model aprendrà a partir d'aquestes deficiències i replicarà els mateixos errors o biaixos en les seves prediccions o decisions. :::warning # IA i decisions biaixades per culpa de les dades Un exemple notable de decisions biaixades en el camp de la salut provocades per la intel·ligència artificial es va trobar en un algorisme utilitzat als Estats Units per gestionar els cures de pacients amb malalties cròniques. Aquest algorisme estava dissenyat per identificar pacients que necessitaven programes de cures de salut addicionals, basant-se en el risc de complicacions futures o la necessitat de tractaments més intensius. El biaix va sorgir de la dependència de l'algorisme en els costos de la cura com a indicador de necessitat de cura addicional, assumint que els costos més alts correlacionaven amb una major necessitat de cures mèdiques. Aquest enfocament va resultar en una subrepresentació significativa de pacients afroamericans en els programes de cures intensives, ja que, històricament, aquests pacients havien generat costos més baixos no per menys necessitat de cura, sinó per barreres d'accés a la cura, incloent factors socioeconòmics i discriminació sistèmica. Això va significar que, malgrat tenir les mateixes condicions i necessitats mèdiques que els pacients blancs, els pacients afroamericans eren menys propensos a ser identificats per l'algorisme per a programes de cures addicionals. Aquest cas va posar de manifest com els biaixos en les dades d'entrenament (en aquest cas, la correlació incorrecta entre costos de cura i necessitats de cura) poden conduir a decisions biaixades i injustes quan són implementades per algorismes d'IA. Va ressaltar també la importància de revisar críticament i ajustar els algorismes d'IA per assegurar que les decisions basades en aquests sistemes siguin justes i equitatives, especialment en àmbits tan crítics com el de la salut. ::: En general, per entrenar un sistema d'intel·ligència artificial eficaçment, les dades han de complir amb certes propietats o característiques. Aquestes propietats asseguren que el model d'IA pugui aprendre de manera òptima, generalitzar bé a noves dades, i funcionar de manera fiable en entorns del món real. Algunes de les propietats més importants són: 1. Les dades han de ser de bona **qualitat**, cosa que implica que siguin precisas, completes, i actuals. Les dades inaccurades o desfasades poden portar a conclusions errònies, mentre que les dades incompletes poden limitar la capacitat de l'algorisme d'aprendre patrons complexos. 2. Les dades han de ser **representatives** de la població o fenòmens que el sistema està dissenyat per modelar. Això significa que han d'incloure una àmplia varietat d'exemples, incloent casos atípics o rars, per assegurar que l'algorisme pot funcionar bé en tot el rang d'escenaris possibles. 3. Relacionat amb la representativitat, les dades han de ser **diverses** i incloure exemples de totes les variants i condicions sota les quals es preveu que el sistema operi. Això és crucial per evitar biaixos i assegurar que l'algorisme sigui just i equitatiu. 4. Les dades han de tenir el **nivell adequat de detall i granularitat**. Això significa que han d'incloure tota la informació necessària per a l'aprenentatge, sense ser excessivament detallades al punt que introdueixin soroll o informació irrelevant que pugui confondre el model. 5. La **consistència** en les dades és clau per a l'entrenament d'algorismes. Això implica que les dades recollides de diferents fonts o en moments diferents han de seguir el mateix format i criteris, facilitant l'aprenentatge i la comparació. 6. En contextos on les dades són sensibles, com en el camp de la salut, les dades han de ser **anonimitzades** o desidentificades per protegir la privacitat dels individus. Això ha de fer-se sense comprometre la utilitat de les dades per a l'entrenament. ## Quines estratègies d'aprenentatge usa la IA predictiva? El procés d'aprenentatge automàtic es basa en els conceptes bàsics següents: * Models i paràmetres * Entrenament * Avaluació Donada una tasca i unes dades, el primer pas en el procés d'aprenentatge és decidir quin **tipus de model** farem servir, que és una representació matemàtica o estadística (que depen d'uns certs paràmetres) que busca aprendre els patrons i les relacions entre les característiques d'entrada i les seves etiquetes o sortides corresponents. :::warning # El model més simple Un model lineal és un tipus de model en l'aprenentatge automàtic que assumeix una relació lineal entre les característiques d'entrada i la sortida. Aquest model s'utilitza principalment per a problemes de regressió, on l'objectiu és predir un valor numèric continu basat en les característiques d'entrada, tot assumint que la relació entre les variables és lineal. La forma més senzilla d'un model lineal és una regressió lineal, on la relació entre les característiques d'entrada $x$ i la sortida $y$ s'expressa com una combinació lineal de les característiques: $$ y = w_0 + w_1 x_1 + w_2 x_2 + \dots w_n x_n$$ On $y$ és la sortida, $x_1, x_2, \dots x_n$ són les característiques, $w_1, w_2, \dots w_n$ són els paràmetres del model (coneguts com a pesos) i $n$ és el nombre de característiques. Suposem que tenim un conjunt de dades que conté informació sobre les característiques $x$ de diversos pacients diabètics i els seus nivells de glucosa en sang $y$. Les característiques podrien incloure factors com el pes, l'alçada, l'edat, l'índex de massa corporal (IMC), els nivells de colesterol, els antecedents familiars de diabetis, entre d'altres. Suposem també que l'objectiu és construir un model que permeti predir els nivells de glucosa en sang d'un pacient donades les seves característiques. En aquest cas, un model lineal podria ser útil perquè assumeix una relació lineal entre les característiques del pacient i els seus nivells de glucosa en sang. Podem ajustar un model lineal utilitzant les dades d'entrenament, on les característiques del pacient (com el pes, l'alçada, l'edat, etc.) són les variables independents i els nivells de glucosa en sang són la variable dependent. Una vegada ajustat el model, podem utilitzar-lo per fer prediccions sobre els nivells de glucosa en sang de nous pacients amb característiques conegudes. Aquest és només un exemple d'aplicació on un model lineal podria ser útil en el camp de la salut, ja que la relació entre les característiques del pacient i els nivells de glucosa en sang pot ser aproximada amb una relació lineal en certes situacions. ::: Per fer una bona predicció cal que el model tingui els paràmetres adequats. La cerca d'aquests paràmetres es fa amb l'ajuda del conjunt de dades i constitueix el proces d'**entrenament** del model. En termes generals, el procés d'aprenentatge segueix els següents passos: + **Inicialització dels paràmetres**: En aquest pas, s'inicialitzen els paràmetres del model a un valor qualsevol. Això pot incloure els pesos de les connexions en una xarxa neuronal, els coeficients en un model lineal, o qualsevol altre paràmetre que necessiti ser ajustat durant l'entrenament. + A continuació es fa un **primer pas d'entrenament**. Això implica calcular les prediccions del model per a les dades d'entrenament i utilitzar-les per actualitzar els paràmetres del model. Evidentment, les prediccions fetes per un model amb uns paràmetres inicialitzats a un valor qualsevol seran molt dolentes i el que farem és mesurar aquest error. Llavors, mitjançant una tècnica matemàtica anomemanda optimització el que farem és modificar els valors tots i cada un dels paràmetres de manera que si tornem a calular l'error sobre el conjunt d'aprenentatge amb aquests nous valors l'error serà una mica inferior. + **Iteració sobre les dades d'entrenament**: Desgraciadament, els algorismes d'optimització només ens asseguren que si canviem els paràmetres en la direcció que ells indiquen, l'error sobre el conjunt d'aprenentatge amb aquests nous valors l'error serà una mica inferior, però no ens asseguren que no es pugui millorar encara més. Per això, el procés d'aprenentatge itera sobre les dades d'entrenament durant un nombre fix de vegades, modificant lleugerament els valors dels paràmetres cada vegada, fins que es compleixi un criteri de parada. El conjunt de dades es divideix habitualment al principi del procés en dos subconjunts: entrenament (que sol contenir el 80% de les dades) i prova (amb el 20% restant). El conjunt d'entrenament s'utilitza per ajustar els paràmetres del model i el de prova per **avaluar** el rendiment del model entrenat en dades no vistes. Això pot implicar calcular diverses mètriques d'avaluació com l'exactitud, la precisió, la sensibilitat, l'especificitat, etc. Si l'avaluació compleix els requeriments de la tasca que volem resoldre ja estem preparats per usar el model! :::warning # Exemple de model predictiu: readmissions hospitalàries Un exemple actual destacat de l'ús de la IA en el camp de la salut és l'anàlisi predictiva per a la prevenció de readmissions hospitalàries. Aquesta aplicació utilitza models d'aprenentatge automàtic per analitzar grans conjunts de dades de pacients, incloent històries clíniques, notes d'alta, resultats de laboratori i altres registres. L'objectiu és predir quins pacients tenen un risc més alt de ser readmesos a l'hospital després de rebre l'alta. Els passos que s'han de seguir per desenvolupar un sistema robust són: + Recopilació de Dades: Es recullen dades detallades dels pacients, incloent informació demogràfica, diagnòstics, tractaments administrats, durada de l'estada hospitalària, i més. + Preprocessament de Dades: Les dades són netejades i preprocessades per tractar valors perduts, eliminar outliers, i normalitzar les dades, entre altres tasques de preprocessament. + Extracció de Característiques: Es determinen quines variables o característiques són més predictives per la readmissió dels pacients. Això pot incloure factors com la presència de malalties cròniques, la quantitat de visites prèvies a l'hospital, o els resultats de certes proves de laboratori. + Modelat Predictiu: S'utilitzen algorismes d'aprenentatge automàtic, com ara arbres de decisió, boscos aleatoris o models de regressió, per construir models que puguin predir la probabilitat de readmissió. + Validació i Implementació del Model: El model es valida utilitzant un conjunt de dades de prova per assegurar-se que les prediccions són precises i fiables. Un cop validat, el model es pot implementar com a eina de suport a la presa de decisions clíniques. ::: ### Quins són els tipus de models més usats? Els tipus de models més utilitzats en intel·ligència artificial predictiva varien segons el tipus de problema i les característiques de les dades, però els més popular són: + **Regressió lineal**: És utilitzada per predir valors numèrics continuus. Assumeix una relació lineal entre les característiques d'entrada i la sortida. + **Regresió logística**: És utilitzada per problemes de classificació binària, on l'objectiu és predir una categoria que té dues possibilitats. S'utilitza principalment per a problemes de classificació on la sortida és discreta. + **Els $k$ veïns més propers**: L'algorisme del veí més proper consisteix en predir el valor d'un nou cas basant-se en la seva proximitat a les dades del conjunt d'entrenament. + **Arbres de decisió**: És utilitzada per a problemes de classificació i regressió. Divideix l'espai de les característiques en subespais més petits i més manejables per prendre decisions. + **Boscos aleatoris** (*Random Forests* en anglès): És un conjunt d'arbres de decisió. Es fa servir per a problemes de classificació i regressió per millorar la precisió i reduir el sobreajustament. + **Xarxes neuronals**: S'utilitzen per a problemes de classificació i regressió. Són models molt potents que poden capturar patrons complexos en dades no lineals. :::warning # L'algorisme dels $k$ veïns més propers Suposem que volem predir si una fruita és una poma o una taronja basant-nos en el seu color i diàmetre. Tenim un conjunt de dades d'entrenament que conté el color i el diàmetre de diverses pomes i taronges, juntament amb la seva categoria corresponent. Imaginem que tenim les següents dades d'entrenament: ![Captura de pantalla 2024-03-28 a les 13.52.42](https://hackmd.io/_uploads/H1H4OJmJC.png) Ara, volem predir la categoria d'una nova fruita amb un color vermell i un diàmetre de 3,4. Utilitzant l'algorisme del veí més proper amb $k = 1$ (un sol veí més proper), busquem la fruita més propera a aquesta nova observació. Calculant la distància euclidiana entre la nova observació i les dades d'entrenament, trobem que el cas més semblant és la segona observació ( mateix color, diferència de diàmetre de 0,2). Per tant, predim que la nova observació és una poma. Si utilitzéssim $k = 3$, hauríem de buscar els tres veïns més propers. En aquest cas, veiem que dos dels veïns més propers són pomes, mentre que només un és una taronja. Per tant, predim que la nova observació és una poma, ja que la majoria dels seus veïns més propers són pomes. Això és un exemple simplificat de com funciona l'algorisme del veí més proper en una tasca de classificació. ::: :::warning # Els arbres de decisió com a model Suposem que volem fer un model que reconegui girafes, tigres, mones i elefants basant-se en el seu color i alçada. ![image](https://hackmd.io/_uploads/Sy0lkqZkA.png) ::: Un model ben entrenat és capaç de fer prediccions accurades, classificar dades noves, o realitzar la tasca per a la qual va ser dissenyat amb un alt grau d'eficàcia en dades no vistes prèviament. ## Anàlisi d'un cas d'ús: la detecció de melanoma La Intel·ligència Artificial (IA) s'ha convertit en una eina prometedora en el camp de la dermatologia, ja que pot millorar el diagnòstic, el tractament i la gestió de les malalties de la pell. Les seves aplicacions en en aquest camp són múltiples: + Diagnòstic de lesions cutànies: Les aplicacions d'IA poden utilitzar xarxes neuronals profundes per analitzar imatges de lesions cutànies. Mitjançant l'aprenentatge automàtic, aquestes xarxes poden identificar i classificar diferents tipus de taques, taques de la pell, tumors o altres anomalies. Un exemple és l'ús d'una aplicació de telèfon mòbil que permet als pacients capturar imatges de lesions i rebre una avaluació preliminar sobre si podrien ser malignes o no. + Detecció de càncer de pell: Les IA poden ser entrenades per identificar signes de càncer de pell, com el melanoma. Poden analitzar les imatges de lesions cutànies a través de la dermatoscòpia digital i comparar-les amb una base de dades de casos anteriors per determinar la probabilitat de malignitat. Això pot ajudar als dermatòlegs a prendre decisions més informades sobre biòpsies i tractaments. + Predicció de resposta als tractaments: La IA també pot ser utilitzada per predir la resposta d'un pacient a determinats tractaments dermatològics. Mitjançant l'anàlisi de dades clíniques i genètiques, juntament amb l'ús de models d'IA, els metges poden obtenir orientació sobre quin tractament pot ser més eficaç per a un pacient específic, minimitzant així els efectes secundaris i els errors de prescripció. + Seguiment de canvis en la pell: Les aplicacions d'IA poden ajudar a monitorar i registrar canvis en les taques de la pell d'un pacient al llarg del temps. Això permet un seguiment més precís de les anomalies i ajuda en la detecció precoç de possibles problemes. + Assistent virtual per a dermatòlegs: Les IA també poden ser utilitzades com a assistents virtuals per als dermatòlegs. Poden proporcionar informació clínica actualitzada, suggerir diagnòstics possibles i ajudar amb la prescripció de tractaments, estalviant temps als professionals mèdics. :::success ![melanoma-903655-1024](https://hackmd.io/_uploads/Hy11M5bJC.jpg) **Figura**: ::: El desenvolupament d'un sistema seguiria aquests passos: + Recopilació de dades: El primer pas és recopilar una gran quantitat d'imatges de lesions cutànies amb diversitat de diagnòstics. Aquestes imatges s'han d'etiquetar correctament per al diagnòstic real de cada lesió. A més de les imatges, també pots recopilar dades clíniques associades, com ara l'edat del pacient, el sexe, l'històric mèdic i altres factors relevants. + Preprocessament d'imatges: Les imatges recopilades es sotmeten a un preprocessament per millorar-ne la qualitat i reduir el soroll. Això pot incloure l'escalat, la normalització i altres tècniques de millora d'imatges. + Entrenament del model d'IA: Un cop es té una base de dades adequada, es pot procedir a entrenar el model d'IA. Normalment, s'utilitzen xarxes neuronals profundes (Deep Learning), com ara les xarxes neurals convolucionals (CNN), que són aptes per a la visió per computadora. El model s'entrena amb les imatges i les seves etiquetes corresponents per aprendre a reconèixer patrons i característiques importants per al diagnòstic. + Validació i ajust del model: Després de l'entrenament, es realitza una validació utilitzant un conjunt de dades diferent de l'entrenament per avaluar la precisió del model. Si és necessari, es realitza un ajust del model per millorar-ne el rendiment. + Desenvolupament de l'aplicació: Una vegada s'ha creat el model d'IA, es desenvolupa una aplicació o interfície que permet als usuaris, com ara dermatòlegs o pacients, carregar imatges de lesions cutànies. L'aplicació envia les imatges al model i mostra el diagnòstic o les recomanacions basades en les prediccions del model. + Avaluació clínica: És important realitzar proves clíniques per avaluar l'eficàcia i la seguretat del sistema d'IA en un entorn clínic real. Aquestes proves ajuden a determinar com es comporta el sistema amb pacients reals i professionals de la salut. + Millora contínua: Un sistema d'IA per diagnosticar lesions cutànies ha de ser sotmès a una millora contínua. Això implica actualitzar el model amb dades més recents, afegir nous diagnòstics o característiques i ajustar el sistema segons les retroalimentacions dels professionals de la salut. + Consideracions ètiques i de privadesa: És fonamental tenir en compte les consideracions ètiques i de privadesa en la recopilació i l'ús de dades dels pacients. S'ha de vetllar per la protecció de les dades personals i la confidencialitat de la informació. Exemples reals d'aquesta tecnologia: + DermaAssist de Google https://health.google/consumers/dermassist/ Entrenat amb milions d'imatges de pell, DermAssist pot identificar més del 90 per cent de les afeccions de la pell més buscades, i la investigació demostra que la tecnologia subjacent pot ajudar els metges a identificar millor les condicions de la pell a totes les poblacions. Matemàticament és molt simple: el perceptró realitza una suma ponderada de les seves entrades numèriques per produir una sortida binària. La sortida es calcula passant aquesta suma ponderada a través d'una funció d'activació, com ara la funció escaló, que converteix el resultat en una sortida binària. > Gràfic amb un perceptró ![res](https://hackmd.io/_uploads/S15K3XgJA.jpg) Tot i que la capacitat de càlcul, i consequentement d'anàlisi de la informació, d'un perceptró és molt limitada, des del seu desenvolupament inicial per Rosenblatt, el perceptró va generar un gran entusiasme com a possible manera d'imitar el procés de pensament humà. Els experiments inicials amb el perceptró van demostrar la seva capacitat per aprendre i reconèixer patrons simples, alimentant les esperances que les màquines podrien eventualment adquirir intel·ligència comparable a la humana. El perceptró va experimentar un renaixement a la dècada de 1980 quan es van introduir les xarxes de perceptrons múltiples capes o xarxes neuronals profundes. Aquestes xarxes, equipades amb tècniques com l'algoritme de retropropagació, podien aprendre a partir de dades i solucionar problemes que eren inabordables per a perceptrons simples, però tot i això estàven lluny de els aplicacions reals. :::warning ### Com funciona una xarxa neuronal? ![Captura de pantalla 2024-03-26 a les 12.05.57](https://hackmd.io/_uploads/B1KT2QxkR.png) ... ::: ## Quin és el cicle de vida d’un sistema d’IA? Quin tipus de preguntes pot contestar la IA en el sector de la salut? Quins processos pot millorar? i. Sistemes predictius. ii. Interfases naturals: xatbots, transcripcions de veus, etc. iii. Optimització de processos (productivitat, eficiència, costos, etc.). ## Quin tipus de preguntes pot contestar la IA en el sector de la salut? Entre els usos més destacats podem citar els següents: 1. **Descripció i exploració de grans volums de dades multimodals**. Aquest tipus de dades inclou des d'imatges mèdiques fins a registres electrònics de pacients, passant per resultats de laboratori i dades genòmiques. A través de la IA es pot fusionar i analitzar aquesta informació complexa per obtenir descripcions detallades que abans eren inaccessibles. 2. **Medicina de precisió**. La medicina de precisió, que busca adaptar els tractaments i les intervencions a les característiques individuals de cada pacient, s'alimenta de la capacitat de l'IA d'analitzar grans volums de dades complexes per identificar patrons, prediccions i tractaments personalitzats. Una de les aplicacions principals de la IA en aquest àmbit és l'anàlisi de dades genòmiques. Mitjançant tècniques d'aprenentatge automàtic, la IA pot processar i interpretar seqüències de ADN a una gran velocitat i amb una gran precisió. Això permet als investigadors i metges identificar variants genètiques associades amb determinades condicions de salut, predisposicions a malalties, i respostes a medicaments. Com a resultat, els pacients poden rebre tractaments que són molt més efectius i amb menys efectes secundaris, ja que estan dissenyats per a les seves configuracions genètiques. 3. **Descobriment de fàrmacs i tractaments**. L'IA pot analitzar ràpidament milions de compostos per determinar quins tenen més probabilitats de ser efectius contra determinades malalties. Aquest procés, conegut com a screening virtual, pot predir l'activitat biològica de molècules encara no sintetitzades, estalviant temps i recursos en els primers estadis de la recerca. La IA també facilita la identificació de biomarcadors que poden indicar la presència d'una malaltia o la resposta d'un pacient a un tractament específic. Aquesta informació és crucial per al desenvolupament de tractaments personalitzats i per a l'estratificació de pacients en assajos clínics, assegurant que els fàrmacs es testen en les poblacions que més probablement se'n beneficiaran. 3. **Diagnòstic**. Una de les àrees on l'impacte de la IA és més notable és en el diagnòstic d'imatges, on algoritmes d'aprenentatge profund són capaços d'analitzar radiografies, escàners CT, imatges per ressonància magnètica (MRI), etc., identificant patrons que poden ser difícils de percebre per l'ull humà. Això inclou la detecció de càncers, com el de mama o de pulmó, on la precisió pot salvar vides a través d'un diagnòstic i tractament més precoç. 4. **Predicció**: Els models predictius s'apliquen en una àmplia gamma d'àrees dins de la salut. En pacients amb malalties cròniques, com ara l'asma o la malaltia pulmonar obstructiva crònica (EPOC), els models predictius poden anticipar episodis aguts o exacerbacions, permetent intervencions preventives. Altres models estan dissenyats per predir quins pacients es beneficiarien més de determinades intervencions, com la fisioteràpia o la cirurgia, ajudant a reduir l'ús innecessari de procediments costosos o de risc. 5. **Suport a la presa de decisions**. En la gestió de la salut poblacional, la IA ajuda a identificar patrons i tendències dins de grans conjunts de dades poblacionals, permetent als planificadors de la salut i als responsables de polítiques desenvolupar estratègies més efectives per a la prevenció de malalties i la promoció de la salut a gran escala. 6. **Accés a la informació**. L'IA pot ajudar a filtrar i organitzar enormes quantitats de dades mèdiques disponibles en línia, facilitant als usuaris trobar informació rellevant ràpidament. Mitjançant l'ús d'algoritmes d'aprenentatge automàtic, els sistemes poden aprendre de les interaccions dels usuaris per millorar la precisió de les cerques futures, assegurant que la informació més útil sigui més accessible. 7. **Assistents virtuals**. Els assistents virtuals alimentats per IA poden proporcionar respostes en temps real a preguntes sobre salut, guiant els pacients a través de símptomes o ajudant-los a comprendre millor les seves condicions mèdiques. Aquests sistemes poden servir de suport a les tasques del personal mèdic, permetent-los dedicar més temps a tasques que requereixen la seva expertesa. 8. **Robòtica assistencial**. Els robots assistencials amb IA seran capaços de realitzar una varietat de tasques domèstiques, com netejar, cuinar o fins i tot ajudar a gestionar la medicació. Això permet als usuaris mantenir una certa independència, millorant la seva qualitat de vida i alliberant temps per a que cuidadors humans puguin concentrar-se en necessitats més personals i emocionals dels cuidats. També podran monitoritzar constants vitals, com la pressió arterial, freqüència cardíaca, nivells d'oxigen en sang i més, proporcionant dades valuoses en temps real als professionals de la salut. Aquesta monitorització contínua permet una detecció precoç de possibles problemes de salut, facilitant intervencions ràpides i preventives. Per últim, oferiran eines innovadores per a la rehabilitació, com ara exoesquelets i robots de teràpia física, que assistiran als usuaris en la realització d'exercicis terapèutics i en la millora de la mobilitat. ## Quins límits té la IA basada en dades? ### Límits de la IA predictiva. * Aparença d’objectivitat * Biaixos. * Dades observades vs dades experiments. Causalitat. * Incertesa en les prediccions/models: * [Clinical AI tools must convey predictive uncertainty for each individual patient https://www-nature-com.sire.ub.edu/articles/s41591-023-02562-7](https://www-nature-com.sire.ub.edu/articles/s41591-023-02562-7) * Apunts DL ### Límits de la IA generativa. ### Principis que han de regir el seu desenvolupament ![image](https://hackmd.io/_uploads/B1sxGTbJR.png) Casos d'èxit. Exemples i eines concretes. FDA: https://medicalfuturist.com/the-current-state-of-521-fda-approved-ai-based-medical-devices/ Aplicacions salut GenAI: https://www.nature.com/articles/s41591-023-02700-1