# Miikan osio
Lähteenä: ProM online-kurssin osio "Data Science in Action"
- Tämän päivän haasteena ei ole luoda uutta dataa. Haaste on löytää tärkeimmät asiat suuresta määrästä dataa.
- Big datan neljä V:tä (Volume = datan suuruus, Velocity = muutosnopeus, Variety = erilaiset tietolähteet ja Veracity = Tietojen epävarmuus).
- Prosessilouhinta on datatiedettä toiminnassa. Prosessilouhinnalla pyritään ymmärtämään koneista ja bisnesmalleista saadulla datalla mitä ne tekevät. Sen datan perusteella pystytään sitten miettimään, kuinka niitä pystyttäisiin parantamaan.
Soforin webinaari "Prosessilouhinta prosessien automatisoinnin tukena"
- Prosessilouhinta yhdistää suoraan tietolähteeseesi ja muuntaa raa'an datan intuitiivisiksi prosessikaavioiksi ja kojelaudoiksi, jotka auttavat sinua löytämään, automatisoimaan ja seuraamaan prosessejasi jatkuvasti.
- Prosessilouhintaa voidaan käyttää hyödyksi etsimällä tiettyä dataa monesta järjestelmästä kerralla. Prosessilouhintaa ei tarvitse rajata vain yhdelle järjestelmälle kerrallaan.
- Prosessilouhinnalla pyritään löytämään prosessien heikot kohdat ja parantamaan niitä.
- Prosessilouhintaa ei voida suorittaa, jos tarvittavaa dataa ei ole saatavilla/riittävästi.
- Prosessilouhinnan markkinajohtajia tällä hetkellä sellaisia yrityksiä kuin UiPath, Celonis ja Software AG.
- Prosessilouhintaa voidaan hajauttaa maakohtaisesti tarkasteltavaksi, jos yrityksellä on toimipisteitä ympäri maailmaa.
Lähteenä: ProM online-kurssin osio "Data Science in Action"
- Replay on prosessilouhinnassa suorituskyky analyysiä. Replay-mallilla pystytään timestamppien perusteella arvioimaan kuinka paljon juuri kyseinen prosessi ottaa kokonaisuudessaan aikaa. Timestamppien perusteella voidaan myös saada selville kuinka paljon yksi tietty prosessi vie aikaa.
- Replay:ta käyttäessä suorituskyky anaalysissä, kaavioon ilmestyy tietyn värisiä palleroita, jotka indikoivat odotusaikaa, jokaisen prosessin välillä. Siitä on helppo huomata, että missä kohdin menee liikaa aikaa hukkaan ja näin ollen voidaan tehostaa prosessia siltä osin.
- Prosessilouhintaa pidetään ”liimana” datan ja prosessien välisessä suhteessa.
- Syy datalouhinnalle piilee ”digiavaruudessa”, koska sitä on niin paljon, mistä louhia.
- Datanlouhinta työkaluja on olemassa muun muassa seuraavanlaisia: RapidMiner, R, Weka ja SAS.
- Prosessilouhinnan ja datalouhinnan ero on siinä, että datalouhinnassa käytetyt tekniikat eivät ole prosessikeskeisiä ja sitten taas prosessilouhinnassa käytetyt tekniikat ovat enemmän prosessikeskeisiä. Nämä kaksi asiaa täytyy olla yhdistettyinä toisiinsa, jotta voitaisiin käsitellä yhä hankalempia kyselyjä.
- Prosessilouhinnassa yhdistellään prosessimalleja ja tapahtumadataa (Event Logs) erilaisilla uusilla tavoilla. Prosessilouhinta ei ole samaa asiaa kuin normaalit datanlouhintatekniikat.
- Datalouhinnassa rivit (rows) ja kolumnit (columns) ovat kaikki kaikessa.
- Prosessilouhinnassa oletetaan tapahtumadata, jossa tapahtumat viittaavat prosessin esiintymiin ja toimintoihin. Lisäksi tapahtumat, joista olemme kiinnostuneita ovat end-to-end-prosessit ennen paikallisia malleja (Local Patterns).
- Event logeissa jokainen event eli tapahtuma viittaa tapaukseen(Case), toimintaan(Activity) ja ajankohtaan(Time).
- Event data voi tulla tietokannoista, CSV-tiedostoista, viestilogeista (IBM middleware) ja esimerkiksi open-API:lla, joka on sovellusliittymä, mikä tarjoaa tietoja verkkosivustoilta ja sosiaalisesta mediasta
- Event voi edustaa prosessin alkamista, jatkumista, valmistumista, päättymistä, keskeytymistä ja epäonnistumista.
- Control-Flow notationin valinnassa tulee huomioida, että valitsee sellaisen mallin, joka vastaisi mahdollisimman hyvin todellisuutta ja visuaaliselta kannalta sellaisen, joka on tarpeeksi selkeä näytettävä loppukäyttäjille, jotta esitettävästä asiasta saataisiin olennainen irti.
Lähde: http://jultika.oulu.fi/files/nbnfioulu-202005061622.pdf
- Prosessilouhinnan kasvanut suosio ja sen tutkiminen perustuu yritysten haluun saada tietää, mitä heidän prosesseissa oikeasti tapahtuu. Dataa voidaan kerätä esimerkiksi yrityksen toiminnanohjaus- (ERP) ja asiakkuudenhallintajärjestelmästä (CRM).
- Prosessilouhinta voidaan karkeasti jakaa kolmeen eri osaan. Nämä osat ovat automaattinen prosessien tunnistus, prosessimallin noudatustarkastus ja prosessien parannus. Automaattisessa prosessien tunnistamisessa data pitää alkuun siistiä ja koostaa käsiteltäväksi taulukoksi tiedonlouhintaa ja koneoppimista hyödyntäen. Tämän jälkeen prosessilouhintaan liittyvällä ohjelmalla voidaan luoda nykyisestä prosessista graafinen prosessimalli, mikä perustuu tapahtumalokeista kerättyyn dataan. Jotta edellä mainittu onnistuisi pitää datan sisältää tieto ainankin yksilöidystä seurantatunnuksesta (ID), aikaleimasta (Timestamp) ja toimenpidenimikkeestä(Activity name).
- Prosessilouhinnan tulosten pitäisi olla luettavissa helpossa formaatissa, koska todennäköisesti tuloksia käsittelevät sellaiset ihmiset, keillä ei ole paljoa kokemusta prosessiosaamisesta ja prosessilouhinnasta.
- Prosessilouhinta on yhä edelleen melko uudehko tieteenala ja tämän takia monet markkinoilla olevat ohjelmistot osoittautuvat paremmiksi kuin toiset tietyissä asioissa.
- Prosessilouhintaa kannattaa käyttää hyväksi prosessijohtamisessa, koska objektiivisille ja todenmukaisille prosessimalleille sekä -analyyseille on tarvetta ja prosessilouhinnan avulla organisaation tietojärjestelmien data saadaan hyötykäyttöön.
- Prosessilouhintaa on tutkittu eniten terveydenhuollon alalla, ICT-alalla ja tuotannossa.
- ). Prosessilouhinnan käyttökohteet kattavat koko prosessijohtamisen elinkaaren. Tämä tarkoittaa sitä, että elinkaari sisältää prosessien tunnistamisen ja mallinnuksen, analyysin, uudelleensuunnittelun, implementoinnin ja seurannan sekä hallinan.
- Prosessilouhinnan tarkoitus ei ole korvata perinteisiä prosessijohtamisen ja -kehittämisen tapoja (BPI, Six sigma), vaan sillä voidaan nopeuttaa ja integroida niiden suorittamista.
- Six Sigma-projekteissa ongelmana on, että ne suoritetaan perinteisesti manuaalisesti joka on sekä hidasta että kallista. Prosessilouhinnan avulla tietoa voidaan kerätä yrityksen tietojärjestelmistä, mikä nopeuttaa projektia merkittävästi, kuten prosessien tunnistamisessakin.
- Objektiivisuus tekee automaattisesta prosessintunnistamisesta ja prosessilouhinnasta merkittävän.
- Prosessilouhinta auttaa tunnistamaan resurssien ja henkilöiden käyttäytymistä prosessissa ja helpottaa pullonkaulojen ja kehityskohteiden paikantamista, minkä perusteella voidaan tehdä kehitysprojekteja. Prosessilouhinnan avulla prosessin etenemisen ennustettavuus paranee, mistä on hyötyä esimerkiksi tervydenhuollossa potilaiden käsittelyssä sairaalassa tai tuotteen valmistusajan määrittelyssä tuotannossa.
#### Haasteita
- Prosessilouhinnan haasteet liittyvät usein datan hajanaisuuteen ja vajavaisuuteen.
- Data on yleensä pirstaloitunut eri datalähteiden tai jopa järjestelmien välille ja se voi olla eri formaateissa, mikä luo datan keräämisestä ja sen käsittelystä haastavaa. Tämän lisäksi dataa ei kumminkaan saisi olla liian paljoa, koska tunnistus- ja tarkastusalgoritmit eivät kykene käsittelemään liian suuria datamääriä.
- Prosessilouhinta on tehokas menetelmä rakenteellisia ja toistuvia prosesseja tarkasteltaessa, mutta sillä ei kyetä mallintamaan muuttuvia ja rakenteettomia prosesseja kovin hyvin.
- Prosessiasiantuntijat eivät olleet täysin tyytyväisiä testattujen ohjelmien, ProM Fuzzy model ja Disco, suorituskykyyn, kun niitä testattiin rakenteettoman prosessin mallintamisessa. Prosessit olivat oikeustapauksia, joissa prosessi on samankaltainen, mutta välivaiheet vaihtelevat tapauksissa tarpeenmukaisesti. Ohjelmat eivät kyenneet luomaan tarpeeksi yksinkertaista mallia, joka sisältäisi kaikki oleellisimmat prosessin vaiheet.
-