Salla Rönkä
24.05.2017 · Salla Rönkä

Datasta liiketoiminnan kehittämiseen visualisoinnin avulla

Datan tehokas hyödyntäminen liiketoiminnassa voi tuoda yritykselle huomattavaa kilpailuetua. Jotta data saadaan hyötykäyttöön, se on kuitenkin ensin jalostettava selkeään ja ymmärrettävään muotoon.

Digitalisaation myötä tietoa kertyy koko ajan enemmän ja useammasta eri lähteestä, ja monissa yrityksissä sitä onkin jo pitkään kerätty erilaisiin järjestelmiin. Harvemmin ollaan kuitenkaan täysin tietoisia siitä, mitä mahdollisuuksia kerätty data ja sen hyödyntäminen tarjoavat. Kerätyn datan tehokas hyödyntäminen voi esimerkiksi tuoda yritykselle huomattavaa kilpailuetua, jos muilla ei ole vielä vastaavaa datamassaa tai osaamista sen hyödyntämiseen.

Datan hyödyntämisen kannalta on oleellista tietää, ketkä dataa tulevat käyttämään ja mihin tarkoitukseen. Näiden asioiden perusteella voidaan päättää esimerkiksi, miten dataa kerätään ja minne, sekä minkälaiseen muotoon se tullaan jalostamaan. Data voidaan jalostaa muun muassa erilaisiksi visualisoinneiksi, joissa sen sisältämä tieto hahmottuu selkeäksi ja ymmärrettäväksi kokonaisuudeksi. Näin tiedon käyttäjän ei tarvitse olla matemaatikko, tilastotieteilijä tai tietokantaekspertti ymmärtääkseen, mitä data kertoo. Datan visualisointi on keskeinen apuväline projekteissa, jotka pohjautuvat datan hyödyntämiseen tuotteiden ja palveluiden kehittämisessä. Tässä tekstissä pyrin valaisemaan datan visualisoinnin hyötyjä ja haasteita aiheesta kiinnostuneille, sekä tarjoamaan ajatuksia jäsentävän kehikon myös alan ammattilaisille.

Tietokantoihin säilötyn tai rajapinnoista saatavan raakadatan avulla ei vielä päästä kovinkaan pitkälle. Raakadatan sisältämää informaatiota ei voi sellaisenaan vielä ymmärtää, saati hyödyntää näkemättä keskiarvoja, summia, trendejä, korrelaatioita ja poikkeavia arvoja tai esimerkiksi puuttuvien arvojen määrää. Data täytyykin ensin prosessoida ymmärrettävään muotoon, minkä jälkeen visualisoinneilla saadaan tehokkaasti kommunikoitua olennainen informaatio myös muille.

Raakadatasta käyttäjää hyödyttävään visualisointiin

Matka raakadatasta käyttäjäystävälliseen muotoon alkaa dataan tutustumisella, sen laadun tarkistamisella ja normalisoinnilla. Dataan tutustuminen ja sen visualisointi mielenkiintoisten ilmiöiden löytämiseksi kulkee englanninkielisellä nimellä data discovery. Tässä työvaiheessa muodostuu jatkuvasti uusia kysymyksiä, joihin datasta voidaan etsiä vastauksia. Kun datalöytöretkellä on tehty löytö, sitä voidaan alkaa selittää ja tutkia tarkemmin.

Selittämisvaiheessa datasta voidaan luoda tarinoita, joissa visualisoinnin keinoin nostetaan esille löydöksiä. Päätöksenteon tueksi voidaan tehdä yksittäisiä staattisia visualisointeja ja interaktiivisia dashboardeja tehdään, jos tiedetään samoille näkymille olevan käyttöä jatkossa. Kolmantena visualisoinnin käyttötarkoituksena on datan jalostaminen lopputuotteeksi. Tällöin suunnitellaan datasetistä muodostettavan käyttöliittymän ulkoasu.

Jos dataan pohjautuen luodaan matemaattisia malleja, voidaan visualisointia käyttää näiden mallien toimivuuden arvioinnissa. Tämä vaatii datan, mallin ja mallin matemaattisten arviointimenetelmien ymmärrystä. Visualisoinnin hyödyntäminen mallien ja algoritmien rakentamisessa on kuitenkin vain yksi visualisoinnin osa-alue. Usein esimerkiksi dataan tutustuminen ja sen analysointi lisäävät suoraan ymmärrystä tutkittavasta ilmiöstä, kuten palvelun käyttäjien toiminnasta, sekä palvelujen laadusta, tuottavuudesta ja kulurakenteesta. Näin tuodaan uusia aseita liiketoiminnan kehittämiseen. Huolelliseen dataan tutustumiseen onkin syytä käyttää riittävästi aikaa.

Itse pidän seuraavasta data science -prosessin kuvauksesta:

Kaavio pohjautuu Wikipediasta löytyvään data science -prosessin kuvaukseen, johon lisäsin edellä mainitut datan visualisoinnin käyttötarkoitukset, jotta visualisointiin liittyvät vaiheet olisi helpompi hahmottaa. Lisäsin myös tärkeänä seikkana käyttötapauksen validoinnin: käytettävissä oleva data voi asettaa rajoituksia sille, millaisia lopputuotteita voidaan rakentaa ja johtopäätöksiä tehdä. Jos esimerkiksi sopivaa dataa ei ole saatavilla riittävästi tai lainkaan, voidaan myös harkita datan rikastamista muista lähteistä. Näiden edellä mainittujen vaiheiden kautta dataa prosessoidaan hyödylliseen, käyttäjäystävälliseen ja ymmärrettävään muotoon.

Käyttäjien tarpeet ovat datan visualisoinnin lähtökohta

Visualisoinnin tulisi pohjautua sitä käyttävien henkilöiden tarpeisiin ja ottaa huomioon heidän roolinsa yrityksessä. Samat numerot voivat kertoa useaa eri tarinaa käyttäjästä riippuen. Yrityksen johdolle esitettävien visualisointien tulee mahdollistaa nopea dataan perustuva päätöksenteko, jolloin visualisoijan tai analyytikon tehtävänä on jalostaa data mahdollisimman pitkälle kehitysehdotuksiin ja jopa niiden seurauksiin saakka. Tuotepäällikköä taas usein kiinnostaa yleiskatsauksen sijaan tuotteeseen liittyvät tunnusluvut. Muita huomioon otettavia asioita ovat esimerkiksi visualisointien käyttötapa: tuleeko henkilö käyttämään visualisointeja yksin ja etsimään niistä omia merkityksiään, vai ovatko ne osa vaikkapa asiantuntijan esitystä, johon punainen lanka on jo piirretty valmiiksi. Visualisoinnissa tulee myös miettiä esimerkiksi, mitkä graafityypit sopivat parhaiten kunkin tiedon esittämiseen, jotta lopputulos olisi mahdollisimman selkeä eikä johda käyttäjää harhaan.

Datan visualisoinnin haasteet

Datan laadukas visualisointi ei ole aivan yksinkertainen prosessi, sillä data on harvoin suoraan hyvälaatuista. Törmään työssäni usein haasteisiin, joiden selvittäminen voi viedä paljonkin aikaa ennen varsinaista visualisointivaihetta. Data saattaa olla esimerkiksi ripoteltuna useisiin eri järjestelmiin, ja toisiinsa liittyvä tieto on eri järjestelmissä eri tunnisteilla. Usein datassa oleville kentille ei löydy kuvauksia, eli datasanakirjaa ja datan omistajan metsästys vie aikaa. Data saattaa aluksi olla myös huonolaatuista, eli siinä on puuttuvia ja normalisoitavia kenttiä. Datan käyttöoikeudet ja mahdolliset tietoturva- ja yksityisyysasiat voivat myös aiheuttaa päänvaivaa.

Suurin ratkaistava ongelma on kuitenkin kerätyn datan saattaminen hyötykäyttöön. Muuten toimintaa ei muuteta, vaikka dataan pohjautuen siihen olisi aihetta ja mahdollisuuksia. Kaikkein tärkeintä visualisoinnissa on siis ottaa huomioon se, kenen ja mihin tarpeisiin projektia ja visualisointia tehdään ja saattaa data muotoon, jossa se on helposti hyödynnettävissä. Näin voidaan valjastaa datassa piilevä potentiaali.

Kategoria
Analytiikka

Haluatko tietää lisää aiheesta? Jätä tietosi, niin otamme yhteyttä.

Viimeisimmät blogikirjoitukset