MS Fabricin testaus ¬ Arvostelu ”Luo raportti automaattisesti” -toiminnosta 

Olemme aiemmin tuottaneet yhden asiantuntijamme avulla merkityksellisen raportin Suomen koronatiedoista. Nyt, kun Microsoftin uusi SaaS-tarjoama nimeltä Fabric on julkaistu, testaamme sen raportointiominaisuutta, jonka on tarkoitus helpottaa tietoanalyytikoiden ja BI-kehittäjien työtä. MS Fabricin sisältämän ”Raportin automaattinen luonti” -ominaisuuden avulla voit luoda tietojoukoista oivalluksia vain yhdellä klikkauksella. Seuraavassa tekstissä vertailemme Fabricin luomia raportteja asiantuntijamme luomaan raporttiin ja arvioimme, vastaako automaattisesti luotu raportti asiantuntijan tuottamaa laatua. 

Fabric’s auto-created report of Finland’s Corona data 

Miten se toimii? 

Fabricin käyttöliittymän kautta voi kätevästi käsitellä tietojaan. Fabricissa on mahdollista luoda tietojoukkoja niistä tiedostoista ja taulukoista, jotka on ladannut OneLakeen. OneLake on vasta kehitetty yhdistetty tietolähde, josta keskustelimme aiemmassa MS Fabricia käsitelleessä blogikirjoituksessa. Valitsemalla haluamansa tietojoukon raportin luomiseen, voi päättää, haluaako rakentaa raportin tyhjästä vai haluaako, että Fabric luo raportin automaattisesti. 

Kun päättää luoda raportin automaattisesti, Fabric valitsee taulukoista ne sarakkeet, jotka se katsoo merkityksellisimmiksi ja luo visualisoinnit heijastamaan tietojen oivalluksia. Se luo tiiviin yhteenveto sivun, jossa näytetään tärkeimmät kohokohdat Fabricin näkemyksen mukaisesti. Lisäksi se kirjoittaa lyhyen tekstin tiivistämään visualisointien oivallukset. Esitettäviä tietoja on mahdollista muuttaa itse, jolloin Fabric luo automaattisesti uusia visualisointeja valitusta datasta. 

Vertailu 

Käyttämällä ”Luo raportti automaattisesti” -ominaisuutta voi helposti rakentaa riittävän hyvän raportin, joka tehokkaasti välittää tärkeimmät oivallukset datasta. Todennäköisesti, on kuitenkin tehtävä hieman töitä valitessa oikeita datoja visualisoitaviksi, koska Fabric ei välttämättä heti valitse oikeita sarakkeita. Raportti, jonka se luo, voi olla riittävän hyvä, jos tarvitsee ainoastaan tarkistaa nopeasti datasta, että mitä tapahtuu. Raportti, jonka se luo, ei kuitenkaan ole visuaalisesti yhtä upea tai informatiivinen kuin asiantuntijan luoma. Lisäksi se tarjoaa vain tiiviin yhteenvedon tiedoista, kun taas ihminen voi luoda usean sivun raportin, joka tarjoaa syvällistä ymmärrystä asiasta. Voit myös muuttaa automaattisesti luodun raportin visualisointityyppiä, mutta se on käytännössä yhtä yksinkertaista kuin rakentaa raportti tyhjästä. Jos haluat luoda esitettävän raportin ”Luo raportti automaattisesti” -ominaisuuden avulla, sinun on laitettava yhtä paljon ajatusta ja vaivaa peliin kuin, jos rakentaisit koko raportin tyhjästä. 

Yhteenvetona voidaan todeta, että tämä ominaisuus on mukava lisä Power BI:hin, koska kuka tahansa voi helposti tarkistaa tiedoista saatavat oivallukset ja tehdä päätöksiä näiden tietojen perusteella. Joka tapauksessa, jos haluat luoda raportin, joka tarjoaa tehokasta tukea esityksellesi, sinun on silti käytettävä aikaa raportin rakentamiseen ja tietojen tärkeimpien näkökohtien korostamiseen. 

Tekoäly analytiikan tulevaisuus

Vaikka automaattisesti luodun raportin laatu ei vielä ole yhtä hienostunut kuin asiantuntijan luoma raportti, on silti vaikuttavaa, miten hyvin se pystyy yhdistämään erilaisia tietotyyppejä ja tuottamaan merkityksellisiä visualisointeja itsenäisesti. Tekoäly- ja koneoppimisteknologiat ovat kehittyneet viime vuosina nopeasti ja datan analysoinnissa niille on oiva käyttömahdollisuus. Ne ovat jo erinomaisia havaitsemaan malleja sekä analysoimaan muuttujien välisiä suhteita ja riippuvuuksia. Uskomme, että ”Luo raportti automaattisesti -ominaisuudella on edelleen parantamisen varaa. Tulevaisuudessa se saattaa pystyä tulkitsemaan ja välittämään informaatiota, joka on piilossa datassa, jopa paremmin kuin kirkkain asiantuntija. 

Tällä hetkellä trendinä näyttää olevan se, että pyrimme hyödyntämään tekoälyä käyttämällä generatiivisia tekoäly kieli malleja luotettavina apureina, jotka tekevät käytännön työn puolestamme. Microsoft on kertonut meille copilot-ominaisuudesta, joka sisältyy Fabric tuotteeseen, mutta se ei ole vielä saatavilla julkisessa esikatselussa olevassa versiossa. He ovat kuitenkin näyttäneet meille, miten copilotin kanssa voi keskustella ja kertoa sille, mitä tietoja haluaa tietää datasta. Se pystyy luomaan mittareita ja SQL-näkymiä. Toki se pystyy luomaan myös visualisointeja, mutta se pystyy vastaamaan myös monimutkaisempiin kysymyksiin. Esimerkiksi se voi näyttää visualisointien avulla syitä sille, miksi jotain on tapahtunut, tai antaa chatin välityksellä ehdotuksia siitä, miten voit parantaa tiettyjä arvoja. Copilotin avulla ainoa asia, joka jää ihmisten tehtäväksi, on tietää, mitä kysyä. Usein nämä kysymykset toistuvat, joten ehkä jossain vaiheessa voimme automatisoida myös tuon tehtävän. 

Datan laatu määrää siitä saatavan hyödyn

Datan laadusta on puhuttu siitä lähtien kun IT-järjestelmiä on alettu kehittää ja se on ajankohtainen aihe vielä tänä päivänäkin. Datan noustessa yhä keskeisemmäksi tekijäksi liiketoiminnassa, on aika kääntää katse datan laatuun. Tapa, jolla dataa kerätään, varastoidaan ja kulutetaan liiketoimintaprosesseissa määrää sen, kuinka paljon hyötyä datasta on liiketoiminnalle.

Mitä datan laadulla tarkoitetaan?

Datan laatu on mittari sille, kuinka sopivaa jokin data on tiettyyn tehtävään, kuten päätöksentekoon tai suunnitteluun. Laadukas data ottaa huomioon kaikki tehtävässä tarvittavat muuttujat ja on siten luotettavaa. 

Laadukkaan datan määritelmä vaihtelee liiketoiminnan asettamien vaatimusten mukaan; yhden yrityksen määreiden mukaan korkealaatuinen data ei välttämättä olekaan sitä jollekin toiselle yritykselle. Vaikka tietyn datan käyttötarkoitus olisi sama, voi sen laadusta olla silti eriäviä mielipiteitä. Tällöin apuna käytetään tiedonhallinnan organisoinnin malleja (Data Governance) muodostamaan yleiset laatumääritelmät.

Miksi datan laatuun kannattaa kiinnittää huomiota?

Analysoimalla dataa saadaan tietoa, jota voidaan soveltaa liiketoimintapäätöksiä tehtäessä. Näin ollen data on kaiken perusta ja jos sen laatu on heikkoa, myös siitä saatavan tiedon laatu on heikkoa eikä sitä voida hyödyntää päätöksenteossa. Heikkolaatuista dataa käytettäessä virheen mahdollisuus on suuri ja sen pohjalta tehtävät päätökset voivat viedä liiketoimintaa väärään suuntaan.

Datan laadun merkitys on näin ollen helppo ymmärtää. Sen sijaan suuremmaksi kysymykseksi muodostuu, kuka on vastuussa datan laadusta ja kuinka laatua pitäisi lähteä parantamaan.

Miten datan laatua mitataan?

Datan laadun mittarit vaihtelevat hieman liiketoiminnan tarpeiden mukaan, mutta tärkeimmät käytettävät mittarit ovat:

  • Virheettömyys. Datan täytyy olla tarkkaa ja virheetöntä ollakseen käyttökelpoista.
  • Täydellisyys. Jotta datasta saadaan vastauksia, sen täytyy olla aukotonta.
  • Ajantasaisuus. Vanhentunut data ei hyödytä liiketoimintaa.
  • Saavutettavuus. Dataan täytyy päästä käsiksi, jotta sitä voidaan käyttää.

Miten datan laatua parannetaan?

Tapa, jolla dataa kerätään vaikuttaa hyvin paljon siihen, mitä tietokantaan päätyy ja millaista dataa on lopulta käytettävissä. Huonolaatuisen datan syy onkin usein heti prosessin alussa, ja jos jostakin järjestelmästä saatavan datan laatu on heikkoa, sitä ei voi parantaa jälkikäteen. Siksi prosessin tulee olla kunnossa heti alusta alkaen. 

Kun datan laatua halutaan parantaa, ihmiset, prosessit ja työkalut täytyy tuoda yhteen. Ensin korjataan nykyiset prosessit ja niiden virheet sekä varmistetaan, etteivät samat virheet tule toistumaan tulevaisuudessa. Datan laadun kehittymistä mitataan valituilla mittareilla, joiden tulee vastata yleisesti liiketoiminnan mittaamisessa käytettäviin mittareihin.

Data ja sen laadun kehittäminen ovat ydinosaamistamme. Jos yrityksesi datan laadussa on puutteita etkä tiedä mistä aloittaa, ota meihin rohkeasti yhteyttä!

.