MS Fabricin testaus ¬ Arvostelu ”Luo raportti automaattisesti” -toiminnosta 

Olemme aiemmin tuottaneet yhden asiantuntijamme avulla merkityksellisen raportin Suomen koronatiedoista. Nyt, kun Microsoftin uusi SaaS-tarjoama nimeltä Fabric on julkaistu, testaamme sen raportointiominaisuutta, jonka on tarkoitus helpottaa tietoanalyytikoiden ja BI-kehittäjien työtä. MS Fabricin sisältämän ”Raportin automaattinen luonti” -ominaisuuden avulla voit luoda tietojoukoista oivalluksia vain yhdellä klikkauksella. Seuraavassa tekstissä vertailemme Fabricin luomia raportteja asiantuntijamme luomaan raporttiin ja arvioimme, vastaako automaattisesti luotu raportti asiantuntijan tuottamaa laatua. 

Fabric’s auto-created report of Finland’s Corona data 

Miten se toimii? 

Fabricin käyttöliittymän kautta voi kätevästi käsitellä tietojaan. Fabricissa on mahdollista luoda tietojoukkoja niistä tiedostoista ja taulukoista, jotka on ladannut OneLakeen. OneLake on vasta kehitetty yhdistetty tietolähde, josta keskustelimme aiemmassa MS Fabricia käsitelleessä blogikirjoituksessa. Valitsemalla haluamansa tietojoukon raportin luomiseen, voi päättää, haluaako rakentaa raportin tyhjästä vai haluaako, että Fabric luo raportin automaattisesti. 

Kun päättää luoda raportin automaattisesti, Fabric valitsee taulukoista ne sarakkeet, jotka se katsoo merkityksellisimmiksi ja luo visualisoinnit heijastamaan tietojen oivalluksia. Se luo tiiviin yhteenveto sivun, jossa näytetään tärkeimmät kohokohdat Fabricin näkemyksen mukaisesti. Lisäksi se kirjoittaa lyhyen tekstin tiivistämään visualisointien oivallukset. Esitettäviä tietoja on mahdollista muuttaa itse, jolloin Fabric luo automaattisesti uusia visualisointeja valitusta datasta. 

Vertailu 

Käyttämällä ”Luo raportti automaattisesti” -ominaisuutta voi helposti rakentaa riittävän hyvän raportin, joka tehokkaasti välittää tärkeimmät oivallukset datasta. Todennäköisesti, on kuitenkin tehtävä hieman töitä valitessa oikeita datoja visualisoitaviksi, koska Fabric ei välttämättä heti valitse oikeita sarakkeita. Raportti, jonka se luo, voi olla riittävän hyvä, jos tarvitsee ainoastaan tarkistaa nopeasti datasta, että mitä tapahtuu. Raportti, jonka se luo, ei kuitenkaan ole visuaalisesti yhtä upea tai informatiivinen kuin asiantuntijan luoma. Lisäksi se tarjoaa vain tiiviin yhteenvedon tiedoista, kun taas ihminen voi luoda usean sivun raportin, joka tarjoaa syvällistä ymmärrystä asiasta. Voit myös muuttaa automaattisesti luodun raportin visualisointityyppiä, mutta se on käytännössä yhtä yksinkertaista kuin rakentaa raportti tyhjästä. Jos haluat luoda esitettävän raportin ”Luo raportti automaattisesti” -ominaisuuden avulla, sinun on laitettava yhtä paljon ajatusta ja vaivaa peliin kuin, jos rakentaisit koko raportin tyhjästä. 

Yhteenvetona voidaan todeta, että tämä ominaisuus on mukava lisä Power BI:hin, koska kuka tahansa voi helposti tarkistaa tiedoista saatavat oivallukset ja tehdä päätöksiä näiden tietojen perusteella. Joka tapauksessa, jos haluat luoda raportin, joka tarjoaa tehokasta tukea esityksellesi, sinun on silti käytettävä aikaa raportin rakentamiseen ja tietojen tärkeimpien näkökohtien korostamiseen. 

Tekoäly analytiikan tulevaisuus

Vaikka automaattisesti luodun raportin laatu ei vielä ole yhtä hienostunut kuin asiantuntijan luoma raportti, on silti vaikuttavaa, miten hyvin se pystyy yhdistämään erilaisia tietotyyppejä ja tuottamaan merkityksellisiä visualisointeja itsenäisesti. Tekoäly- ja koneoppimisteknologiat ovat kehittyneet viime vuosina nopeasti ja datan analysoinnissa niille on oiva käyttömahdollisuus. Ne ovat jo erinomaisia havaitsemaan malleja sekä analysoimaan muuttujien välisiä suhteita ja riippuvuuksia. Uskomme, että ”Luo raportti automaattisesti -ominaisuudella on edelleen parantamisen varaa. Tulevaisuudessa se saattaa pystyä tulkitsemaan ja välittämään informaatiota, joka on piilossa datassa, jopa paremmin kuin kirkkain asiantuntija. 

Tällä hetkellä trendinä näyttää olevan se, että pyrimme hyödyntämään tekoälyä käyttämällä generatiivisia tekoäly kieli malleja luotettavina apureina, jotka tekevät käytännön työn puolestamme. Microsoft on kertonut meille copilot-ominaisuudesta, joka sisältyy Fabric tuotteeseen, mutta se ei ole vielä saatavilla julkisessa esikatselussa olevassa versiossa. He ovat kuitenkin näyttäneet meille, miten copilotin kanssa voi keskustella ja kertoa sille, mitä tietoja haluaa tietää datasta. Se pystyy luomaan mittareita ja SQL-näkymiä. Toki se pystyy luomaan myös visualisointeja, mutta se pystyy vastaamaan myös monimutkaisempiin kysymyksiin. Esimerkiksi se voi näyttää visualisointien avulla syitä sille, miksi jotain on tapahtunut, tai antaa chatin välityksellä ehdotuksia siitä, miten voit parantaa tiettyjä arvoja. Copilotin avulla ainoa asia, joka jää ihmisten tehtäväksi, on tietää, mitä kysyä. Usein nämä kysymykset toistuvat, joten ehkä jossain vaiheessa voimme automatisoida myös tuon tehtävän. 

Miten yhdistät onnistuneesti SAP-datan osaksi data-alustaa

Liiketoiminnan ketterä johtaminen vaatii relevanttia ja reaaliaikaista tietoa. SAP on yksi tavallisimmista yritysjärjestelmistä. Yleensä liiketoiminnalle tärkeää dataa kerätään useista muistakin järjestelmistä. Siksi yritysjohtoa palvelevissa data- ja analytiikkahankkeissa on usein keskeistä SAP-datan integrointi muiden sisäisten ja ulkoisten datalähteiden kanssa.

Continue reading ”Miten yhdistät onnistuneesti SAP-datan osaksi data-alustaa”

Data Mesh – vaihtoehtoinen tapa hallita dataa

Data on kestävää ja kustannustehokasta liiketoimintaa tavoittelevan yritysjohdon tärkein työkalu. Kokenut datatiimi sekä viimeisimmät analytiikka- ja teknologiaratkaisut ovat olennaisia osia yrityksen dataputkessa, mutta eivät yksistään riittäviä silloin, kun saatavilla olevaa dataa halutaan hyödyntää parhaalla mahdollisella tavalla. Prosessin osat on hiottava yhteen, ja dataa on katsottava uudesta näkökulmasta.

Kaiken keskiössä on datatuote

Usein ajatellaan, että hankitaan yritykseen jokin tuote, kuten toiminnanohjaus- tai muu IT-järjestelmä, joka muuttaa yrityksen toimintaa kannattavampaan suuntaan. Todellisuudessa kaiken keskiössä on data, johon liiketoiminnan kannalta kestävämmät päätökset perustuvat. 

Ajatusmallia IT-järjestelmästä tuotteena onkin syytä päivittää ja siirtyä ajatusmalliin, jossa data on pääasiallinen tuote. Tuotekehitystä tehdään tuotteen loppukäyttäjää, eli yrityksen johtoryhmää varten.

Datan käsittäminen tuotteena mahdollistaa erillisten dataprosessien yhdistämisen yhdeksi, kestäväksi ja koko organisaation kattavaksi, dataan perustuvaksi päätöksentekoprosessiksi, joka on edellytys yritystoiminnan digitalisoimiselle.

Perinteinen dataputki ei palvele datan loppukäyttäjää

Dataa tuotetaan IT-järjestelmissä, joiden toiminnasta ovat vastuussa IT-asiantuntijat. He eivät kuitenkaan ole tekemisissä datan hallinnan kanssa, koska he eivät vastaa datan viemisestä data-alustalle tai tiedä sen tarkemmin, miten dataa tullaan jatkokäyttämään. IT-asiantuntijoilla ei näin ollen ole omistajuutta hallinnoimaansa dataan.

Seuraavana dataputkessa on datatiimi, joka vie datan IT-järjestelmistä keskitetylle data-alustalle analysoitavaksi. Datatiimiläiset eivät ole mukana datan tuotantoprosessissa eivätkä he siksi tunne dataa, jonka parissa he työskentelevät. Datatiimilläkään ei ole omistajuutta dataan, koska he eivät tuota sitä. 

Viimeisenä vuorossa ovat datan kuluttajat, eli yrityksen johto ja data scientistit. Heidän pitäisi pystyä tekemään päätöksiä datan pohjalta, jota ei omista oikein kukaan. Datan laatu ei myöskään aina ole riittävää, koska siihen on vaikea vaikuttaa prosessien irrallisuuden takia.

Dataputki koostuu irrallisista osista, jotka eivät kommunikoi keskenään. Datan tuotannossa ja käsittelyssä ei lisäksi huomioida riittävästi sitä, vastaako data sen loppukäyttäjien tarpeita.

Data Mesh järjestää prosessin uudelleen

Data Mesh tarkoittaa käytännössä sitä, että perinteisen dataputkimallin sijaan datan tuotanto ja hyödyntäminen toteutetaan liiketoiminta-alueittain. Käytännössä jokainen liiketoiminta-alue (domain) tuottaa ja analysoi oman datansa, kuitenkin samaa kaavaa noudattaen. 

Data Mesh -mallissa dataputki on hajautettu, eli jokaisella domainilla on oma dataputkensa. Data-alusta on edelleen keskitetty ja kaikille sama, joten eri domainien datatuotteet ovat yhteneviä. Jos jokainen domain rakentaisi oman, erillisen tietovaraston ja data-altaan, ne toimisivat kokonaisuudesta erillisinä osina ja aiheuttaisivat siilojen syntymisen. Alkuperäisestä ongelmasta, eli prosessien irrallisuudesta ja kommunikoinnin puutteesta ei päästäisi eroon.

Datatiimillä on vastuu datasta

Domainkohtainen datan hallinta ei ole uusi lähestymistapa, vaan monissa yrityksissä datan omistajuus on ollut jaettuna domaineittain jo pitkään. Data Mesh pureutuukin juuri datan omistajuudesta aiheutuviin ongelmiin. Se eroaa aiemmin käytetystä domainkohtaisesta lähestymistavasta siten, että jokaisella domainilla on oma datatiimi, joka tuottaa, käsittelee ja kuluttaa dataa.

Datatiimillä on täysi omistajuus siihen dataan, jonka parissa he toimivat. Datatiimin jäsenet tuntevat oman domaininsa dataputken läpikotaisin, joten jos datan suhteen herää kysymyksiä tai sen laatu ei vastaa tarpeita, datatiimi pystyy korjaamaan tilanteen.

Data Mesh ei siis ole teknologiaratkaisu, vaan pikemminkin näkökulma dataputken järjestämiseksi uudella tavalla, joka mahdollistaa datan käsittämisen pääasiallisena tuotteena. Domainkohtaisesta datatiimistä, eli datan tuottajista, käsittelijöistä ja kuluttajista, kehittyy oman alueensa asiantuntijoita sekä tuotekehittäjiä, jotka yhdessä pyrkivät kehittämään parhaan mahdollisen datatuotteen.

Onko yrityksesi datan omistajuus hukassa? Me autamme datan hyödyntämisessä koko organisaation laajuisesti. Jätä yhteydenottopyyntö, niin olemme sinuun mahdollisimman pian yhteydessä.

.