Datan demokratisointi ja älykkäät agentit – Mitä opimme AWS Summitista? 

Omalla kohdalla varma merkki kesän tulemisesta on AWS Summit Tukholmassa. Tapahtuma tarjosi katsauksen siihen, mihin suuntaan pilvipalvelut, data-alustat ja tekoälyratkaisut ovat kehittymässä. Tämän vuoden tapahtuman selkeä teema oli agenttipohjainen tekoäly, datan hallinta modernien datalakejen avulla sekä AWS:n tavoite tuoda tekoäly aidosti osaksi liiketoimintaprosesseja – ei vain teknologiahankkeiksi. Tapahtumassa oli yli 80 sessiota eri osa-alueilta ja tähän blogiin on kerätty huomioita sessioista, joihin itse osallistuin. Sessiot, joihin osallistuin keskittyivät agenttipohjaisiin ratkaisuihin, generatiiviseen analytiikkaan ja moderneihin datalakeihin.

Agenttipohjainen tekoäly nousee keskiöön

Keynotessa avattiin AWS:n näkemystä siitä, että tekoälyn seuraava vaihe rakentuu agenttien ympärille. AWS korosti, että organisaatioiden tavoitteena ei ole enää vain hyödyntää yksittäisiä tekoälymalleja, vaan rakentaa kokonaisia älykkäitä työnkulkuja ja automaatiota tukevia agentteja. 

Useat asiakastarinat havainnollistivat tätä muutosta käytännössä. Danske Bank on siirtänyt infrastruktuurinsa AWS-ympäristöön, tavoitteenaan modernisoida pankin data- ja analytiikka-alustaa sekä nopeuttaa palveluiden kehitystä. Zenseact puolestaan kertoi datatehtaan rakentamisesta AWS:n päälle autonomisen ajamisen kehitystä varten, missä datamäärät, analytiikka ja koneoppiminen yhdistyvät erittäin suurissa mittakaavoissa. 

Erityisen kiinnostava case oli DNB Bankin KYC-ratkaisu (Know Your Customer), jossa tekoälyä hyödynnetään asiakastietojen tarkistamiseen ja riskienhallintaan. Ratkaisussa yhdistyivät Amazon Bedrock, generatiivinen tekoäly sekä agenttipohjainen automaatio. Esimerkki kuvasi hyvin sitä, miten tekoälyä pyritään viemään pois yksittäisistä kokeiluista kohti liiketoimintaa tukevia tuotantoratkaisuja. 

Keynoten ehkä tärkein viesti liittyi kuitenkin dataan. AWS korosti useaan otteeseen, että ilman selkeää datastrategiaa ei voida rakentaa kestävää AI-strategiaa. Tämä näkyy monessa organisaatiossa myös käytännössä: suuri osa IT-budjeteista kuluu edelleen legacy-järjestelmien ylläpitoon, mikä hidastaa tekoälyn käyttöönottoa. 

Teknologioista keskiössä olivat erityisesti Amazon Bedrock, uudet AWS-agenttiratkaisut sekä S3:n laajentuminen entistä vahvemmaksi ja monipuolisemmaksi datakerrokseksi. 

Amazon Quick ja generatiivinen BI 

AWS:n tavoite on madaltaa datan hyödyntämisen kynnystä organisaatioissa. Yksi vaihtoehto tähän on Amazon Quick -palvelu, joka tuo generatiivisen tekoälyn osaksi analytiikkaa ja raportointia.  

Amazon Quick -sessiossa esiteltiin ominaisuuksia, kuten QuickSight, QuickFlows, Quick Automate ja Quick Research. Käytännössä nämä mahdollistavat analytiikan, automaation ja tiedonhaun luonnollisella kielellä ilman syvällistä teknistä osaamista. 

Amazon Quick -palvelussa chat-pohjaiset agentit ja knowledge space -ratkaisut integroituvat osaksi yrityksen päivittäisiä työnkulkuja. Tämä suuntaus näkyy vahvasti koko markkinassa: analytiikka ei enää rajoitu BI-tiimeille, vaan tavoitteena on tehdä datasta aidosti koko organisaation työkalu. 

Teknologisesti ratkaisu nojasi vahvasti generatiiviseen tekoälyyn, Amazon Bedrockiin sekä AWS:n omaan analytiikkaekosysteemiin. 

Modernit data-alustat ja S3 Taulut 

Datan näkökulmasta vahva teema tapahtumassa oli modernien data-alustojen rakentaminen Apache Icebergin ja S3 Taulujen ympärille. 

Modern batch analytics -sessiossa esiteltiin, kuinka AWS rakentaa uuden sukupolven analytiikkaratkaisuja yhdistämällä Amazon S3 Tables, Apache Iceberg, AWS Glue, Lake Formation ja Athena. Tavoitteena on mahdollistaa skaalautuvat ja transaktionaaliset datalaket ilman perinteisten data warehouse -ratkaisujen rajoitteita. 

Sessiossa korostui myös datan hallittavuus ja tietoturva. Lake Formationin rooli käyttöoikeuksien hallinnassa sekä Glue-orkestrointi olivat keskeisiä osia kokonaisuutta. 

Myös SageMaker Unified Studio ja QuickSuite tuovat analytiikan, koneoppimisen ja visualisoinnin lähemmäksi samaa alustaa. AWS:n strategia näyttää olevan yhtenäisen dataekosysteemin rakentaminen,jossa data engineering, analytiikka ja AI yhdistyvät saumattomasti. 

Case Funnel: agenttipohjaiset dataintegraatiot 

Yksi käytännönläheisimmistä sessioista oli Funnelin esitys agenttipohjaisista dataintegraatioista. 

Funnel käsitteli ongelmaa, joka on tuttu dataorganisaatioille: SaaS-järjestelmien API-rajapinnat muuttuvat jatkuvasti, integraatiot ovat hauraita ja niiden ylläpito vie paljon aikaa. 

Ratkaisuna Funnel on rakentanut deklaratiivisen connector-alustan, jota laajennetaan nyt agenttipohjaisella tekoälyllä. Ajatuksena on, että AI-agentit voivat automaattisesti tulkita API-rajapintoja, rakentaa datamalleja ja muuntaa raakadataa analytiikkavalmiiseen muotoon. 

Tämä oli yksi konkreettisimmista esimerkeistä siitä, miten generatiivista tekoälyä voidaan hyödyntää data engineeringissä käytännön tasolla. Samalla se kuvastaa hyvin koko alan muutosta: manuaalinen integraatiotyö pyritään automatisoimaan mahdollisimman pitkälle. 

Funnelin Open Data Lake -ratkaisu AWS:n päällä osoitti myös, kuinka tärkeään rooliin avoimet formaatit ja data lake -arkkitehtuurit ovat nousseet. 

Apache Iceberg ja modernit datalaket 

Viimeinen sessio keskittyi Apache Icebergiin ja modernien datajärvien rakentamiseen Amazon S3:n päälle. 

Apache Iceberg nousi tapahtumassa lähes standardiksi modernille data-alustalle. Teknologia tarjoaa transaktionaalisuuden, schema evoluutio -ominaisuudet ja paremman suorituskyvyn suurille datalakeille. 

Sessiossa käytiin läpi erityisesti käytännön operointia: metadatan optimointia, skeemasuunnittelua sekä kustannusten hallintaa. 

AWS painotti vahvasti S3 Taulujen -ratkaisua, jonka tavoitteena on yksinkertaistaa Iceberg-pohjaisten datalaken hallintaa. AWS näkee data lakehouse -arkkitehtuurit keskeisenä osana tulevaisuuden analytiikka- ja AI-ratkaisuja. 

Yksi tärkeä havainto oli myös se, että datalakejen kehitys ei enää keskity pelkästään tallennukseen. Nyt tavoitteena on rakentaa alustoja, jotka tukevat samanaikaisesti analytiikkaa, koneoppimista, generatiivista tekoälyä ja agenttipohjaisia sovelluksia. 

Yhteenveto 

AWS Summit Stockholm 2026 vahvisti käsitystä siitä, että tekoäly on siirtymässä kokeiluista kohti tuotantokäyttöä – mutta matkaa on vielä jäljellä. Agenttipohjaiset ratkaisut, generatiivinen analytiikka sekä modernit datalaket tekevät tuloaan kovalla vauhdilla. 

Samalla tapahtuma muistutti siitä, että onnistunut AI-strategia rakentuu edelleen vahvan data-alustan päälle. Organisaatioiden on modernisoitava data-arkkitehtuurinsa, automatisoitava integraatioita ja hallittava dataa tehokkaasti ennen kuin tekoälystä voidaan saada täysi liiketoimintahyöty. 

AWS:n vahva panostus Amazon Bedrockiin, Apache Icebergiin, S3 Tauluihin ja agenttipohjaisiin ratkaisuihin antaa hyvän kuvan siitä, mihin suuntaan pilvi- ja dataekosysteemi on seuraavina vuosina kehittymässä. 

-Asko Ovaska, Partner, Senior Data Architecht & Engineer  

Data Innovation Summit 2026: Tekoäly on vain niin viisas kuin sen perusta

Viime viikon loppupuoli vierähti Tukholmassa Data Innovation Summitissa. Kyseessä on ehdottomasti Pohjoismaiden tärkein ja suurin data-alan tapahtuma, joka kokoaa saman katon alle alan kirkkaimmat toimijat, visionäärit ja tekijät.

Kista Messukeskus toimi erinomaisena kohtauspaikkana, jossa pääsimme vaihtamaan ajatuksia niin nykyisten asiakkaidemme, prospektien, kumppaneidemme kuin maailman johtavien ohjelmistotoimittajien kanssa. Se on paras paikka, jossa alan tulevaisuuden trendit muuttuvat käytännön keskusteluiksi ja jossa data verkostojen voima korostuu. Perinteisesti Suomesta oli kattava osallistujajoukko.

Hypestä kohti käytäntöä

Kun vertaamme tämänvuotista tapahtumaa viime vuoteen, muutos on silmiinpistävä. Viime vuonna puheissa dominoi vielä tekoälyn valtava potentiaali ja alkuinnostus (hype), mutta nyt ilmassa oli huomattavasti realistisempi ja tekemiseen keskittyvä ote. Organisaatiot ovat siirtyneet kokeiluista ja demoista kohti aitoja tuotantoratkaisuja.

Samalla kun tekoälyä on alettu soveltaa käytännössä, on opittu kantapään kautta, mitkä asiat todella ratkaisevat onnistumisen. Tämän kokemuksen myötä kolme kriittistä aihealuetta on noussut selkeästi ylitse muiden.

1. Ei tekoälyä ilman modernia data platformia

Käytännön työssä on huomattu, että tekoäly on loppupeleissä vain ”matemaattinen kerros” datan päällä. Jotta tekoäly voisi toimia luotettavasti ja nopeasti, se tarvitsee taakseen modernin ja skaalautuvan Data-alusta/Data Platformin. Ilman vankkaa pohjaa parhaatkin algoritmit jäävät lähes aina hyödyttömiksi.

2. Konteksti on kuningas (Context is Everything)

Tekoäly on vaikuttava, mutta se on pohjimmiltaan sokea ilman yrityskohtaista sisältöä eli kontekstia. Käytännön toteutukset ovat osoittaneet, että yleiset kielimallit hallusinoivat tai antavat ympäripyöreitä vastauksia ilman tarkkaa, kuratoitua yritysdataa. Menestyjät syöttävät tekoälylle omaa sisältöään, jolloin siitä tulee todellinen strateginen työkalu.

3. Data Governance – Villi länsi on ohi

Kolmas ja ehkä kriittisin oppi on ollut datan hallinnan eli governancen välttämättömyys. Kun AI-hankkeet viedään tuotantoon, vastuu kasvaa. On tiedettävä, mistä data tulee, kuka siihen pääsee käsiksi ja ovatko tulokset auditoitavissa? Myös vastuukysymykset on pakko ratkaista. Voidaan hyvin kiteyttää: Data ilman hallintaa on riski ja hyvä data on omaisuuserä.

Menestys syntyy teknologiasta ja ihmisistä – Etlia apunasi

Konferenssin ehkä tärkein loppupäätelmä oli, että teknologia yksin ei riitä. Tarvitaan kokeneita asiantuntijoita, jotka osaavat yhdistää nämä kolme palasta – alustan, kontekstin ja hallinnan – toimivaksi kokonaisuudeksi.

Nämä kolme osa-aluetta muodostavat Etlian osaamisen ytimen. Olemme toimineet modernien data platformien, datan hallinnan ja ”datan murskauksen” parissa yrityksemme perustamisesta lähtien. Meille nämä teemat eivät ole uusia trendejä, vaan vankkaa ydinkokemusta, jonka päälle rakennamme tämän päivän tekoälyratkaisuja.

Osaavat konsulttimme varmistavat, että data- ja tekoälyhankkeet tuottavat todellista liiketoimintahyötyä eivätkä jää vain kalliiksi kokeiluiksi. Me tunnemme datan matkan lähteestä tekoälyn käyttöliittymään saakka.

Onko teidän yrityksessänne perusta kunnossa, ennen kuin tekoälyltä pyydetään vastauksia? Ota yhteyttä, niin laitetaan datanne töihin vuosien kokemuksella!


– Petri Räsänen & Juuso Maijala

Tekoälyohjatut prosessit vaativat modernin data-alustan ja osaamista

Yritysten data-alustat ovat siirtymässä uuteen aikakauteen. Siinä missä aiemmin niiden rooli oli kerätä ja raportoida tietoa, nyt niitä kehitetään ensisijaisesti mahdollistamaan tekoälyn hyödyntäminen, ja ennen kaikkea yritysten prosessien tehostaminen.

Tämä muutos on merkittävä. Data ei ole enää pelkkä päätöksenteon tuki, vaan aktiivinen osa operatiivista tekemistä. Tekoäly ei enää vain analysoi prosesseja, se osallistuu niiden suorittamiseen ja optimointiin.

Moderni data-alusta yhdistää datan, analytiikan ja tekoälyn suoraan liiketoimintaprosesseihin. Lopputuloksena syntyy järjestelmiä, jotka ohjaavat ja automatisoivat toimintaa.

1. Rutiinitehtävien automatisointi 

Tekoäly soveltuu erinomaisesti toistuviin ja sääntöpohjaisiin tehtäviin, kuten laskujen käsittelyyn, kirjanpitoon, asiakaspalvelun chatbotteihin ja sähköpostien lajitteluun sekä vastausluonnoksiin. Näin säästetään aikaa ja vähennetään inhimillisiä virheitä

2. Data-analytiikka ja ennustaminen 

Tekoäly mahdollistaa siirtymän reaktiivisesta toiminnasta ennakoivaan. Tästä esimerkkejä ovat: 

  • Myynnin ennustaminen  
  • Kysynnän ja varaston optimointi  
  • Asiakaskäyttäytymisen analysointi  

Tämä mahdollistaa paremmat ja nopeammat päätökset datan pohjalta. 

3. Asiakaskokemuksen parantaminen 

Personointi ja reaaliaikainen reagointi personoiduilla suosituksilla sekä kohdennetulla markkinoinnilla lisää myyntiä ja asiakastyytyväisyyttä

4. Sisäisten prosessien tehostaminen 

Sisäisiä prosesseja voidaan tehostaa mm. dokumenttien automaattisella käsittelyllä,  tukemalla projektinhallintaa sekä tuottamalla ennusteita AI:lla. Näin voidaan saavuttaa nopeampi tiedonkulku ja vähemmän manuaalista työtä. 

5. Tuotannon ja operaatioiden optimointi 

Operatiivinen tehokkuus paranee datan ja tekoälyn yhdistelmällä. Tästä esimerkkeinä ennakoiva huolto, logistiikan optimointi ja laadunvalvonta kuvantunnistuksella. Nämä voivat mahdollistaa pienemmät kustannukset ja seisokkiajat

6. Sisällöntuotanto ja viestintä 

Generatiivinen tekoäly nopeuttaa tiedon tuottamista, kuten markkinointitekstit, raportit,  tarjoukset ja koulutusmateriaalit, joilla voidaan saavuttaa nopeampi ja yhtenäisempi viestintä sekä kustannussäästöjä

7. Päätöksenteon tukeminen 

Tekoäly tukee johtoa yhä strategisemmalla tasolla, mm. skenaariolaskelmissa, riskiarvioinneissa, KPI-seurannassa ja poikkeamien tunnistuksessa. Näin voidaan saavuttaa strategisesti parempia päätöksiä

Vaaditaan organisatorinen muutos 

Vaikka teknologia kehittyy nopeasti, suurin haaste ei ole tekninen, vaan organisatorinen.  Tekoälyn hyödyntäminen prosessien tehostamisessa vaatii muutoksia siinä, miten organisaatio toimii: 

1. Siirtymä siiloista datavetoiseen tekemiseen 

Data ei voi olla vain IT:n vastuulla. Sen tulee olla osa jokapäiväistä päätöksentekoa kaikilla tasoilla. 

2. Uudet roolit ja osaaminen 

Tarvitaan uusia kyvykkyyksiä: 

  • data engineerit ja ML-asiantuntijat  
  • liiketoiminnan ja teknologian yhdistävät roolit (esim. AI product owner)  
  • ja ennen kaikkea kyky ymmärtää prosesseja datan näkökulmasta  

3. Prosessien uudelleenajattelu 

Tekoälyä ei kannata liimata vanhojen prosessien päälle. Suurin hyöty syntyy, kun prosessit suunnitellaan uudelleen tekoäly edellä. 

4. Muutosjohtaminen 

Organisaation on opittava luottamaan dataan ja tekoälyyn. Tämä vaatii kulttuurin muutosta, ei pelkästään uusia työkaluja. 

Kohti autonomisia liiketoimintaprosesseja 

Seuraava kehitysvaihe on jo näkyvissä: autonomiset prosessit. 

Autonomisessa prosessissa: 

  • data päivittyy reaaliaikaisesti,  
  • tekoäly analysoi tilanteen ja 
  • järjestelmä tekee päätöksiä ja käynnistää toimenpiteitä automaattisesti  

Esimerkiksi: 

  • varasto täydentyy automaattisesti kysyntäennusteen perusteella  
  • asiakaspalvelu ratkaisee suuren osan yhteydenotoista ilman ihmistä  
  • tuotantolinja optimoi itseään jatkuvasti sensoridatan perusteella  

Ihmisen rooli ei katoa vaan muuttuu: operatiivisesta tekemisestä siirrytään ohjaukseen, valvontaan ja poikkeustilanteiden ratkaisemiseen. 

Mitä onnistuminen vaatii? 

Tekoälyn hyödyntäminen prosessien tehostamisessa edellyttää kolmen tekijän yhdistämistä: 

  1. Ymmärrys tehostettavista prosesseista,  
  2. Tekoäly, joka voidaan integroida suoraan tekemiseen ja 
  3. Laadukas ja yhtenäinen data modernin data-alustan päällä  

Ilman yhtenäistä data-alustaa tekoäly jää helposti irrallisiksi kokeiluiksi. 

Autonominen datavetoinen liiketoiminta 

Data-alustojen murros ei ole pelkkä teknologinen päivitys, se on muutos tavassa, jolla yritykset toimivat. 

Organisaatiot, jotka onnistuvat yhdistämään datan, tekoälyn ja prosessit, eivät ainoastaan tehosta toimintaansa, vaan ne rakentavat pohjan autonomiselle, jatkuvasti optimoituvalle liiketoiminnalle, ja juuri siinä syntyy tulevaisuuden kilpailuetu. Tällainen muutos edellyttää syvää osaamista ja käytännön kokemusta.  

Etlialla olemme työskennelleet näiden teemojen parissa alusta asti. Korkea asiakastyytyväisyytemme (NPS 88) kertoo kyvystämme tuottaa konkreettista arvoa ja vahvistaa asiakkaidemme kilpailukykyä myös tulevaisuudessa. 

Mikäli haluat keskustella aiheesta lisää, niin ota yhteyttä!

-Juuso Maijala, CEO

Data-alan suurin murros: Koodarista kuraattoriksi ja ”Vibe & Agenttikoodauksen” aikakauteen

Vielä muutama vuosi sitten data-arkkitehtuurien rakentaminen oli pitkälti käsityötä: asiantuntijoiden SQL-lauseiden hienosäätöä, Python-skriptien debuggaamista sekä raskaiden ETL-putkien rakentamista. Muutama vuosi sitten saapui generatiivinen tekoäly, ja pelikenttä muuttui pysyvästi.

Olen seurannut data-alaa, ohjelmistoja sekä konsultointia vuosituhannen vaihteesta yli 25 vuoden ajan. Olen nähnyt useiden teknologioiden nousevan ja väistyvän, mutta uskallan sanoa, että nyt käsillä oleva murros on suurin näkemäni muutos sitten pilviratkaisuihin siirtymisen, joka alkoi tapahtua 2010-luvulla. Siinä missä pilvi muutti sen missä data asuu ja prosessointi tapahtuu, tekoäly tulee muuttamaan sen, miten datan kanssa työskentelemme päivittäin.

Tämä ei tarkoita data-asiantuntijoiden katoamista vaan roolin painopisteen muutamista: tekijöistä on tulossa yhä enemmän arkkitehteja, kuraattoreita ja laadunvarmistajia kuin koodin vääntäjiä.

Ohjelmistojätit tekoälyn eturintamassa

Suuret data-alustat ja integraatiotyökalut eivät ole jääneet odottelemaan, vaan ne ovat integroineet tekoälyn suoraan ydintoimintoihinsa. Tämä automatisoi jo nyt huomattavan osan työstä, joka aiemmin tehtiin käsin.

AlustaEsimerkkejä AI-ratkaisuista
Snowflake (Cortex)Tuo LLM-mallit suoraan datan luokse, mahdollistaen älykkään analyysin ilman datan siirtämistä turvallisesta ympäristöstä.
Databricks (Agents Bricks)Tarjoaa työkalut itsenäisten agenttien rakentamiseen, jotka osaavat hakea tietoa ja suorittaa tehtäviä yritysdatan pohjalta.
Microsoft FabricCopilot ohjaa läpi koko tietovirran, automatisoiden koodin generointia, dokumentointia ja raportointia.
SAP (Joule)Helpottaa navigointia monimutkaisissa ERP-tietorakenteissa ja kääntää liiketoimintaprosessit nopeammin ymmärrettäviksi oivalluksiksi.

”Vibe” tai “Agentti” koodaus vaatii rautaista senioriteettia

Mielenkiintoinen ja paljon keskustelua herättänyt ilmiö on niin sanottu vibe coding. Vibe coding viittaa tyyliin, jossa asiantuntija ei välttämättä kirjoita jokaista riviä itse, vaan kuvailee luonnollisella kielellä halutun lopputuloksen – ja antaa tekoälyn hoitaa teknisen toteutuksen. Tässä tyylissä keskiössä on intentio, ei syntaksi.

Toinen nopeasti yleistyvä käsite on agenttikoodaus. Agenttikoodaus tarkoittaa mallia, jossa tekoälyagentti toimii osittain tai täysin itsenäisesti: se hakee tietoa, käsittelee dataa ja suorittaa määriteltyjä tehtäviä yrityksen dataympäristössä ennalta asetettujen tavoitteiden pohjalta. Kehittäjän rooli siirtyy tällöin toteuttajasta ohjaajaksi ja orkestroijaksi.

Mutta tässä piilee merkittävä sudenkuoppa: jos ei tiedä, miltä laadukkaan koodin ja kestävän arkkitehtuurin ”kuuluu tuntua”, vibe-koodaus johtaa nopeasti hallitsemattomaan ja vaikeasti ylläpidettävään kokonaisuuteen. Tekoäly on erinomainen apulainen, mutta se on surkea johtaja.

Tässä kohtaa senioriteetti ja kokemus nousevat arvoonsa. Kokenut asiantuntija tunnistaa välittömästi, kun tekoälyn ehdottama ratkaisu on teknisesti hieno mutta käytännössä virhealtis tai vaikeasti skaalautuva. Mitä helpommaksi koodin tuottaminen käy, sitä tärkeämmäksi nousee ymmärrys siitä, mitä todella ollaan tekemässä ja miksi.

Jatkossa tämä asiantuntemus vielä korostuu, kun siirrytään ympäristöihin, joissa useat tekoälyagentit toimivat rinnakkain ja suorittavat tehtäviä osittain itsenäisesti. Mitä enemmän päätöksentekoa delegoidaan agenteille, sitä tärkeämpää on ymmärtää kokonaisarkkitehtuuri, vastuurajat ja riskit.

Etlialla olemme kehityksen ytimessä

Tämä teknologinen murros on nopeampi kuin mikään aiempi. Siksi meillä Etlialla panostetaan jatkuvaan oppimiseen ja markkinan seurantaan tavalla, joka näkyy suoraan asiakkaillemme.

  • Aktiivinen seuranta: Analysoimme jatkuvasti markkinajohtajien julkistuksia. Emme tyydy esitteisiin, vaan testaamme uudet ominaisuudet käytännössä, jotta tiedämme niiden todellisen arvon. Tässä kohti pitää kiittää myös teknologiatoimittajia, jotka pitävät kiitettävästi kumppaneita ajan tasalla uusista AI -ominaisuuksista
  • Osaamisen validointi: Meillä tekoälyä hyödynnetään nopeuttamaan rutiineja, mutta senioritason asiantuntemus varmistaa aina, että lopputulos on tuotantokelpoinen, tietoturvallinen ja ylläpidettävä.
  • Tiedon jakaminen: Jaamme osaamistamme aktiivisesti tiimin kesken, jotta uusin ymmärrys siirtyy välittömästi asiakkaidemme hyödyksi.

Meille on kunnia-asia, että asiakkaamme saavat aina ajanmukaista strategista näkemystä – emme rakenna eilispäivän ratkaisuja tämän päivän ongelmiin.

Onko perinteinen osaaminen enää tarpeen?

Vaikka tekoäly hoitaa rutiinit, todellinen ymmärrys datan rakenteista ja integraatioista on kriittisempää kuin koskaan. Asiantuntijan rooli on siirtynyt suorittavasta työstä kohti tarkastajan, arkkitehdin ja orkestroijan tehtäviä. On tiedettävä tarkalleen, mitä ollaan rakentamassa, jotta tekoälyä osataan ohjata oikeaan suuntaan.

Data engineering on muuttumassa teknisestä suorittamisesta strategisemmaksi rooliksi. Kun alustojen natiivit AI-työkalut hoitavat raskaan työn, jää enemmän tilaa sille, mikä on oikeasti tärkeää: datan muuttamiselle todelliseksi liiketoiminta-arvoksi.

-Petri Räsänen


Haluatko kuulla, miten Etlian kokeneet asiantuntijat voivat auttaa teitä navigoimaan tässä murroksessa ja hyödyntämään uusia työkaluja hallitusti? Ollaan yhteydessä!

Etlia vahvistaa kumppanuutta Databricksin kanssa – kohti datan ja tekoälyn edelläkävijyyttä

Etlia Oy on nyt rekisteröity Databricks-kumppani, vahvistaen asemaansa Databricks-ratkaisuiden asiantuntijana Suomessa. Kumppanuuden myötä Etlia pystyy tarjoamaan asiakkailleen entistä kokonaisvaltaisempia palveluita, joissa yhdistyvät Etlian asiantuntemus ja Databricksin maailmanlaajuisesti johtava yhtenäinen data- ja tekoälyalusta. 

Etlian tavoitteena on auttaa suomalaisia organisaatioita hyödyntämään dataa liiketoimintansa kasvun, päätöksenteon ja innovaatiokyvyn tukena. Databricksin teknologia mahdollistaa datan hallinnan, jalostamisen ja analysoinnin samassa ympäristössä, mikä nopeuttaa asiakkaiden datavetoisten hankkeiden toteutusta ja tekoälyratkaisujen käyttöönottoa. 

Etlia tarjoaa sekä Professional- että Associate-tason sertifioituja Databricks-konsultteja, joilla on useiden vuosien kokemus Databricksista. 

”Haluamme olla asiakkaidemme pitkäaikainen kumppani datan hyödyntämisessä ja tekoälyn soveltamisessa. Databricksin avulla pystymme tarjoamaan ratkaisuja, jotka todella skaalautuvat ja tukevat organisaatioiden kasvua tulevaisuudessa. Kumppanuuden syventäminen on tärkeä askel Etlian strategiassa,” sanoo Etlian toimitusjohtaja Juuso Maijala 

Lue lisää Etlian Databricks-kumppanuudesta.


Lisätietoja: 


Partner & Senior Data Engineer, Raaju Srinivasa Raghavan 
raaju@etlia.fi 

Snowflake AI – Helppo ja nopea ottaa käyttöön tietoturvallisesti

Generatiivinen tekoäly ja Snowflake Cortex AI tarjoavat uusia mahdollisuuksia datan hyödyntämiseen. Tässä blogissa käydään läpi Cortex AI:n ominaisuudet, kuten valmiit funktiot, Cortex Analyst, Cortex Search ja Document AI – sekä niiden käyttötapauksia liiketoiminnan näkökulmasta.

Generatiivinen tekoäly on ollut viime vuosina vahvasti esillä julkisessa keskustelussa. Vaikka perinteistä koneoppimista on hyödynnetty yrityksissä jo pitkään, esimerkiksi ChatGPT:n kaltaisten työkalujen ilmestyminen on tuonut tekoälyn laajemman yleisön saataville. Siinä missä aihe aiemmin puhutti lähinnä siihen vihkiytyneitä, on siitä tullut nyt osa myös laajempaa keskustelua. 

Myös teknologiatoimittajien suuret panostukset generatiiviseen tekoälyyn ovat helpottaneet aiheen lähestymistä yhä laajemmalle yleisölle. Samaan aikaan kehitys on ollut huimaa – lähes päivittäin julkaistaan uutisia uusista ominaisuuksista ja työkaluista. Tämä vauhti voi kuitenkin tehdä kokonaisuuden hahmottamisesta haastavaa niille, jotka vasta tutustuvat aiheeseen tai suunnittelevat tekoälyn hyödyntämistä. On vaikea tietää, mistä aloittaa ja mitä mahdollisuuksia ylipäätään olisi käytettävissä. 

Tässä blogissa käydään läpi Snowflaken Cortex AI -ratkaisua, sen tarjoamia mahdollisuuksia sekä joitakin keskeisiä käyttötapauksia. Tarkoituksena ei ole antaa kattavaa kuvausta kaikista ominaisuuksista, vaan ennemminkin nostaa esiin muutamia mielenkiintoisia toiminnallisuuksia ja tarjota hyvä lähtöpiste tarkempaan syventymiseen. 

Snowflake Cortex AI

Snowflake kutsuu tekoäly- ja koneoppimisisratkaisuaan Cortex AI:ksi. Cortex kuuluu kiinteänä osana Snowflakeen, jolloin sen ominaisuudet ovat suoraan käytettävissä ilman erillisiä asennuksia ja konfigurointeja. Tämä helpottaa käyttöönottoa ja itse käyttöä tarjoamalla: 

  • Saman skaalautuvuuden kuin Snowflake muutenkin, eli sopeutuu niin pienille kuin suurillekin yrityksille.
  • Data säilyy koko ajan Snowflaken sisällä, mikä yksinkertaistaa compliancen ja governancen hallintaa.
  • Käyttöoikeuksien määrittely tapahtuu samalla rooleihin perustuvilla ominaisuuksilla, kuin muutenkin Snowflakessa.
  • Monia Cortexin toiminallisuuksia voidaan käyttää suoraan Snowsight-konsolista ilman erillistä koodausta, mikä helpottaa varsinkin alkuvaiheessa. 
  • Cortex mahdollistaa monia eri tapoja hyödyntää malleja. Cortexissa on useita valmiita malleja eri toimittajilta, joita voi tarvittaessa itse jatkokehittää tai mukaan voi tuoda myös omia malleja.

Valmiit funktiot 

Koneoppisen funktioilla saadaan automatisoitua ennusteiden ja lisätietojen tuottamista. Funktiot on suunniteltu kutsuttavaksi SQLla ja Pythonilla ja niitä voidaan käyttää kiinteänä osana muuta workflowta. Snowflaken AI&ML Studio mahdollistaa funktioiden määrittelyn suoraan myös käyttöliittymästä. Funktiota voidaan käyttää mm. aikasarjoissa, hyödyntäen niitä tietyn arvon ennustamiseen, poikkeamien tunnistamiseen tai luokitteluun. Tällaisia käyttötapauksia voivat olla esimerkiksi: 

  • Kysynnän tai myynnin ennustaminen historiallisen datan perusteella 
  • Poikkeavuuksien tunnistaminen IT-lokeissa tai taloustapahtumissa 
  • Asiakaspalveluun tulevien viestien luokittelu 

LLM funktioita käytetään kirjoitettuun kieleen liittyvissä toimenpiteissä. Funktiot ovat valmiiksi käytettävissä Snowflakessa olevilla malleilla, jolloin käyttöönotto on helppoa ja niitä voidaan kutsua suoraan tai liittämällä jo olemassa oleviin toteutuksiin. Myös nämä funktiot ovat suunniteltu käytettäväksi hyödyntäen SQLlaa tai Pythonia. Funktioita voidaan hyödyntää moninaisissa yhteyksissä, kuten esimerkiksi kielenkäännöksissä, tiivistelmien laatimisessa tai tunnetilan analysoinnissa. Käyttötapauksia LLM funktioiden hyödyntämisessä ovat: 

  • Tarkkojen tietojen haku suurista tekstiaineistoista 
  • Asiakirjojen, raporttien tai artikkeleiden tiivistäminen 
  • Palautteen analysointi positiiviseksi tai negatiiviseksi jatkotoimenpiteitä varten 
  • Usealla eri kielellä olevien tekstien kääntäminen samalle kielelle 

Cortex Analyst


Cortex Analyst puolestaan mahdollistaa ei-teknisille käyttäjille tiedon hakemisen luonnollisella kielellä – ilman SQL-taitoja. Se toimii siltana liiketoiminnan ja datan välillä. Cortex Analystia käytettäessä LLM muuntaa käyttäjän kysymyksen SQL kielelle, jolla haetaan vastaus lähteenä käytettävästä strukturoidusta datasta, kuten esimerkiksi tietovarastosta. Vastauksen yhteydessä saadaan myös selite, kuinka kysymys on ymmärretty sekä SQL-lause, josta selviää mistä tieto haettu. Tämä lisää käyttäjäystävällisyyttä vähentämällä väärinymmärrysten määrää. Vinkit kysymyksen muotoiluun sekä ilmoitukset tilanteissa, joissa vastausta ei voida antaa – vaikkapa puutteellisen datan vuoksi – auttavat käyttäjää toimimaan järjestelmän kanssa tehokkaammin ja luotettavammin. 

Kuten muissakin Cortex AI -ominaisuuksissa, myös Cortex Analyst hyödyntää samoja käyttöoikeusrakenteita kuin muualla Snowflakessa. Tämä mahdollistaa helpon ja yhtenäisen oikeuksien hallinnan. Ominaisuus on käytettävissä ulkopuolisista sovelluksista API-rajapinnan kautta, ja se toimii myös yhdessä Snowflaken sisäisen Streamlitin kanssa, jonka avulla voidaan rakentaa nopeasti interaktiivisia sovelluksia. Cortex Analystin käyttötapauksia ovat esimerkiksi: 

  • Tiedon kysely tarkemmalla tasolla kuin mitä yrityksen perusraportointi tarjoaa 
  • Yksittäisen tiedon hakeminen tietovarastosta tiettyä käyttötapausta varten 
  • Erilaiset ad hoc -datatarpeet, joita ilmenee tietovaraston käytön yhteydessä 

Cortex Search 

Cortex Search -hakupalvelua käytetään tietojen hakemiseen laajoista tietomassoista kirjoitetun tekstin avulla. Se on suunniteltu erityisesti strukturoimattoman datan, kuten dokumenttien, käsittelyyn. Hakutoiminnassa hyödynnetään suuria kielimalleja (LLM) ja RAG-tekniikkaa (Retrieve, Augment, Generate), jolloin haun tuloksena syntyy tarkempia ja kontekstuaalisempia vastauksia. Vastaukset perustuvat aina ennalta määriteltyihin lähteisiin, mikä auttaa minimoimaan hallusinaatioiden riskiä. 

Hakupalvelun käyttöönotto onnistuu joko manuaalisesti tai käyttöliittymän kautta hyödyntäen Snowflake AI/ML Studiota. Yksinkertaisimmillaan hakupalvelun pystytys etenee seuraavasti: 

  • Valitaan käytettävä kielimalli 
  • Määritetään palvelun tallennuspaikka 
  • Osoitetaan, mistä datasta vastaukset haetaan 
  • Määritetään indeksoinnin aikataulu, jotta vastaukset pysyvät ajan tasalla 

Hakupalvelua voidaan käyttää Snowflaken sisällä käyttöliittymäpohjaisella Cortex Playgroundilla tai – kuten Cortex Analystin kohdalla – myös API-rajapinnan kautta tai Streamlitin avulla. Käyttötapauksia ovat esimerkiksi: 

  • Tiedon tarjoaminen kirjoitetun kielen kautta yleisissä käyttötapauksissa 
  • Hakumoottorina toimivat chatbotit, joita voidaan hyödyntää esimerkiksi asiakaspalvelussa 
  • Yrityksen sisäinen hakupalvelu, jonka avulla työntekijät löytävät nopeasti tietoa esimerkiksi matkustus- tai IT-hankintaohjeista 

Document AI


Document AI mahdollistaa tietojen poimimisen yrityksen strukturoimattomasta datasta (esimerkiksi sopimukset, laskut, kuittien kuvat, lomakkeet tai käsin kirjoitetut asiakirjat) ja tallentaa tiedot strukturoituun muotoon tietokantaan jatkokäsittelyä varten. Tällä ominaisuudella saadaan vähennettyä manuaalista työtä, käsittelyaikaa ja inhimillisiä virheitä. 

Tietojen poimimisen prosessi saadaan myös automatisoitua, jolloin poiminta tapahtuu automaattisesti esimerkiksi uuden dokumentin tultua saataville. Poimittuja tietoja voidaan hyödyntää osana jo olemassa olevaa tietovirtaa. 

Palvelu voidaan määritellä suoraan Snowflaken käyttöliittymästä. Määrittelyvaiheessa käyttäjä esittää kysymyksiä halutuista tiedoista, jolloin malli oppii poimimaan olennaisen sisällön dokumenteista. Mallin opettaminen tapahtuu graafisen käyttöliittymän kautta, mikä poistaa teknisen erikoisosaamisen vaatimuksen ja mahdollistaa liiketoimintaosaajien osallistumisen suoraan prosessiin. 

Poimitut tiedot voidaan tallentaa esimerkiksi tietovaraston tauluihin jatkokäyttöä varten tai hyödyntää osana olemassa olevaa workflow’ta. Document AI -ratkaisua voidaan käyttää esimerkiksi: 

  • Käyttötapauksissa, joissa halutaan poimia tietoja dokumenteista strukturoituun muotoon 
  • Dokumenttien tarkistuksen automatisoinnissa, kuten allekirjoitusten olemassaolon tunnistamisessa 
  • Käsin täytettyjen lomakkeiden tietojen poimimisessa helposti hyödynnettävään muotoon 

Huomioita ennen käyttöönottoa 

Snowflake Cortex AI tarjoaa laajan ja kattavan valikoiman valmiita AI/ML-ominaisuuksia liiketoiminnan tueksi. Käyttöönotto on tehty helpoksi monien sisäänrakennettujen työkalujen ja käyttöliittymien ansiosta. On kuitenkin tärkeää huomioida myös muita näkökulmia ennen ratkaisujen viemistä tuotantoon – erityisesti dataan liittyviä. Alla muutamia keskeisiä huomioita: 

  • Käyttötapaukset: Käyttötapausten huolellisella suunnittelulla on keskeinen rooli. Mitä ongelmaa ollaan ratkaisemassa? Mikä on tavoiteltu lopputulos? Mitkä ovat sen vaikutukset, hyödyt ja liiketoiminnalliset tavoitteet? 
  • Data-arkkitehtuuri: Tukeeko nykyinen data-arkkitehtuuri AI/ML-ratkaisujen käyttöönottoa? Kuinka pitkälle voidaan hyödyntää olemassa olevia rakenteita? Tarvitaanko muutoksia, jotta arkkitehtuuri tukee tekoälyn ja koneoppimisen tarpeita? Ideaalisti AI/ML on yksi datan hyödyntäjistä ja tuottajista muiden joukossa. 
  • Datan ja sen laatu: Onko tarvittava data jo olemassa tai hankittavissa käyttötapaukseen? Mikä on datan nykyinen laatu? Tarvitaanko toimenpiteitä, jotta data täyttää laatuvaatimukset? Laadukas data on onnistuneen tekoälyratkaisun perusta. 
  • AI on yhtä hyvä kuin datasi! 

-Asko Ovaska 

Etlia on toteuttamassa useita Snowflake-ratkaisuja eri asiakkaille – mikäli kiinnostuit tai haluat kuulla lisää, ota rohkeasti yhteyttä!

.