Snowflake World Tour 2025 – mitä uutta datan, tekoälyn ja sovellusten maailmassa? 

Snowflake World Tour 2025 -tapahtuma järjestettiin tänä vuonna 14.10. Tukholmassa. Paikkana oli jälleen kuten aikaisemminkin 3 Arena. Tapahtumassa oli yli 1500 osallistujaa, joille oli tarjolla 33 sessiota 57 puhujan voimin 11 eri liiketoiminnan alueelta. Useat eri osa-alueiden sessiot datan, tekoälyn ja sovelluskehityksen näkökulmista mahdollistivat jokaiselle koota oman agendan päivälle – niin myös minulle. 

Päivää täydensi myös useiden eri partnereiden omat standit, jotka mahdollistivat tutustumisen uusiin teknologisiin vaihtoehtoihin sekä vaihtaa ajatuksia tuttujen partnereiden kanssa. Ei myöskään sovi unohtaa tapahtuman tarjoamaa mahdollisuutta ajatusten vaihtoa tapahtumaan osallistuneiden kesken. 

Snowflake World Tour 2025 Keynote-puheenvuorot

Keynote –puheenvuorot tarjosivat kattavan katsauksen siihen, miten Snowflake näkee datan, tekoälyn ja sovellusten yhteispelin muuttamassa liiketoimintaa. Esityksissä korostettiin, että datan merkitys liiketoiminnassa ei enää rajoitu pelkkään raportointiin, vaan siitä tulee yhä vahvemmin liiketoimintaa vauhdittava voima: tekoälyn, sovellusten ja analytiikan yhteispeli ratkaisee voittajat.  

Keynote -puheenvuoroissa käytiin läpi, kuinka Snowflake voi tukea koko datan elinkaaren aikana keräämisestä analytiikkaan ja sovelluksiin toimien samalla saumattomasti ja skaalautuvasti unohtamatta tietoturvaa ja datan hallintaa. 

Globaalisti toimivat yritykset esittivät kuinka ne hyödyntävät Snowflakea toiminnassaan: 

  • Siemens korosti käytön helppoutta: datan hyödyntämisen yksinkertaistaminen sadoille tiimeille innovoinnin vauhdittamiseksi globaalisti. 
  • Fiserv. / Paypal korosti turvallisen ja reaaliaikaisen datayhteistyön mahdollistamista globaalissa maksuekosysteemissä. 
  • AstraZeneca korosti datan jakamista globaaliin tutkimukseen turvallisesti ja hallitusti. 

Muutama uusi julkistus saatiin Tukholmassa kuten:

  • Snowflake tulee saataville AWS European Sovereing Cloudiin  
  • Snowflake nyt livenä myös Microsoft Azuren Sweden Central Regionissa 
  • Snowpark connect for Apache Spark mahdollistaa Spark koodin ajon Snowflaken warehousessa 

Monipuoliset esitykset datasta, tekoälystä ja sovelluskehityksestä

Päivän aikana oli tarjolla useita eri esityksiä/puheenvuoroja monelta eri osa-alueelta:  

  • teknisiä hands-on esityksiä 
  • asiakkaiden- ja partnereiden ratkaisujen esittelyitä 
  • monipuolisia läpikäyntejä Snowflaken ominaisuuksista 
  • erilaisia paneelikeskusteluja datan ympärillä 

Vaikka nykyään kaikkien huulilla on AI ja sen mahdollisuudet, tapahtumassa oli kiitettävästi esityksiä, joissa käytiin läpi, mitä vaaditaan AI hyödyntämiseen käytännössä.  

Alla muutamia nostoja esityksiä, joita itse kävin kuuntelemassa: 

Snowflake Openflow ja AI SQL: käytännön mahdollisuuksia 2025

Snowflake Openflow – tietojen integrointiin

Tässä läpikäynnissä esiteltiin Openflown tarjoamia mahdollisuuksia datan integraatioista. Openflowin visiona on pystyä lataamaan dataa kaikista lähteistä kaikkiin kohteisiin. 

Päähuomioita Snowflake OpenFlowsta: 

  • Useita eri deployment mahdollisuuksia, jotka mahdollistavat myös latausten ajamisen omassa pilvessä. 
  • Erittäin kattavat valmiiksi rakennetut liittymät, mutta mahdollisuus määrittää myös omia liittymiä. 
  • Helppo hallinnoida ja turvallinen edistyneellä autentikaatiolla ja oikeuksien jaolla 
  • Mahdollistaa Snowpipe Streaming käytön data virtojen lähes reaaliaikaiseen striimaukseen. 
  • Reaaliaikainen data putkien valvonta ja varoitukset 

AI-ominaisuuksia datan hyödyntämiseen

Esityksessä esiteltiin Snowflaken tarjoamia AI ominaisuuksia, jotka helpottavat yrityksiä saamaan enemmän irti datastaan. Esityksessä korostettiin myös partnereiden tarjoamia palveluita, joita voidaan hyödyntää kätevästi. 

Päähuomioita AI-ominaisuuksista: 

  • Cortex Search mahdollistaa nopean ja tekoälyä hyödyntävän tekstidatan haun hyödyntäen hybridi­haku­moottoria (avainsana + vektori -yhdistelmä). Tämä tarjoaa ominaisuuksia kuten automaattisen indeksoinnin, luonnollisen kielen kyselyt ja helpon integroinnin RAG-sovelluksiin. 
  • AI SQL mahdollistaa luonnollisen kielen kyselyt, automaattiset koodin täydennykset ja koneoppimismallien käytön suoraan SQL-koodissa. 
  • Semantic Views mahdollistaa liiketoiminnan käsitteiden, kuten mittareiden, dimensioiden ja faktojen, mallintamisen suoraan tietokannassa yhtenäisessä loogisessa kerroksessa. 
  • Cortex Analyst mahdollistaa luonnollisen kielen kyselyt rakenteellisesta datasta suoraan ilman, että käyttäjän tarvitsee kirjoittaa SQL:ää 
  • Snowflake Intelligence yhdistää edellä mainitut ja on agenttien kautta toimiva tekoälyratkaisu, jonka avulla käyttäjät voivat keskustella luonnollisella kielellä niin rakenteellisen kuin rakenteettomankin datan kanssa, saada välittömiä vastauksia, visualisointeja ja toimintasuosituksia. 

Datan hallinta ja kustannusten optimointi Snowflake World Tour 2025 -esityksissä

Datan turvallisuus ja sensitiivisen tiedon hyödyntäminen Snowflakessa

Esityksessä käytiin Snowflaken tarjoamia mahdollisuuksia rakentaa datan sensitiivisyyden näkökulmasta kestäviä ratkaisuja, jotka mahdollistavat datan oikeaoppisen käsittelyn palvellen liiketoimintaa. 

Päähuomioita ja nostoja: 

  • Yksinkertaisia keinoja: Tiedon jättäminen pois tai tietojen yhdistäminen tarvittavalle tasolle. 
  • Tietoja ei voi jakaa kaikille – Voidaan hyödyntään Private listings Snowflake Marketplacessa vain valituille asiakkaille ja kumppaneille. 
  • Halutaan jakaa vain hyödyntäjän oma data – Voidaan hyödyntää Secure Views ja/tai UDF, jolloin voidaan määritellä, että vain halutut tiedot jaetaan 
  • Ei voida näyttää henkilötietoja – Voidaan hyödyntää Dynamic Masking -ominaisuutta henkilötietojen piilottamiseen. Jos henkilötietoja tarvitaan esimerkiksi tietojen yhdistämiseen, voidaan hyödyntää Projection policies –ominaisuutta, mikä mahdollistaa tietojen yhdistämisen ilman tietojen näkymistä. 
  • Useiden osapuolten yhteinen analysointi – Voidaan käyttää Data Clean Room -ominaisuutta, jossa useat eri osapuolet voivat yhdistää ja analysoida dataan yhdessä ilman, että raakatietoja paljastetaan osapuolille. 

Snowflaken tarjoamat ominaisuudet tekevät tietoturvallisesta ja hallitusta datan jakamisesta entistä helpompaa – sekä yhteistyökumppaneiden välillä että organisaation sisällä.
Lue lisää Snowflaken hyödyntämisestä ja tietoturvallisesta käyttöönotosta Etlian blogista.

Snowflaken käytön ja kustannusten optimointi 

Esityksessä käytiin läpi mahdollisuuksia seurata ja optimoida Snowflaken käyttöä ja kustannuksia. Tämä jaettiin kolmeen eri osa-alueeseen: näkyvyys, kontrolli ja optimointi. 

Snowflake tarjoaa kaikille näille osa-alueille sisäänrakennettuja ratkaisuja:

Näkyvyys – Kulujen ymmärtäminen ja suorituskyky  

  • Tili- ja organisaatiotason kustannusten seuranta 
  • Kustannusten poikkeavuuksien seuranta auttaa tunnistaan kuluja paljon kasvattamat tapahtumat 
  • Suorituskyvyn seurannalla voi reaaliaikaisesti ja historiallisen datan perusteella seurata kyselyjen suorituskykyä, varastojen kuormitusta ja taulukoiden muutoksia. 
  • Voidaan ryhmitellä toisiinsa liittyvät kyselyt – kuten toistuvat, ajastetut tai monivaiheiset kyselyt helpottamaan resurssien käyttöä ja pullonkauloja. 

Kontrolli – Rajoita ja hallitse kulutusta 

  • Kulurajojen asettaminen tili-, resurssi- ja tag-tasolle mahdollistaa kulujen rajoittamisen. 
  • Warehousien koolla ja skaalautuvuudella voidaan määrittää käytössä olevia resursseja. 
  • Auto-suspendillä voidaan määrittää warehouselle automaattinen sammumisaika, kun se ei käytössä. 
  • Resurssi monitoreilla voidaan tarkkailla warehousien toimitaan ja käyttöä 
  • Adaptiiviset warehouset määrittävät itse tarvittavat resurssit tehtävän suorittamiseen. 

Optimointi – Kulujen ja toiminnan optimointi 

  • Warehouse käyttöaste metriikoilla voidaan seurata, kuinka resursseja on käytetty suhteessa varattuun kapasiteettiin. 
  • Pruning historia näkymillä nähdään, kuinka hyvin tietokannassa tapahtuva mikro-partitioiden karsinta (pruning) on kyselyssä onnistunut. 
  • Kyselyjen tiedot, joka tunnistaa automaattisesti suorituskykyyn vaikuttavia kyselyolosuhteita ja tarjoaa käyttäjälle selkeän viestin ongelmasta sekä ehdotuksia sen korjaamiseen. 
  • Kustannusten tiedot, joka tunnistaa mahdollisuuksia kustannusten optimointiin ja näyttää, missä voi säästää krediittejä tai tallennustilaa. 

Miksi Snowflake World Tour 2025 oli käymisen arvoinen

Snowflake World Tour oli jälleen kerran käymisen arvoinen tapahtuma, josta löytyy kaikille jotain ja helposti räätälöitävissä itselle sopivaksi. Oli sitten kyseessä asiakas, partneri tai Snowflaken käyttöönottoa harkitseva, tapahtuma antaa kokonaisvaltaisen kuvan Snowflakesta ja sen tarjoamista mahdollisuuksista. Ensi vuonna varmasti uudestaan. 


Asko Ovaska 

Partner, Seniori konsultti, Etlia Oy 

Snowflake AI – Helppo ja nopea ottaa käyttöön tietoturvallisesti

Generatiivinen tekoäly ja Snowflake Cortex AI tarjoavat uusia mahdollisuuksia datan hyödyntämiseen. Tässä blogissa käydään läpi Cortex AI:n ominaisuudet, kuten valmiit funktiot, Cortex Analyst, Cortex Search ja Document AI – sekä niiden käyttötapauksia liiketoiminnan näkökulmasta.

Generatiivinen tekoäly on ollut viime vuosina vahvasti esillä julkisessa keskustelussa. Vaikka perinteistä koneoppimista on hyödynnetty yrityksissä jo pitkään, esimerkiksi ChatGPT:n kaltaisten työkalujen ilmestyminen on tuonut tekoälyn laajemman yleisön saataville. Siinä missä aihe aiemmin puhutti lähinnä siihen vihkiytyneitä, on siitä tullut nyt osa myös laajempaa keskustelua. 

Myös teknologiatoimittajien suuret panostukset generatiiviseen tekoälyyn ovat helpottaneet aiheen lähestymistä yhä laajemmalle yleisölle. Samaan aikaan kehitys on ollut huimaa – lähes päivittäin julkaistaan uutisia uusista ominaisuuksista ja työkaluista. Tämä vauhti voi kuitenkin tehdä kokonaisuuden hahmottamisesta haastavaa niille, jotka vasta tutustuvat aiheeseen tai suunnittelevat tekoälyn hyödyntämistä. On vaikea tietää, mistä aloittaa ja mitä mahdollisuuksia ylipäätään olisi käytettävissä. 

Tässä blogissa käydään läpi Snowflaken Cortex AI -ratkaisua, sen tarjoamia mahdollisuuksia sekä joitakin keskeisiä käyttötapauksia. Tarkoituksena ei ole antaa kattavaa kuvausta kaikista ominaisuuksista, vaan ennemminkin nostaa esiin muutamia mielenkiintoisia toiminnallisuuksia ja tarjota hyvä lähtöpiste tarkempaan syventymiseen. 

Snowflake Cortex AI

Snowflake kutsuu tekoäly- ja koneoppimisisratkaisuaan Cortex AI:ksi. Cortex kuuluu kiinteänä osana Snowflakeen, jolloin sen ominaisuudet ovat suoraan käytettävissä ilman erillisiä asennuksia ja konfigurointeja. Tämä helpottaa käyttöönottoa ja itse käyttöä tarjoamalla: 

  • Saman skaalautuvuuden kuin Snowflake muutenkin, eli sopeutuu niin pienille kuin suurillekin yrityksille.
  • Data säilyy koko ajan Snowflaken sisällä, mikä yksinkertaistaa compliancen ja governancen hallintaa.
  • Käyttöoikeuksien määrittely tapahtuu samalla rooleihin perustuvilla ominaisuuksilla, kuin muutenkin Snowflakessa.
  • Monia Cortexin toiminallisuuksia voidaan käyttää suoraan Snowsight-konsolista ilman erillistä koodausta, mikä helpottaa varsinkin alkuvaiheessa. 
  • Cortex mahdollistaa monia eri tapoja hyödyntää malleja. Cortexissa on useita valmiita malleja eri toimittajilta, joita voi tarvittaessa itse jatkokehittää tai mukaan voi tuoda myös omia malleja.

Valmiit funktiot 

Koneoppisen funktioilla saadaan automatisoitua ennusteiden ja lisätietojen tuottamista. Funktiot on suunniteltu kutsuttavaksi SQLla ja Pythonilla ja niitä voidaan käyttää kiinteänä osana muuta workflowta. Snowflaken AI&ML Studio mahdollistaa funktioiden määrittelyn suoraan myös käyttöliittymästä. Funktiota voidaan käyttää mm. aikasarjoissa, hyödyntäen niitä tietyn arvon ennustamiseen, poikkeamien tunnistamiseen tai luokitteluun. Tällaisia käyttötapauksia voivat olla esimerkiksi: 

  • Kysynnän tai myynnin ennustaminen historiallisen datan perusteella 
  • Poikkeavuuksien tunnistaminen IT-lokeissa tai taloustapahtumissa 
  • Asiakaspalveluun tulevien viestien luokittelu 

LLM funktioita käytetään kirjoitettuun kieleen liittyvissä toimenpiteissä. Funktiot ovat valmiiksi käytettävissä Snowflakessa olevilla malleilla, jolloin käyttöönotto on helppoa ja niitä voidaan kutsua suoraan tai liittämällä jo olemassa oleviin toteutuksiin. Myös nämä funktiot ovat suunniteltu käytettäväksi hyödyntäen SQLlaa tai Pythonia. Funktioita voidaan hyödyntää moninaisissa yhteyksissä, kuten esimerkiksi kielenkäännöksissä, tiivistelmien laatimisessa tai tunnetilan analysoinnissa. Käyttötapauksia LLM funktioiden hyödyntämisessä ovat: 

  • Tarkkojen tietojen haku suurista tekstiaineistoista 
  • Asiakirjojen, raporttien tai artikkeleiden tiivistäminen 
  • Palautteen analysointi positiiviseksi tai negatiiviseksi jatkotoimenpiteitä varten 
  • Usealla eri kielellä olevien tekstien kääntäminen samalle kielelle 

Cortex Analyst


Cortex Analyst puolestaan mahdollistaa ei-teknisille käyttäjille tiedon hakemisen luonnollisella kielellä – ilman SQL-taitoja. Se toimii siltana liiketoiminnan ja datan välillä. Cortex Analystia käytettäessä LLM muuntaa käyttäjän kysymyksen SQL kielelle, jolla haetaan vastaus lähteenä käytettävästä strukturoidusta datasta, kuten esimerkiksi tietovarastosta. Vastauksen yhteydessä saadaan myös selite, kuinka kysymys on ymmärretty sekä SQL-lause, josta selviää mistä tieto haettu. Tämä lisää käyttäjäystävällisyyttä vähentämällä väärinymmärrysten määrää. Vinkit kysymyksen muotoiluun sekä ilmoitukset tilanteissa, joissa vastausta ei voida antaa – vaikkapa puutteellisen datan vuoksi – auttavat käyttäjää toimimaan järjestelmän kanssa tehokkaammin ja luotettavammin. 

Kuten muissakin Cortex AI -ominaisuuksissa, myös Cortex Analyst hyödyntää samoja käyttöoikeusrakenteita kuin muualla Snowflakessa. Tämä mahdollistaa helpon ja yhtenäisen oikeuksien hallinnan. Ominaisuus on käytettävissä ulkopuolisista sovelluksista API-rajapinnan kautta, ja se toimii myös yhdessä Snowflaken sisäisen Streamlitin kanssa, jonka avulla voidaan rakentaa nopeasti interaktiivisia sovelluksia. Cortex Analystin käyttötapauksia ovat esimerkiksi: 

  • Tiedon kysely tarkemmalla tasolla kuin mitä yrityksen perusraportointi tarjoaa 
  • Yksittäisen tiedon hakeminen tietovarastosta tiettyä käyttötapausta varten 
  • Erilaiset ad hoc -datatarpeet, joita ilmenee tietovaraston käytön yhteydessä 

Cortex Search 

Cortex Search -hakupalvelua käytetään tietojen hakemiseen laajoista tietomassoista kirjoitetun tekstin avulla. Se on suunniteltu erityisesti strukturoimattoman datan, kuten dokumenttien, käsittelyyn. Hakutoiminnassa hyödynnetään suuria kielimalleja (LLM) ja RAG-tekniikkaa (Retrieve, Augment, Generate), jolloin haun tuloksena syntyy tarkempia ja kontekstuaalisempia vastauksia. Vastaukset perustuvat aina ennalta määriteltyihin lähteisiin, mikä auttaa minimoimaan hallusinaatioiden riskiä. 

Hakupalvelun käyttöönotto onnistuu joko manuaalisesti tai käyttöliittymän kautta hyödyntäen Snowflake AI/ML Studiota. Yksinkertaisimmillaan hakupalvelun pystytys etenee seuraavasti: 

  • Valitaan käytettävä kielimalli 
  • Määritetään palvelun tallennuspaikka 
  • Osoitetaan, mistä datasta vastaukset haetaan 
  • Määritetään indeksoinnin aikataulu, jotta vastaukset pysyvät ajan tasalla 

Hakupalvelua voidaan käyttää Snowflaken sisällä käyttöliittymäpohjaisella Cortex Playgroundilla tai – kuten Cortex Analystin kohdalla – myös API-rajapinnan kautta tai Streamlitin avulla. Käyttötapauksia ovat esimerkiksi: 

  • Tiedon tarjoaminen kirjoitetun kielen kautta yleisissä käyttötapauksissa 
  • Hakumoottorina toimivat chatbotit, joita voidaan hyödyntää esimerkiksi asiakaspalvelussa 
  • Yrityksen sisäinen hakupalvelu, jonka avulla työntekijät löytävät nopeasti tietoa esimerkiksi matkustus- tai IT-hankintaohjeista 

Document AI


Document AI mahdollistaa tietojen poimimisen yrityksen strukturoimattomasta datasta (esimerkiksi sopimukset, laskut, kuittien kuvat, lomakkeet tai käsin kirjoitetut asiakirjat) ja tallentaa tiedot strukturoituun muotoon tietokantaan jatkokäsittelyä varten. Tällä ominaisuudella saadaan vähennettyä manuaalista työtä, käsittelyaikaa ja inhimillisiä virheitä. 

Tietojen poimimisen prosessi saadaan myös automatisoitua, jolloin poiminta tapahtuu automaattisesti esimerkiksi uuden dokumentin tultua saataville. Poimittuja tietoja voidaan hyödyntää osana jo olemassa olevaa tietovirtaa. 

Palvelu voidaan määritellä suoraan Snowflaken käyttöliittymästä. Määrittelyvaiheessa käyttäjä esittää kysymyksiä halutuista tiedoista, jolloin malli oppii poimimaan olennaisen sisällön dokumenteista. Mallin opettaminen tapahtuu graafisen käyttöliittymän kautta, mikä poistaa teknisen erikoisosaamisen vaatimuksen ja mahdollistaa liiketoimintaosaajien osallistumisen suoraan prosessiin. 

Poimitut tiedot voidaan tallentaa esimerkiksi tietovaraston tauluihin jatkokäyttöä varten tai hyödyntää osana olemassa olevaa workflow’ta. Document AI -ratkaisua voidaan käyttää esimerkiksi: 

  • Käyttötapauksissa, joissa halutaan poimia tietoja dokumenteista strukturoituun muotoon 
  • Dokumenttien tarkistuksen automatisoinnissa, kuten allekirjoitusten olemassaolon tunnistamisessa 
  • Käsin täytettyjen lomakkeiden tietojen poimimisessa helposti hyödynnettävään muotoon 

Huomioita ennen käyttöönottoa 

Snowflake Cortex AI tarjoaa laajan ja kattavan valikoiman valmiita AI/ML-ominaisuuksia liiketoiminnan tueksi. Käyttöönotto on tehty helpoksi monien sisäänrakennettujen työkalujen ja käyttöliittymien ansiosta. On kuitenkin tärkeää huomioida myös muita näkökulmia ennen ratkaisujen viemistä tuotantoon – erityisesti dataan liittyviä. Alla muutamia keskeisiä huomioita: 

  • Käyttötapaukset: Käyttötapausten huolellisella suunnittelulla on keskeinen rooli. Mitä ongelmaa ollaan ratkaisemassa? Mikä on tavoiteltu lopputulos? Mitkä ovat sen vaikutukset, hyödyt ja liiketoiminnalliset tavoitteet? 
  • Data-arkkitehtuuri: Tukeeko nykyinen data-arkkitehtuuri AI/ML-ratkaisujen käyttöönottoa? Kuinka pitkälle voidaan hyödyntää olemassa olevia rakenteita? Tarvitaanko muutoksia, jotta arkkitehtuuri tukee tekoälyn ja koneoppimisen tarpeita? Ideaalisti AI/ML on yksi datan hyödyntäjistä ja tuottajista muiden joukossa. 
  • Datan ja sen laatu: Onko tarvittava data jo olemassa tai hankittavissa käyttötapaukseen? Mikä on datan nykyinen laatu? Tarvitaanko toimenpiteitä, jotta data täyttää laatuvaatimukset? Laadukas data on onnistuneen tekoälyratkaisun perusta. 
  • AI on yhtä hyvä kuin datasi! 

-Asko Ovaska 

Etlia on toteuttamassa useita Snowflake-ratkaisuja eri asiakkaille – mikäli kiinnostuit tai haluat kuulla lisää, ota rohkeasti yhteyttä!

.