Vko 14 tekoälysää
”Nyt tapahtuu paljon ja äkkiä”, sanoo Jafar Disneyn Aladdin-piirroselokuvassa. Tarinassa Jafar on sulttaanin vallanhimoinen neuvonantaja, joka on juuri toivonut pullonhengeltä muuttuvansa maailman mahtavimmaksi noidaksi.
Viikoittainen tekoälysää on suurin piirtein yhtä sekava kattaus tapahtumia, ennusteita, visioita, toiveita ja realiteetteja. Yhtäällä pilvistä kokonaiselle mantereelle, toisaalla paikallista auringonpaistetta.
Lännen suunnalla pilvisen ja paikallisen eräänlainen kirittävä kilpajuoksu on jälleen uudella kisakaudella, kun Anthropicilta oli vuotanut tieto Opus 6 mallista, joka on kätevästi erittäin raflaavien vuodettujen tietojen mukaan niin kyvykäs, että sitä ei yksinkertaisesti uskalleta julkaista kuin osissa.
Kyseessä voi olla markkinatemppu, mutta viime syksyn tapahtumien valossa ajatuksessa on myös realismia, sillä vuoden 2025 loppupuolella Anthropicin tekoälymalleja hyödynnettiin agenttisesti massiivisten kyberoperaatioiden pääosin autonomiseen toteuttamiseen. Samanaikaisesti kyljelleen mennyt sopimus Pentagonin kanssa on pelkästään nostattanut Anthropicin profiilia OpenAI rinnalla pisteeseen, jossa kuormanhallinnan nimissä joudutaan rajoittamaan kapasiteettia korkean kysynnän aikoihin. Tämä kuulostaa tutulta kotimaisista pörssisähköuutisista menneen talven osalta.
Kenties viikon viraalein tekoälyuutinen oli se, että osa Claude Coden lähdekoodia vuosi julkisuuteen, paljastaen osin eriskummallisia näkymiä tekoälysovelluksen toimintaan. Esimerkiksi sen, kuinka paljon regex-koodia järjestelmässä on. Suurin ironia on kuitenkin turvallisuuteen keskittyvän julkilausuman ja todistettujen virheiden välissä.
OpenAI suunnalla ei ole mennyt myöskään niin sanotusti putkeen. Lupaavalta vaikuttanut yhteistyö Disneyn kanssa Sora-mallin tiimoilta on tietojen mukaan kuopattu. Kokonaisuutena vaikuttaa siltä, että OpenAI koettu etumatka muihin yhtiöihin saattaa valua hiekkaan, vaikkakin Codex on saavuttanut jo miljoonia käyttäjiä eikä varsinaisesti malleissa ole mitään vikaa. Marginaalit parhaiden mallien välillä ovat sen sijaan kaventuneet jatkuvasti.
Googlen uusin additio, henkilökohtaisesti hartaasti odotettu Gemma 4 avoimien painojen malliperhe on-premise eli paikallisiin ratkaisuihin julkaistiin juuri ennen pitkäperjantaita. Benchmark-tulosten valossa kyseessä on jopa uskomattoman kyvykäs ja kevyt malli, jonka suurimmat variantit kilpailevat aiemman Gemini 2.5 mallin kanssa melkeinpä jokaisessa mitattavassa suorituskyvyssä. Toisaalta nopeat käytännön testit osoittivat 4-sukupolven mallien olevan kenties hieman huonompia suomen kielessä kuin aiempi sukupolvi.
Idän ilmastossa lusikkansa soppaan toi Alibaba Cloud Qwen 3.6-Plus mallilla, joka vähemmän yllättäen roikkuu mukana testitilastojen kärkikahinoissa maanmiestensä GLM-5 ja Kimi 2.5 kanssa.
Hieman aiemmin, vanhalla mantereella Mistral julkaisi uuden Mistral Small 4 mallin, joka on jo perinteeksi muodostuen perässä yhdysvaltalaisia ja kiinalaisia vastinkappaleitaan, mutta samalla ainut varteenotettava eurooppalainen vaihtoehto. Trendi vaikuttaa varsin pysyvältä tilalta, jossa lännen ja idän korkeapaineen keskusten väliin jää matalapaineen keskus.
Datakeskusten osalta uutiset ovat olleet tuulisia, sillä samalla kun kasvavat käyttäjämäärät tekoälypalveluille edellyttävät uutta kapasiteettia, esimerkiksi Yhdysvalloissa on uutisoitu odotettavan myöhästymisiä ja peruuntumisia jopa puolelle käynnissä olevista hankkeista. Suurimmaksi syyksi esitetään energiatuotannon pullonkaulaa, mutta maailmantilanteen epävarmuuksien vaikutukset rahoitusmarkkinoille lienevät myös potentiaalisia vaikuttimia.
Kokonaisuudessaan, nimenomaisesti kielimallien osalta, tekoälysää on ollut tapahtumarikas mutta samalla demokratisoiva. Jo tutkitusti avoimien painojen mallit, kuten mainittu Gemma 4, ovat noin 6-12 kuukautta jäljessä pilvipalveluina tarjottavia ”proprietary” malleja. Samanaikaisesti suurimpien eri tarjoajien mallien väliset tasoerot jatkavat tasoittumistaan. Markkinatalouden logiikan mukaisesti molempien suuntauksien pitäisi olla käyttäjälle pelkästään positiivisia asioita.
Mielenkiintoisena yksityiskohtana oli nostettu esille, että Microsoftin Copilotin käyttöehdoissa (terms and conditions) lukee seuraava lause: Copilot is for entertainment purposes only. … Don’t rely on Copilot for important advice. Tietysti kyseessä on tyypillinen, lainopillinen käsienpesu työkalun käytöstä, mutta se silti korostaa realiteettien ja juhlapuheiden välisiä eroja. Suurten irtisanomisuutisten taustalla esimerkiksi Remote Labor Index benchmarkin mukaan tämän hetken automaatioaste on alle viidessä prosentissa parhaille malleille.
Pienet präntit suurien puheiden taustalla kannattaa tarkistaa, jotta todellisuusankkurit pysyvät vauhdissa mukana. Jafarinkin olisi pitänyt muistaa lukea viimeisen toiveensa käyttäjäehdot.
Lauri Vasankari
Vanhempi AI konsultti