tiistai 5. helmikuuta 2013

Raakadatasta liiketoimintatietoa


Hyvän kuvan sanotaan olevan tehokkaampi kuin tuhat sanaa. Entä miten on, jos niitä sanoja on miljoonia? Vastaavatko ne tuhansia kuvia vai meneekö suurin osa kuitenkin hukkaan? Big data on käsitteenä nousemassa hype-vaiheeseen, mutta monelle se on vielä vähän outo. Ronskisti pelkistettynä taustalla on ilmiö, jossa kaikenlaista tietoa on saatavilla enemmän tai vähemmän vapaasti joko itse keräämällä tai valmiina paketteina niin paljon, etteivät perinteiset keinot riitä kaiken sen käsittelyyn. Yksittäisillä murusilla ei välttämättä ole arvoa, mutta kymmeniä, satoja tai miljoonia muruja yhdistämällä saadaankin aivan uudenlainen kuva asiasta tai henkilöstä. Ongelma on kääntynyt tiedon etsimisestä sen jalostamiseen. 


Maailmalta on alkanutkin kantautumaan uutisia, joissa valitellaan data-analyytikkojen liian vähäistä määrää. Jo tällä hetkellä kysyntää osaamiselle on paljon ja tilanne on muuttumassa vakavaksi osaamispulaksi. Samaan aikaan, kun yrityksissä suunnitellaan kiivaasti business intelligence tai big data projekteja, ei yleinen tietämys tai kokonaisuuksien hallinta ole pysynyt perässä. Jos vain sokkona lähdetään louhimaan tietomassoja, ei siitä välttämättä jalostu timanttia kovankaan paineen alla.

Käännetäänpä katse hetkeksi toisaalle. Yritysten yksityisten tietovarastojen lisäksi world wide web ja erityisesti sosiaalisen median sovellukset ovat tämän hetken data-aarreaitta. Tietoverkkojen syöverissä, käyttäjälle näkymättömissä oman internetselaimen ja sisältöpalvelimen välinen viestintä käydään koneiden ymmärtämällä tavalla. Tämän protokollan määrityksessä on pari mielenkiintoista komentoa: PUT ja DELETE, joiden merkitykset ovat englantia ymmärtäville kovin intuitiivisia: kuka tahansa pystyisi poistamaan sisältöä tai vaikka tallentamaan oman versionsa olemassa olevan www-sivun päälle. Joskus "muinoin", kun www oli vain rajatun insinöörijoukon työväline, olivat nämä komennot ihan oleellisia työvälineitä. Käytön levitessä ne oli kuitenkin oletuksena syytä ottaa pois käytöstä, sillä kaikki verkossa liikkuvat eivät ole ajamassa pelkästään yhteistä etua. 

Edellinen esimerkki antaa luvan muodostaa aasinsillan verkkorikollisuuteen. Jos yhä suurempi osa tiedosta tullaan tallentamaan ja käsittelemään digitaalisesti tietoverkkoympäristöissä, kasvaa näiden väärinkäytön riski samassa suhteessa. Tietoturvasta puhutaan paljon, mutta kuinka voidaan suojautua, jos ei tiedetä miltä tai ketä vastaan pitäisi suojautua. Taitojaan kokeilevat nuorukaiset, jonkin aatteen ajamat aktivistit tai omaa etuaan tavoittelevat rikolliset sekä teollisuusvakoilijat etsivät jatkuvasti haavoittuvuuksia julkisista verkkojärjestelmistä. Ja keinoja on paljon. 

Meillä on siis käsissämme paradoksin ainekset: verkkoihin pitäisi mennä, sieltä pitäisi kerätä dataa, dataa pitäisi ymmärtää ja sitä pitäisi osata suojata tuntematonta vihollista vastaan. Jos edellisestä listasta otetaan yksittäisiä tekijöitä, on niihin löydettävissä helppoja ratkaisuja, mutta kokonaisuutena käsittely on haastavaa ja pitää sisällään voimakkaan strategisen ulottuvuuden. 

Informaatioteknologia ja tiedon hyväksikäyttö mahdollistavat paljon, mutta niitä pitää käyttää systemaattisesti ja käyttöä tulee myös johtaa ja seurata tai muuten järjestelmät kääntyvät itseämme vastaan.

jani.kurhinen(at)jyu.fi