Olet täällä: Home » Alat ja aineryhmät » Tilastotiede
Sections

Mitä on tilastotiede?

Document Actions

Moderni tilastotiede on monipuolista data-analyysiä, ei tiedettä virallisista tilastoista ja suurista lukutaulukoista ja niiden kokoelmista. Tilastotiede on oppiaine, jonka aiheena ja sovelluskohteena voidaan laajasti pitää

• sattuman ja vaihtelun hallintaa

• informaation suodattamista datasta

• mallintamista monilla tieteen ja elämän alueilla

Tilastotiede - sattuman hallintaa

Tilastotieteessä kehitetään menetelmiä numeerisen havaintoaineiston kuvaamiseen sekä tilastolliseen laskentaan, mallintamiseen ja päättelyyn. Lisäksi aineiston hankinnan strategiat ja tilastollisten kokeiden suunnittelu ovat tilastotieteen keskeistä sisältöä. Tilastotiede on metoditiede useille soveltaville aloille kuten bio- ja ympäristötieteet, lääketiede, informaatioteknologia sekä talous- ja yhteiskuntatieteet. Myös teollisuuden tuotekehittely hyödyntää tilastotieteellistä osaamista.

...Ja data-analyysiä

Modernit havaintoaineistot ovat usein muuta kuin pieniä lukutilastoja. Havainnot voivat olla myös jakaumia, kuvia, esimerkiksi satelliitin tai mikroskoopin kautta otettuja pikselikuvia, geenin pätkiä, telesignaaleja.

Etenkin automaattisesti kerättävät havaintoaineistot runsastuvat alati ja niiden käsittelytarve kasvaa. Aineistot voivat olla kooltaan valtavia.

Myös tilastolliset mallit ja laskentamenetelmät ovat muuttuneet vallankumouksellisesti viimeisten 15 vuoden aikana. Tietokoneiden ja laskentamenetelmien huima kehitys viime vuosina on mullistanut tilastotiedettä ja avannut mahdollisuuksia hyvinkin mutkikkaiden sovellusalojen ilmiöiden tilastolliseen mallintamiseen sekä valtavien aineistojen käsittelyyn. Modernin tilastotieteilijän vaatimuksiin kuuluvat hyvä ja monipuolinen matematiikan ja tietotekniikan osaaminen.

Tilastotieteellä on monta sovellusaluetta ja nimeä

Seuraavassa on tyypillisiä esimerkkejä sovellusaloista. Suluissa on myös mainittu tilastotieteen erikois- tai lähialoja, jotka liittyvät ao. sovelluskenttään.

Biologia (biometria) ja ympäristötieteet (envirometriikka)

• genetiikka (bioinformatiikka)

• ekologia, ympäristön- ja riistantutkimus

• maatalous- ja metsäntutkimus

Lääketiede (biostatistiikka)

• sairauksien syiden tutkimus (epidemiologia)

• kliiniset hoitokokeet

• lääkkeiden tuotekehitys

Taloustiede

• kansantalouden ennusteet (ekonometria)

• markkinatutkimus

Tekniikka ja luonnontieteet

• informaatioteknologia: signaalin- ja kuvankäsittely

• teollisuustuotannon ja laboratorioiden laadunvalvonta (teknometria, kemometria)

Yhteiskunta- ja käyttäytymistieteet

• väestötutkimus (demometria)

• sosiologia ja sosiaalipolitiikka (sosiometria)

• psykologia (psykometriikka)

Tilastotieteen historia: uhkapelejä, todennäköisyyslaskentaa ja empiirisiä tieteitä

Tilastotieteellä on juurensa muinaisen Rooman valtiontilastoissa (stato -> statistics). Varsinainen todennäköisyyslaskenta ja siihen perustuva satunnaisuuden hallinta sai alkunsa 1500–1600-luvuilla uhkapelien innoittamana (suuria nimiä Cardano, Pascal, de Fermat, Huygens, Bernoullit) sekä empiiristen luonnontieteiden mittaus- ja satunnaisvirheiden hallinnan tarpeesta (Brahe, Kepler, Galilei).

Satunnaisvirheen käsittelyn rinnalla toinen tilastotieteen historian punainen lanka on normaalijakauman ymmärtäminen. Erityisesti ”keskeinen raja-arvolause” on yksi tieteen suurimpia keksintöjä. Se osoittaa, että summamuotoiset muuttujat kuten keskiarvo ovat asymptoottisesti normaalisti jakautuneita. Lause on perustana lähes kaikelle tilastotieteelle ja stokastiikalle. Sen keskeisiä kehittäjiä 1700–1800-luvuilla olivat de Moivre, Laplace ja Gauss, joka yhdisti kaksi historian suurta kehityslinjaa, satunnaisvirheen ja normaalijakauman.

Tilastotieteessä on aina kyse aineistojen analysoinnista. Empiiristen luonnontieteiden ja tekniikan rinnalle sovellusaloiksi tulivat 1600-luvulla väestötiede (Graunt, Halley), 1800-luvulla lääketiede (Quetelet) ja biologia (Galton, Fisher) sekä 1900-luvulla psykologia (Spearman) ja taloustiede.

Ensimmäinen tilastollinen testi esiteltiin jo 1700-luvulla lontoolaisvauvojen sukupuolten todennäköisyyseroja tutkittaessa (Arbuthnot), mutta vasta 1900-luvulla testiteoria kehittyi huippuunsa (Pearson, Fisher).

Bayesiläinen tilastotiede on muuttanut sekä tilastollisen mallinnuksen käytäntöä että ajattelua 1990-luvun taitteesta alkaen – olkoonkin, että Bayes esitti kaavansa jo 1700-luvulla.

Suomenkielen sanan tilastotiede keksi 1800-luvun lopulla kiuruveteläinen Paavo Tikkanen. Nykyisin olisi osuvampaa puhua data-analyysistä.

Created by jaakkos
Last modified 2005-02-28 04:22 PM