Datajournalismi/Datatekniikat-opintopiiri

Tämä sivu on tarkoitettu vapaamuotoisten vertaisopintopiirien käyttöön avoimen datan ja datajournalismin tekniikoiden ymmärtämiseksi ja soveltamiseksi omaan käyttöön. Tavoitteena ei ole termien ja asioiden esittämisen eksaktius vaan niiden esittäminen ymmärrettävästi :)

Ole hyvä ja listaa tähän aakkosjärjestykseen käsitteitä ja termejä jotka haluat oppia, lisää linkkejä, kirjoita kuvauksia tai kysymyksiä tai jäsennä koko sivun rakenne uudestaan :). Tai merkitse "haluan oppia tämän" ja jokin yhteystietosi.

Käsitteet ja termit

muokkaa

Tämän voisi purkaa erikseen muun muassa ohjelmointikieliin listan edetessä.

JavaScript

muokkaa

Six Revisions esittelee 20 JavaScript -visualisointikirjastoa

Keyhole Markup Language http://en.wikipedia.org/wiki/Keyhole_Markup_Language


Python

muokkaa

Ohjelmointikieli, sopii esimerkiksi Web API-hakuihin ja raapimiseen (scraping). Googlen listaus suomenkielisistä Pyhton -oppaista. Ohjelmointiputkan opas on kokeiltu ja hyväksi havaittu

Scraping, skreippaus

muokkaa

Web API

muokkaa

Nettityökalut

muokkaa

Google Fusion Tables

muokkaa

Antti Poikola, Otavan opisto: Google Fusion Tables tutoriaali - Suomen kuntien visualisointi kartalle

Google Refine

muokkaa

Antti Poikola, Otavan opisto; Datan siivousta tehokkaasti – Google Refine Tuostakaan johdatuksesta ei vielä selviä, että Google Refine pitää ensin *asentaa* omalle koneelle ennen kuin mikään alkaa toimia :)

ScraperWiki

muokkaa

Ohjelmat

muokkaa

Avoimen lähdekoodin verkostoanalyysiohjelma, josta on nopeasti tullut erittäin suosittu muun muassa sen ylivoimaisten visualisointiominaisuuksien sekä suhteellisen helppokäyttöisyyden vuoksi - esimerkiksi akateemiseen 'standardiin' UCINETiin verrattuna.

R (www.r-project.org) on laskennallinen ohjelmointikieli, jolla dataa voi käsitellä ja visualisoida nopeasti ja vuorovaikutteisesti. R-kielen kautta on saatavilla kattavat kirjastot tilastolliseen analyysiin ja tiedonlouhintaan, ja sitä käytetään laajasti muun muassa bioinformatiikassa, ekologiassa, ekonometriassa, tilastotieteessä ja muilla dataintensiivisillä tieteenaloilla. R perustuu avoimeen lähdekoodiin, ja kuka vain voi luoda kieleen uusia välineitä datan käsittelyyn. R tarjoaa tehokkaat ja monipuoliset välineet datan laskennalliseen käsittelyyn, mutta vastaavasti sen oppimiskynnys on korkeampi. Kielelle luodut tutoriaalit, wikisivustot, ja yhteisöfoorumit voivat auttaa alkuun pääsemisessä. Suomessa R-osaajia löytää esimerkiksi IRCnetin kanavalta #r-project.

Datawiki: ohjeet R-laskentaympäristölle

Tiedostopäätteet

muokkaa

Teksti/ASCII-tiedostomuoto, jossa data erotetaan pilkuilla toisistaan. Avataan usein esimerkiksi Excelissa (Import Data) http://fi.wikipedia.org/wiki/CSV . Esimerkki:

Vuosi,Merkki,Malli,Pituus
1997,Ford,E350,2","34
2000,Mercury,Cougar,2","38

Tausta ja siemenversion tekijät

muokkaa

Opintokokonaisuuden rakenteen sekä materiaalin tuottaminen on aloitettu ESR-rahoitteisen Avoimet verkostot oppimiseen (AVO) -hankkeessa. Siemenversion koosti Kari A. Hintikka 2012 aineistoissa mainittuine lähteineen. Lisksi Ideointiin ja kirjoittamiseen ovat osallistuneet muun muassa seuraavat asiantuntijat:



 

Materiaalin siemenversio on tuotettu osana AVO-hanketta. Hanketta rahoittavat Euroopan unionin sosiaalirahasto sekä Lapin ELY.