Datajournalismi/Datatekniikat-opintopiiri
Tämä sivu on tarkoitettu vapaamuotoisten vertaisopintopiirien käyttöön avoimen datan ja datajournalismin tekniikoiden ymmärtämiseksi ja soveltamiseksi omaan käyttöön. Tavoitteena ei ole termien ja asioiden esittämisen eksaktius vaan niiden esittäminen ymmärrettävästi :)
Ole hyvä ja listaa tähän aakkosjärjestykseen käsitteitä ja termejä jotka haluat oppia, lisää linkkejä, kirjoita kuvauksia tai kysymyksiä tai jäsennä koko sivun rakenne uudestaan :). Tai merkitse "haluan oppia tämän" ja jokin yhteystietosi.
Käsitteet ja termit
muokkaaTämän voisi purkaa erikseen muun muassa ohjelmointikieliin listan edetessä.
API
muokkaaJavaScript
muokkaaSix Revisions esittelee 20 JavaScript -visualisointikirjastoa
JSON
muokkaaKML
muokkaaKeyhole Markup Language http://en.wikipedia.org/wiki/Keyhole_Markup_Language
Python
muokkaaOhjelmointikieli, sopii esimerkiksi Web API-hakuihin ja raapimiseen (scraping). Googlen listaus suomenkielisistä Pyhton -oppaista. Ohjelmointiputkan opas on kokeiltu ja hyväksi havaittu
REST
muokkaaScraping, skreippaus
muokkaaWeb API
muokkaaNettityökalut
muokkaaGoogle Fusion Tables
muokkaaGoogle Refine
muokkaaAntti Poikola, Otavan opisto; Datan siivousta tehokkaasti – Google Refine Tuostakaan johdatuksesta ei vielä selviä, että Google Refine pitää ensin *asentaa* omalle koneelle ennen kuin mikään alkaa toimia :)
ScraperWiki
muokkaaOhjelmat
muokkaaGephi
muokkaaAvoimen lähdekoodin verkostoanalyysiohjelma, josta on nopeasti tullut erittäin suosittu muun muassa sen ylivoimaisten visualisointiominaisuuksien sekä suhteellisen helppokäyttöisyyden vuoksi - esimerkiksi akateemiseen 'standardiin' UCINETiin verrattuna.
R
muokkaaR (www.r-project.org) on laskennallinen ohjelmointikieli, jolla dataa voi käsitellä ja visualisoida nopeasti ja vuorovaikutteisesti. R-kielen kautta on saatavilla kattavat kirjastot tilastolliseen analyysiin ja tiedonlouhintaan, ja sitä käytetään laajasti muun muassa bioinformatiikassa, ekologiassa, ekonometriassa, tilastotieteessä ja muilla dataintensiivisillä tieteenaloilla. R perustuu avoimeen lähdekoodiin, ja kuka vain voi luoda kieleen uusia välineitä datan käsittelyyn. R tarjoaa tehokkaat ja monipuoliset välineet datan laskennalliseen käsittelyyn, mutta vastaavasti sen oppimiskynnys on korkeampi. Kielelle luodut tutoriaalit, wikisivustot, ja yhteisöfoorumit voivat auttaa alkuun pääsemisessä. Suomessa R-osaajia löytää esimerkiksi IRCnetin kanavalta #r-project.
Tiedostopäätteet
muokkaa.csv
muokkaaTeksti/ASCII-tiedostomuoto, jossa data erotetaan pilkuilla toisistaan. Avataan usein esimerkiksi Excelissa (Import Data) http://fi.wikipedia.org/wiki/CSV . Esimerkki:
Vuosi,Merkki,Malli,Pituus 1997,Ford,E350,2","34 2000,Mercury,Cougar,2","38
Tausta ja siemenversion tekijät
muokkaaOpintokokonaisuuden rakenteen sekä materiaalin tuottaminen on aloitettu ESR-rahoitteisen Avoimet verkostot oppimiseen (AVO) -hankkeessa. Siemenversion koosti Kari A. Hintikka 2012 aineistoissa mainittuine lähteineen. Lisksi Ideointiin ja kirjoittamiseen ovat osallistuneet muun muassa seuraavat asiantuntijat:
Materiaalin siemenversio on tuotettu osana AVO-hanketta. Hanketta rahoittavat Euroopan unionin sosiaalirahasto sekä Lapin ELY.