Currently viewing the category: "Blogg"

 

MongoDB

MongoDB

MongoDB (avledet av «humongous») er en dokumentbasert, open source, såkalt nosql-database, skrevet i C++. Det vil si at data ikke lagres i tabeller og rader som i en relasjonell database, som f.eks. MySql, men i objekter, i MongoDBs tilfelle som bson-objekter (bson = binær json). Dette gjør databasen spesielt egnet til objektorienterte programmeringsspråk, hvor man slipper å gå veien om en såkalt ORM (Object Relational Mapper). ORMs er kjent for å skalere dårlig, og MongoDB brukes spesielt innenfor det som kalles Big Data, bl.a. til å analysere loggfiler fra webservere. [Continue Reading…]

talend_TOS_MDM spago_logo

Dette innlegget viser hvordan man kan gå fra noen Excel-regneark til en online interaktiv presentasjon med bruk av open source BI-verktøy, nærmere bestemt Talend Open Studio for Data Integration (TOS/DI) og SpagoBI Open Studio og online business intelligence server.

Utgangspunktet er et Excel-regneark som Avinor publiserer en gang i måneden med oversikt over landets flytrafikk. Excel-arket som inneholder Avinors Månedstatistikk ble forøvrig utviklet av undertegnede for en del år tilbake, noe som gjør det både naturlig og en smule nostalgisk å bruke tallmaterialet i dette eksemplet.  Dette blogginnlegget omfatter del 1 av eksperimentet: Overføring av data fra Avinors Excel-filer til en MySql database via en ETL-jobb (ETL = Extract, Transform, Load) som vi lager i TOS/DI.

[Continue Reading…]

talend_52Tid er en av de vanligste dimensjonene i et datavarehus. En godt strukturert kalender kan brukes som dimensjon i alle relevante stjerne-skjemaer og knyttes til de fleste faktatabeller. Ved å bruke Talend Open Studio for Data Integration (TOS/DI) til dette har man en generator som kan gjenbrukes og kobles mot de fleste databaser. TOS/DI er fri og åpen programvare, og kan lastes ned fra denne lenken: http://www.talend.com/download.php

[Continue Reading…]