Big Data kaffemøde – Slides og andet godt

Super fedt at se så mange medlemmer (30+) til et kaffemøde. Det skabte en rigtig god ramme for indlægget, og medførte nogle rigtig gode spørgsmål og diskussioner efterfølgende.

Som lovet er slides hermed tilgængelige for download:

Her er links til de hadoop distributioner som jeg nævnte:

Som sagt på mødet findes der andre framework end Hadoop til at lave Map/Reduce processering. Blandt er der Disco:

Disco Project

Kernen er skrevet i Erlang (Erlang.org) hvor selve sproget er bygget omkring distribueret processering og parallel eksekvering. Klient tilgangen er så lavet i python som er nemt at gå til.

Et andet projekt er Manta som er et mapreduce framework fra Joyent, som specialiserer sig i cloud løsninger. For at demostrerer selve produktet findes der en rigtig sjov blog, hvor de analyserer videoen fra et spil mario kart: Kartalytics.

Jeg lovede også at komme med et par links til nogle datasæt som i kan bruge til at teste med og lege med.

Og der findes sikkert mange mange flere som jeg har glemt og som jeg ikke kender, så hvis i kender nogĺe sjove datasæt, må i meget gerne skrive det i en kommentar på den her post.

Igen, mange tak for fremmødet og for de gode spørgsmål.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

This site uses Akismet to reduce spam. Learn how your comment data is processed.