Super fedt at se så mange medlemmer (30+) til et kaffemøde. Det skabte en rigtig god ramme for indlægget, og medførte nogle rigtig gode spørgsmål og diskussioner efterfølgende.
Som lovet er slides hermed tilgængelige for download:
Her er links til de hadoop distributioner som jeg nævnte:
Som sagt på mødet findes der andre framework end Hadoop til at lave Map/Reduce processering. Blandt er der Disco:
Disco Project
Kernen er skrevet i Erlang (Erlang.org) hvor selve sproget er bygget omkring distribueret processering og parallel eksekvering. Klient tilgangen er så lavet i python som er nemt at gå til.
Et andet projekt er Manta som er et mapreduce framework fra Joyent, som specialiserer sig i cloud løsninger. For at demostrerer selve produktet findes der en rigtig sjov blog, hvor de analyserer videoen fra et spil mario kart: Kartalytics.
Jeg lovede også at komme med et par links til nogle datasæt som i kan bruge til at teste med og lege med.
Og der findes sikkert mange mange flere som jeg har glemt og som jeg ikke kender, så hvis i kender nogĺe sjove datasæt, må i meget gerne skrive det i en kommentar på den her post.
Igen, mange tak for fremmødet og for de gode spørgsmål.