Onderwerpen
 

Big Data

Big Data is data die te groot is om met reguliere databasemanagementsystemen onderhouden te worden. De definitie van big data is niet altijd duidelijk en de term big data wordt vaak ten onrechte gebruikt. Volgens Gartner gaat het om de drie factoren: hoeveelheid, snelheid en diversiteit. Als aan minimaal twee van bovenstaande factoren is voldaan, spreekt men in het algemeen over big data.

Hadoop

Apache Hadoop is een verzameling open-source softwarehulpprogramma's die het gebruik van een netwerk van veel computers mogelijk maken om problemen op te lossen waarbij enorme hoeveelheden gegevens en berekeningen betrokken zijn. Het biedt een softwarekader voor gedistribueerde opslag en verwerking van big data met behulp van het MapReduce-programmeermodel.

HBase

HBase is een open-source, niet-relationele, gedistribueerde database gemodelleerd naar Google's Bigtable en is geschreven in Java. Het is ontwikkeld als onderdeel van het Apache Hadoop-project van Apache Software Foundation en wordt uitgevoerd bovenop HDFS (Hadoop Distributed File System), wat voor Hadoop Bigtable-achtige mogelijkheden biedt.

HDFS

Hadoop distributed file system. HDFS is een gedistribueerd, schaalbaar en portable bestandssysteem dat in Java is geschreven voor het Hadoop-framework.

MapReduce

MapReduce is een programmeermodel en een bijbehorende implementatie voor het verwerken en genereren van grote gegevenssets met een parallel, gedistribueerd algoritme op een cluster.

Op zoek naar meer achtergrond informatie? Kijk dan ook eens bij opinie.