MapReduce
Une définition du Jargon Français.
. [programmation]. Façon de programmer facilitant la parallélisation par la distribution, autrement dit le découpage d'un problème en traitements simultanément effectués par des machines différentes, chacun travaillant sur un sous-ensemble des données.
L'astuce consiste à paralléliser autant que faire se peut le processus de parallélisation même. C'est de l'« organisation scientifique du travail » appliquée aux ordinateurs plutôt qu'aux ouvriers: de nombreux exécutants (fonctions) spécialisés accomplissent simultanément des micro-tâches indépendantes.
Ce terme provient de:
- map
- décrivant sommairement à la fois la première étape d'un MapReduce qui consiste à gérer l'application d'une fonction à un lot de données réalisée par un seul appel du programme principal, ainsi que le mode de fonctionnement des fonctions mobilisées qui se contentent d'associer une valeur à chaque donnée
- reduce
- qui résume l'étape suivante de collecte les résultats (synthèse)
Une troisième étape de consolidation des résultats, dite « finalize », n'est pas toujours nécessaire donc négligée dans le nom MapReduce.