Le géant bleu, IBM, s’engage aussi dans Spark, le projet open source le plus important de la décennie, avec pour objectif de l’embarquer dans les plateformes Analytics et Commerce. Il sera en outre disponible en mode SaaS sur Bluemix. Pour favoriser le développement de l’écosystème de Spark, IBM met en place plusieurs mesures :
- L’intégration de Spark au coeur de ses plateformes d’Analytics et de Commerce ;
- Les solutions Cloud d’IBM Watson pour la santé mettront à profit Spark. L’objectif étant de délivrer rapidement des informations de qualité pour les prestataires de soins et les chercheurs, en leur donnant accès à de nouvelles analyses autour des données de santé;
- Mise à disposition en open source de sa technologie de Machine Learning IBM SystemML et va également collaborer avec Databricks pour faire évoluer les capacités de Spark ;
- L’offre de Spark en mode SaaS sur sa plateforme BlueMix afin de permettre aux développeurs d’exploiter les données ;
- L’ouverture d’un Spark Technology Center à San Francisco dédié à la Data Science et à la communauté des développeurs afin de favoriser l’innovation au sein des applications intelligentes ;
- La formation de plus d’un million de Data Scientists et d’Analystes de Données sur Spark, à travers des partenariats avec AMPLab, DataCamp, MetiStream, Galvanize et Big Data University MOOC.
Rappelons qu’Apache Spark est un framework de traitements Big Data open source. Il est construit pour effectuer des analyses sophistiquées, ainsi que pour une rapidité et une facilité d’utilisation. Il a d’abord été développé par AMPLab, de l’Université UC Berkeley, en 2009 et passé open source sous forme de projet Apache en 2010.













