Big Data et Machine Learning
Les concepts et les outils de la data science
Cet ouvrage s’adresse à tous ceux qui cherchent à tirer parti de l’énorme potentiel des « technologies Big Data », qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs [...]
[lire le résumé du livre]
Auteur : Pirmin LEMBERGER , Marc BATTY , Médéric MOREL , Jean-Luc RAFFAëLLI
Editeur : Dunod
Collection : InfoPro
Date parution : 08/2019 (3ème édition)Quel est le sujet du livre "Big Data et Machine Learning"
Cet ouvrage s’adresse à tous ceux qui cherchent à tirer parti de l’énorme potentiel des « technologies Big Data », qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le Machine Learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Il combine la présentation :
• de notions théoriques (traitement statistique des données, calcul distribué...) ;
• des outils les plus répandus (écosystème Hadoop, Storm...) ;
• d’exemples d’applications ;
• d’une organisation typique d’un projet de data science.
Les ajouts de cette troisième édition concernent principalement la vision d’architecture d’entreprise, nécessaire pour intégrer les innovations du Big Data au sein des organisations, et le Deep Learning pour le NLP (Natural Language Processing, qui est l’un des domaines de l’intelligence artificielle qui a le plus progressé récemment).
Pirmin LEMBERGER : Docteur en physique théorique reconverti dans l'IT depuis une quinzaine d'années il est aujourd'hui data scientist, directeur scientifique chez Weave Business Technology. Spécialiste du Machine Learning il s'intéresse actuellement au NLP (Natural Language Processing).
Marc BATTY : Cofondateur de Dataiku, plateforme de développement et d’exécution d’applications prédictives.
Médéric MOREL : Cofondateur et CEO de Mapwize, une plateforme de cartographie indoor. Il est auteur de cinq ouvrages chez Dunod.
Jean-Luc RAFFAëLLI : Directeur de projets stratégiques au sein de la DSI du groupe La Poste. Il contribue aux différentes déclinaisons SI de la stratégie Business du groupe.
- EDI
- Tangente
En suivant ce lien, retrouvez tous les livres dans la spécialité DATA - Machine learning - Analyse de données.
Sommaire et contenu du livre "Big Data et Machine Learning - Les concepts et les outils de la data science"
Les fondements du Big Data. Les origines du Big Data. Le Big Data dans les organisations. Le mouvement NoSQL. L’algorithme MapReduce et le framework Hadoop. Le métier de data scientist. Le quotidien du data scientist. Exploration et préparation de données. Le Machine Learning. La visualisation des données. Les outils du Big Data. L’écosystème Hadoop. Analyse de logs avec Pig et Hive. Les architectures ?. Apache Storm.