Livre électronique567 pages2 heures

Le traitement BigData: Informatique

Name: Le traitement BigData: Informatique
Author: Hadi Hashem
ISBN: 9791023619195

Par Hadi Hashem

Évaluation : 0 sur 5 étoiles

()

Lire l'aperçu

À propos de ce livre électronique

Comment exploiter rentablement et efficacement les données dans un monde où tout va de plus en plus vite?

Dans le monde d’aujourd’hui de multiples acteurs de la technologie numérique produisent des quantités infinies de données. Capteurs, réseaux sociaux ou e-commerce, ils génèrent tous de l’information qui s’incrémente en temps réel selon les « 3 V » de Gartner : en Volume, en Vitesse et en Variabilité. Afin d’exploiter efficacement et durablement ces données, il est important de respecter la dynamicité de leur évolution chronologique à travers 2 approches : le polymorphisme d’une part, au moyen d’un modèle dynamique capable de supporter le changement de type à chaque instant sans failles de traitement ; d’autre part le support de la volatilité par un modèle intelligent prenant en compte des donnés-clés seulement interprétables à un instant « t », au lieu de traiter toute la volumétrie des données actuelle et historique.

Un guide indispensable pour un potentiel maximal d'exploitation des données.

À PROPOS DE L'AUTEUR

Hadi Hashem est un acteur engagé dans le monde du conseil logiciel et particulièrement le potentiel d’exploitation des données. Diplômé ingénieur en informatique, il a travaillé dans des entreprises des domaines d’énergie, de pharmaceutique vétérinaire et d’électroménager, en France et en Europe. Titulaire d’un doctorat dans le domaine du traitement BigData, il développe ses activités d'enseignement et de recherche dans les universités de France. Ses méthodes concrétisent un mariage entre les connaissances théoriques de la science des données et les besoins pratiques dans le quotidien des entreprises.

Ignorer le carrousel

LangueFrançais

ÉditeurPublishroom

Date de sortie8 oct. 2021

ISBN9791023619195

Auteur

Hadi Hashem

Auteurs associés

Ignorer le carrousel

Lié à Le traitement BigData

Livres électroniques liés

Ignorer le carrousel

Formation pratique a XML avec C#5, WPF et LINQ: Avec Visual Studio 2013
Livre électronique
Formation pratique a XML avec C#5, WPF et LINQ: Avec Visual Studio 2013
dePatrice Rey
Évaluation : 0 sur 5 étoiles
0 évaluation
Initiation à l'écosytème Hadoop
Livre électronique
Initiation à l'écosytème Hadoop
deJuvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5
Bien débuter avec Sparkle: Développer un site Web sans programmer sur Mac
Livre électronique
Bien débuter avec Sparkle: Développer un site Web sans programmer sur Mac
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Google sheets: Le tableur en ligne
Livre électronique
Google sheets: Le tableur en ligne
deRemi Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
GOOGLE SLIDES: La présentation en ligne
Livre électronique
GOOGLE SLIDES: La présentation en ligne
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Manuel d'apprentissage de la programmation 3D: avec C#5, WPF et Visual Studio 2013
Livre électronique
Manuel d'apprentissage de la programmation 3D: avec C#5, WPF et Visual Studio 2013
dePatrice Rey
Évaluation : 0 sur 5 étoiles
0 évaluation
LES MACROS AVEC GOOGLE SHEETS: Programmer en Javascript
Livre électronique
LES MACROS AVEC GOOGLE SHEETS: Programmer en Javascript
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Bien débuter avec PHP/MySQL: Formation professionnelle
Livre électronique
Bien débuter avec PHP/MySQL: Formation professionnelle
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
OpenOffice Base: La base de données pour tous
Livre électronique
OpenOffice Base: La base de données pour tous
deRemy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Éléments de programmation structurée
Livre électronique
Éléments de programmation structurée
deLouis Villardier
Évaluation : 0 sur 5 étoiles
0 évaluation
Agile & Scrum
Livre électronique
Agile & Scrum
deAjit Singh
Évaluation : 0 sur 5 étoiles
0 évaluation
Google Docs Online: Professional Training
Livre électronique
Google Docs Online: Professional Training
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
OpenOffice CALC: Le tableur pour tous
Livre électronique
OpenOffice CALC: Le tableur pour tous
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Guide pratique pour étudier la faisabilité de projets
Livre électronique
Guide pratique pour étudier la faisabilité de projets
deGilles Corriveau
Évaluation : 3 sur 5 étoiles
3/5
Bien débuter avec SQL: Exercices dans l'interface PhpMyAdmin et MySQL
Livre électronique
Bien débuter avec SQL: Exercices dans l'interface PhpMyAdmin et MySQL
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Excel, remise à niveau et perfectionnement: Pour aller plus loin dans votre utilisation d'Excel
Livre électronique
Excel, remise à niveau et perfectionnement: Pour aller plus loin dans votre utilisation d'Excel
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Bien débuter avec Adobe Acrobat Pro DC: Formation professionnelle
Livre électronique
Bien débuter avec Adobe Acrobat Pro DC: Formation professionnelle
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Bien débuter avec Office 365: Guide pratique
Livre électronique
Bien débuter avec Office 365: Guide pratique
deRemy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Mieux maîtriser PowerPoint: Un outil de familiarisation au logiciel de présentation PowerPoint
Livre électronique
Mieux maîtriser PowerPoint: Un outil de familiarisation au logiciel de présentation PowerPoint
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Mieux maîtriser Access: Un outil de familiarisation à la base de données Access
Livre électronique
Mieux maîtriser Access: Un outil de familiarisation à la base de données Access
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Bien débuter avec JavaScript: Formation professionnelle
Livre électronique
Bien débuter avec JavaScript: Formation professionnelle
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Conception de bases de données avec UML
Livre électronique
Conception de bases de données avec UML
deGilles Roy
Évaluation : 5 sur 5 étoiles
5/5
Getting started with Javascript: Professional Training
Livre électronique
Getting started with Javascript: Professional Training
deRemy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Bien débuter avec Numbers: Formation professionnelle
Livre électronique
Bien débuter avec Numbers: Formation professionnelle
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
GOOGLE DOCS: Le traitement de texte en ligne
Livre électronique
GOOGLE DOCS: Le traitement de texte en ligne
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Le développement de systèmes d'information (Le): Une méthode intégrée à la transformation des processus, 4e édition
Livre électronique
Le développement de systèmes d'information (Le): Une méthode intégrée à la transformation des processus, 4e édition
deSuzanne Rivard
Évaluation : 0 sur 5 étoiles
0 évaluation
Bien débuter en programmation: Formation professionnelle
Livre électronique
Bien débuter en programmation: Formation professionnelle
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Improve your PivotTables with Excel: Manual
Livre électronique
Improve your PivotTables with Excel: Manual
deRémy Lentzer
Évaluation : 0 sur 5 étoiles
0 évaluation
Introduction à l’analyse des données de sondage avec SPSS : Guide d’auto-apprentissage
Livre électronique
Introduction à l’analyse des données de sondage avec SPSS : Guide d’auto-apprentissage
deMichel Plaisent
Évaluation : 0 sur 5 étoiles
0 évaluation
Mieux maîtriser Word: Un outil de familiarisation au traitement de texte Word
Livre électronique
Mieux maîtriser Word: Un outil de familiarisation au traitement de texte Word
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation

Ordinateurs pour vous

Ignorer le carrousel

Pensez et investissez comme Warren Buffett: Le manuel qui révèle l'état d'esprit et les stratégies de réflexion du plus grand investisseur de tous les temps
Livre électronique
Pensez et investissez comme Warren Buffett: Le manuel qui révèle l'état d'esprit et les stratégies de réflexion du plus grand investisseur de tous les temps
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux
Livre électronique
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux
deKaj Berrah
Évaluation : 5 sur 5 étoiles
5/5
Revue des incompris revue d'histoire des oubliettes: Le Réveil de l'Horloge de Célestin Louis Maxime Dubuisson aliéniste et poète
Livre électronique
Revue des incompris revue d'histoire des oubliettes: Le Réveil de l'Horloge de Célestin Louis Maxime Dubuisson aliéniste et poète
deAgnès Bertomeu
Évaluation : 3 sur 5 étoiles
3/5
Apprendre Python rapidement: Le guide du débutant pour apprendre tout ce que vous devez savoir sur Python, même si vous êtes nouveau dans la programmation
Livre électronique
Apprendre Python rapidement: Le guide du débutant pour apprendre tout ce que vous devez savoir sur Python, même si vous êtes nouveau dans la programmation
deKevin Droz
Évaluation : 0 sur 5 étoiles
0 évaluation
Dans l'esprit des grand investisseurs: Un voyage à la découverte de la psychologie utilisée par les plus grands investisseurs de tous les temps à travers des analyses opérationnell
Livre électronique
Dans l'esprit des grand investisseurs: Un voyage à la découverte de la psychologie utilisée par les plus grands investisseurs de tous les temps à travers des analyses opérationnell
deStefano Calicchio
Évaluation : 5 sur 5 étoiles
5/5
La psychologie du trading facile à apprendre: Comment appliquer les stratégies et les attitudes psychologiques des traders gagnants pour réussir dans le trading.
Livre électronique
La psychologie du trading facile à apprendre: Comment appliquer les stratégies et les attitudes psychologiques des traders gagnants pour réussir dans le trading.
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
L'analyse technique facile à apprendre: Comment construire et interpréter des graphiques d'analyse technique pour améliorer votre activité de trading en ligne.
Livre électronique
L'analyse technique facile à apprendre: Comment construire et interpréter des graphiques d'analyse technique pour améliorer votre activité de trading en ligne.
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
La communication professionnelle facile à apprendre: Le guide pratique de la communication professionnelle et des meilleures stratégies de communication d'entreprise
Livre électronique
La communication professionnelle facile à apprendre: Le guide pratique de la communication professionnelle et des meilleures stratégies de communication d'entreprise
deStefano Calicchio
Évaluation : 5 sur 5 étoiles
5/5
Le plan marketing en 4 étapes: Stratégies et étapes clés pour créer des plans de marketing qui fonctionnent
Livre électronique
Le plan marketing en 4 étapes: Stratégies et étapes clés pour créer des plans de marketing qui fonctionnent
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Les Chandeliers Japonaises facile à apprendre: Le guide d'introduction aux voiles japonaises et les stratégies d'analyse technique les plus efficaces
Livre électronique
Les Chandeliers Japonaises facile à apprendre: Le guide d'introduction aux voiles japonaises et les stratégies d'analyse technique les plus efficaces
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
L'analyse fondamentale facile à apprendre: Le guide d'introduction aux techniques et stratégies d'analyse fondamentale pour anticiper les événements qui font bouger les marchés
Livre électronique
L'analyse fondamentale facile à apprendre: Le guide d'introduction aux techniques et stratégies d'analyse fondamentale pour anticiper les événements qui font bouger les marchés
deStefano Calicchio
Évaluation : 3 sur 5 étoiles
3/5
Introduction au Darknet: Darknet 101
Livre électronique
Introduction au Darknet: Darknet 101
deMartin Hoffer
Évaluation : 4 sur 5 étoiles
4/5
Travailler dans le Big Data - les 6 métiers vers lesquels s'orienter
Livre électronique
Travailler dans le Big Data - les 6 métiers vers lesquels s'orienter
deJuvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5
Forex Trading facile à apprendre: Le guide d'introduction au marché des changes et aux stratégies de négociation les plus efficaces dans l'industrie des devises.
Livre électronique
Forex Trading facile à apprendre: Le guide d'introduction au marché des changes et aux stratégies de négociation les plus efficaces dans l'industrie des devises.
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
Python Offensif : Le guide du débutant pour apprendre les bases du langage Python et créer des outils de hacking.
Livre électronique
Python Offensif : Le guide du débutant pour apprendre les bases du langage Python et créer des outils de hacking.
deKevin Droz
Évaluation : 0 sur 5 étoiles
0 évaluation
Stratégie d'Investissement en Crypto-monnaie: Comment Devenir Riche Avec les Crypto-monnaies
Livre électronique
Stratégie d'Investissement en Crypto-monnaie: Comment Devenir Riche Avec les Crypto-monnaies
deSato Akira
Évaluation : 4 sur 5 étoiles
4/5
Le marketing d'affiliation en 4 étapes: Comment gagner de l'argent avec des affiliés en créant des systèmes commerciaux qui fonctionnent
Livre électronique
Le marketing d'affiliation en 4 étapes: Comment gagner de l'argent avec des affiliés en créant des systèmes commerciaux qui fonctionnent
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Résumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social
Livre électronique
Résumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social
deTechnology Summary
Évaluation : 0 sur 5 étoiles
0 évaluation
Kali Linux pour débutant : Le guide ultime du débutant pour apprendre les bases de Kali Linux.
Livre électronique
Kali Linux pour débutant : Le guide ultime du débutant pour apprendre les bases de Kali Linux.
deKevin Droz
Évaluation : 5 sur 5 étoiles
5/5
Réseau Anonyme Tor 101: Une Introduction à la Partie la Plus Privée de l'Internet
Livre électronique
Réseau Anonyme Tor 101: Une Introduction à la Partie la Plus Privée de l'Internet
deSteven Gates
Évaluation : 2 sur 5 étoiles
2/5
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
Livre électronique
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
La psychologie du travail facile à apprendre: Le guide d'introduction à l'utilisation des connaissances psychologiques dans le domaine du travail et des organisations
Livre électronique
La psychologie du travail facile à apprendre: Le guide d'introduction à l'utilisation des connaissances psychologiques dans le domaine du travail et des organisations
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Cybersécurité: Le guide du débutant pour apprendre à reconnaître les cyber-risques et comment se défendre contre la cybercriminalité.
Livre électronique
Cybersécurité: Le guide du débutant pour apprendre à reconnaître les cyber-risques et comment se défendre contre la cybercriminalité.
deHackinGeeK Inc
Évaluation : 4 sur 5 étoiles
4/5
Créer Son Propre Site Internet Et Son Blog Gratuitement
Livre électronique
Créer Son Propre Site Internet Et Son Blog Gratuitement
deJason Matthews
Évaluation : 5 sur 5 étoiles
5/5
Le guide de survie de votre notoriété - Les 6 secrets de la renomée digitale
Livre électronique
Le guide de survie de votre notoriété - Les 6 secrets de la renomée digitale
deThomas Trautmann
Évaluation : 0 sur 5 étoiles
0 évaluation
Le neuromarketing en 7 réponses
Livre électronique
Le neuromarketing en 7 réponses
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Agile & Scrum
Livre électronique
Agile & Scrum
deAjit Singh
Évaluation : 0 sur 5 étoiles
0 évaluation
Blockchain: Applications et compréhension du monde réel
Livre électronique
Blockchain: Applications et compréhension du monde réel
deWayne Walker
Évaluation : 4 sur 5 étoiles
4/5
Bien débuter avec VBA: Informatique
Livre électronique
Bien débuter avec VBA: Informatique
deRemy Lentzner
Évaluation : 5 sur 5 étoiles
5/5
Le secret De La Cybersécurité: Le guide pour protéger votre famille et votre entreprise de la cybercriminalité
Livre électronique
Le secret De La Cybersécurité: Le guide pour protéger votre famille et votre entreprise de la cybercriminalité
deHacking House
Évaluation : 5 sur 5 étoiles
5/5

Épisodes de podcast liés

Ignorer le carrousel

03 - Les langages de programmation, vecteurs de la pensée informatique
Épisode de podcast
03 - Les langages de programmation, vecteurs de la pensée informatique
deAlgorithmes, machines et langages - Gérard Berry
0 évaluation
0% ont trouvé ce document utile
Marketing local, comment faire ? - Episode 161: Je vois beaucoup d'entrepreneurs venir vers moi pour me demander quelle stratégie digitale implémenter pour leur business, alors que pour moi ce n'est surtout pas par le digital qu'il devraient commencer mais par le bon vieux marketing local.&nb...
Épisode de podcast
Marketing local, comment faire ? - Episode 161: Je vois beaucoup d'entrepreneurs venir vers moi pour me demander quelle stratégie digitale implémenter pour leur business, alors que pour moi ce n'est surtout pas par le digital qu'il devraient commencer mais par le bon vieux marketing local.&nb...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
150. Les 7 tendances réseaux sociaux en 2022: Quelles sont les grandes tendances réseaux sociaux, marketing et communication pour cette année 2022 qui débute ? Quelles sont les nouveautés à ne pas ignorer, les bonnes pratiques à instaurer, les technologies à découvrir ? Dans cet épisode de podcast...
Épisode de podcast
150. Les 7 tendances réseaux sociaux en 2022: Quelles sont les grandes tendances réseaux sociaux, marketing et communication pour cette année 2022 qui débute ? Quelles sont les nouveautés à ne pas ignorer, les bonnes pratiques à instaurer, les technologies à découvrir ? Dans cet épisode de podcast...
deJ'peux Pas J'ai Business par TheBBoost
0 évaluation
0% ont trouvé ce document utile
Organisation personnelle du Manager - Introduction 1: Si tu veux mettre en place un système d'organisation réaliste et adapté à ton management, je te propose une série de 9 mail que j'ai intitulée "Organisé pour le plaisir". C'est par ici pour la recevoir tout de suite : Cela fait...
Épisode de podcast
Organisation personnelle du Manager - Introduction 1: Si tu veux mettre en place un système d'organisation réaliste et adapté à ton management, je te propose une série de 9 mail que j'ai intitulée "Organisé pour le plaisir". C'est par ici pour la recevoir tout de suite : Cela fait...
deOutils du Manager
0 évaluation
0% ont trouvé ce document utile
C'est quoi le job d'un CEO ? avec Franck Denglos le PDG d'Adidas Italie - episode 158: Dans l'épisode d'aujourd'hui j'ai le plaisir de recevoir un invité très spécial, il s'agit de Franck Denglos, le PDG d'Adidas Italie. J'avoue que j'ai été un peu impressionnée quand j'ai vu son nom s'afficher sur mon LinkedIn, et puis fin...
Épisode de podcast
C'est quoi le job d'un CEO ? avec Franck Denglos le PDG d'Adidas Italie - episode 158: Dans l'épisode d'aujourd'hui j'ai le plaisir de recevoir un invité très spécial, il s'agit de Franck Denglos, le PDG d'Adidas Italie. J'avoue que j'ai été un peu impressionnée quand j'ai vu son nom s'afficher sur mon LinkedIn, et puis fin...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
#1 L'Inbound marketing comme source de croissance - avec Juliette Hervé, Allbound marketing manager chez Spendesk: Tu sais comme c’est fatiguant de prospecter tous les jours et de se faire jeter, parfois sans ménagement ? Pendant longtemps, c’était la seule façon de faire pour trouver de nouveaux clients. Et puis, l’Inbound marketing est arrivé ! L’Inbound, comp...
Épisode de podcast
#1 L'Inbound marketing comme source de croissance - avec Juliette Hervé, Allbound marketing manager chez Spendesk: Tu sais comme c’est fatiguant de prospecter tous les jours et de se faire jeter, parfois sans ménagement ? Pendant longtemps, c’était la seule façon de faire pour trouver de nouveaux clients. Et puis, l’Inbound marketing est arrivé ! L’Inbound, comp...
deLe café du market' ☕ ton podcast marketing B2B
0 évaluation
0% ont trouvé ce document utile
La famille Dardeen
Épisode de podcast
La famille Dardeen
deLes Petites Frousses
0 évaluation
0% ont trouvé ce document utile
Les pubs facebook qui marchent avec Danilo Duchesnes - Episode 138: Quand je pense publicité facebook, je pense immédiatement à l'ad manager. J'ai longtemps pensé que la réussite d'une pub résidait dans le paramétrage du facebook ads manager : quelle cible, à quel moment, sur quels formats, avec...
Épisode de podcast
Les pubs facebook qui marchent avec Danilo Duchesnes - Episode 138: Quand je pense publicité facebook, je pense immédiatement à l'ad manager. J'ai longtemps pensé que la réussite d'une pub résidait dans le paramétrage du facebook ads manager : quelle cible, à quel moment, sur quels formats, avec...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
Sénégal : un podcast tech en langue Wolof (Ibrahima Diago, ingénieur podcasteur): Au Sénégal, le podcast Wolof Tech démocratise les technologies auprès des personnes éloignées des langues habituelles de l'informatique. Interview ? Ibrahima Diago, animateur du podcast Wolof Tech (https://woloftech.sn/fr_fr/) "Près de 54% de la popul...
Épisode de podcast
Sénégal : un podcast tech en langue Wolof (Ibrahima Diago, ingénieur podcasteur): Au Sénégal, le podcast Wolof Tech démocratise les technologies auprès des personnes éloignées des langues habituelles de l'informatique. Interview ? Ibrahima Diago, animateur du podcast Wolof Tech (https://woloftech.sn/fr_fr/) "Près de 54% de la popul...
deMonde Numérique (Actualité des Technologies)
0 évaluation
0% ont trouvé ce document utile
Episode #57 Sortir de la rat race - avec Anthony Poncet: Mon invité du jour est Anthony Poncet, qui a de multiples casquettes. Certains d’entre vous le connaissent pour son podcast “Une vie de liberté” ou “Les Gentlemen Investisseurs” qu’il co-anime avec son ami et investisseur Yann.
Épisode de podcast
Episode #57 Sortir de la rat race - avec Anthony Poncet: Mon invité du jour est Anthony Poncet, qui a de multiples casquettes. Certains d’entre vous le connaissent pour son podcast “Une vie de liberté” ou “Les Gentlemen Investisseurs” qu’il co-anime avec son ami et investisseur Yann.
deRichissime
0 évaluation
0% ont trouvé ce document utile
Comment créer son site internet – 2ème partie – Episode 12: Si vous écoutez ce podcast, c’est que vous vous intéressez au marketing digital. Et qui dit marketing digital, dit site internet. Le but de l’épisode d’aujourd’hui est de vous expliquer comment faire pour créer son site internet. L’article Comment cré...
Épisode de podcast
Comment créer son site internet – 2ème partie – Episode 12: Si vous écoutez ce podcast, c’est que vous vous intéressez au marketing digital. Et qui dit marketing digital, dit site internet. Le but de l’épisode d’aujourd’hui est de vous expliquer comment faire pour créer son site internet. L’article Comment cré...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
NFT, Play To Earn, GameFi, Blockchain Gaming, Metaverse : Guide d’investissement.: ? Reçois mes mails quotidiens ► http://bit.ly/1m…
Épisode de podcast
NFT, Play To Earn, GameFi, Blockchain Gaming, Metaverse : Guide d’investissement.: ? Reçois mes mails quotidiens ► http://bit.ly/1m…
deLe podcast de la Liberté Financière
0 évaluation
0% ont trouvé ce document utile
Créer un nouveau marché pour devenir numéro 1 - avec Alexandre Azra
Épisode de podcast
Créer un nouveau marché pour devenir numéro 1 - avec Alexandre Azra
deMarketing Mania - Conversations d'entrepreneurs
0 évaluation
0% ont trouvé ce document utile
Les 4 étapes d'un tunnel de vente qui convertit - Episode 94: >> Masterclass Gratuite - Être visible de ses client << Sur inscription les 5, 7 et 12 Octobre 2021 ? lepodcastdumarketing.com/masterclass En ce moment, je suis à fond sur ma toute nouvelle Masterclass et ça m'a fait réaliser que je n'...
Épisode de podcast
Les 4 étapes d'un tunnel de vente qui convertit - Episode 94: >> Masterclass Gratuite - Être visible de ses client << Sur inscription les 5, 7 et 12 Octobre 2021 ? lepodcastdumarketing.com/masterclass En ce moment, je suis à fond sur ma toute nouvelle Masterclass et ça m'a fait réaliser que je n'...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
Comment créer une publicité Facebook efficace – Episode 22: Joseph Donyo, consultant et formateur en spécialisé en publicité Facebook nous explique tout ce qu'il y a savoir pour créer une campagne Facebook efficace. L’article Comment créer une publicité Facebook efficace – Episode 22 (https://lepodcastdumarketi...
Épisode de podcast
Comment créer une publicité Facebook efficace – Episode 22: Joseph Donyo, consultant et formateur en spécialisé en publicité Facebook nous explique tout ce qu'il y a savoir pour créer une campagne Facebook efficace. L’article Comment créer une publicité Facebook efficace – Episode 22 (https://lepodcastdumarketi...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
#195 - Stéphane André - l'Art Oratoire - Changer l’histoire de l’humanité avec des mots: L’art oratoire est un art avant tout. Comme tout art, qu’il s’agisse de danse classique ou de chant lyrique, il convient de travailler sa technique pour progresser et, par le travail, l’art oratoire devient accessible à tous. Ancien bègue,
Épisode de podcast
#195 - Stéphane André - l'Art Oratoire - Changer l’histoire de l’humanité avec des mots: L’art oratoire est un art avant tout. Comme tout art, qu’il s’agisse de danse classique ou de chant lyrique, il convient de travailler sa technique pour progresser et, par le travail, l’art oratoire devient accessible à tous. Ancien bègue,
deGénération Do It Yourself
0 évaluation
0% ont trouvé ce document utile
CRYPTO : piège à venir ? à quoi s'attendre en 2024 ? la renaissance des NFT (et une pépite crypto): ? Mon livre bestseller IMMOBITCOIN (gratuit) ► h…
Épisode de podcast
CRYPTO : piège à venir ? à quoi s'attendre en 2024 ? la renaissance des NFT (et une pépite crypto): ? Mon livre bestseller IMMOBITCOIN (gratuit) ► h…
deLe podcast de la Liberté Financière
0 évaluation
0% ont trouvé ce document utile
2. Comment créer une stratégie de communication: Dans cet épisode, je vous donne les 9 étapes clés pour vous créer une stratégie de communication puissante et alignée avec vous et votre business ! On y parle "concurrents", objectifs, client idéal, création de contenu mais aussi plateforme de marque e...
Épisode de podcast
2. Comment créer une stratégie de communication: Dans cet épisode, je vous donne les 9 étapes clés pour vous créer une stratégie de communication puissante et alignée avec vous et votre business ! On y parle "concurrents", objectifs, client idéal, création de contenu mais aussi plateforme de marque e...
dePetite Pousse - Bien-être, Business & Mindset
0 évaluation
0% ont trouvé ce document utile
Faut-il absolument poster un contenu différent sur toutes les plateformes ?: Épisode 553 : Faut-il absolument poster un contenu différent sur toutes les plateformes ? C’est le grand débat ! Est-ce que je crée du contenu spécifique pour chaque plate-forme ou est-ce qu’il faut que je recycle des contenus sur toutes les plate-formes ?
Épisode de podcast
Faut-il absolument poster un contenu différent sur toutes les plateformes ?: Épisode 553 : Faut-il absolument poster un contenu différent sur toutes les plateformes ? C’est le grand débat ! Est-ce que je crée du contenu spécifique pour chaque plate-forme ou est-ce qu’il faut que je recycle des contenus sur toutes les plate-formes ?
deLe Super Daily
0 évaluation
0% ont trouvé ce document utile
Capsule #4 Peut-on gagner de l'argent facilement ?: Pour la plupart d'entre nous, il est impossible de gagner de l'argent facilement... >> sauf quand on a hérité ?? >> sauf quand on gagne au loto ? >> sauf à arnaquer les gens ou à exploiter les autres ?‍♂️ C'est ce...
Épisode de podcast
Capsule #4 Peut-on gagner de l'argent facilement ?: Pour la plupart d'entre nous, il est impossible de gagner de l'argent facilement... >> sauf quand on a hérité ?? >> sauf quand on gagne au loto ? >> sauf à arnaquer les gens ou à exploiter les autres ?‍♂️ C'est ce...
deRichissime
0 évaluation
0% ont trouvé ce document utile
Ecrire un livre professionnel avec Muriel Herber - Episode 115: Quand j’étais petite et qu’on me demandait ce que je voulais faire dans la vie, je répondais : Ecrivain Célèbre. J’avoue que je ne sais pas bien pourquoi j’avais décidé en CE2 de devenir écrivain, mais c’est ce que je répondais mordicus à qui me posa...
Épisode de podcast
Ecrire un livre professionnel avec Muriel Herber - Episode 115: Quand j’étais petite et qu’on me demandait ce que je voulais faire dans la vie, je répondais : Ecrivain Célèbre. J’avoue que je ne sais pas bien pourquoi j’avais décidé en CE2 de devenir écrivain, mais c’est ce que je répondais mordicus à qui me posa...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
100%
100% ont trouvé ce document utile
#38 COMMENT J'AI ACHETÉ MON 1ER IMMEUBLE POUR 490€ (et revendu 370.000)
Épisode de podcast
#38 COMMENT J'AI ACHETÉ MON 1ER IMMEUBLE POUR 490€ (et revendu 370.000)
deBusiness en Bagnole !
0 évaluation
0% ont trouvé ce document utile
Parler à son audience - Episode 160: Parler à son audience, parler à ses futurs clients c'est la première chose que doit faire toute personne qui veut travailler son marketing. Avant de faire quoi que ce soit, il faut commencer par discuter avec les personnes qui pourraient être ses fu...
Épisode de podcast
Parler à son audience - Episode 160: Parler à son audience, parler à ses futurs clients c'est la première chose que doit faire toute personne qui veut travailler son marketing. Avant de faire quoi que ce soit, il faut commencer par discuter avec les personnes qui pourraient être ses fu...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
Développement durable sur la blockchain (et créer un cryptoactif)(avec PlayItOpen): ▶︎ Développement durable sur la blockchain ▶︎ Cré…
Épisode de podcast
Développement durable sur la blockchain (et créer un cryptoactif)(avec PlayItOpen): ▶︎ Développement durable sur la blockchain ▶︎ Cré…
deLe podcast de la Liberté Financière
0 évaluation
0% ont trouvé ce document utile
3. Comment choisir le ou les bons réseaux sociaux pour son activité ?: Dans cet épisode, je vous explique comment choisir le ou les bons réseaux sociaux pour développer votre activité. Parce qu'il n'y a pas de réseau social idéal, tout dépend de votre activité, de vos clients... et pour cela il faut se poser les bonnes qu...
Épisode de podcast
3. Comment choisir le ou les bons réseaux sociaux pour son activité ?: Dans cet épisode, je vous explique comment choisir le ou les bons réseaux sociaux pour développer votre activité. Parce qu'il n'y a pas de réseau social idéal, tout dépend de votre activité, de vos clients... et pour cela il faut se poser les bonnes qu...
dePetite Pousse - Bien-être, Business & Mindset
0 évaluation
0% ont trouvé ce document utile
Qu'est-ce que la Blockchain?: Qu'est-ce que la Blockchain?
Épisode de podcast
Qu'est-ce que la Blockchain?: Qu'est-ce que la Blockchain?
deMaintenant, vous savez
0 évaluation
0% ont trouvé ce document utile
#84 L’éducation financière est-elle suffisante pour lutter contre la précarité ? - avec Yael Schmitt: Accompagner les personnes en difficulté financière ⛑️ C’est le sujet de ce nouvel épisode en compagnie de Yael Schmitt. Banquier de métier, depuis 4 ans, il réalise des missions d’éducation budgétaire et financière au sein de l’association Finance & P...
Épisode de podcast
#84 L’éducation financière est-elle suffisante pour lutter contre la précarité ? - avec Yael Schmitt: Accompagner les personnes en difficulté financière ⛑️ C’est le sujet de ce nouvel épisode en compagnie de Yael Schmitt. Banquier de métier, depuis 4 ans, il réalise des missions d’éducation budgétaire et financière au sein de l’association Finance & P...
deRichissime
0 évaluation
0% ont trouvé ce document utile
#14 Jeunes, Retraite et (In)dépendance financière: A-t-on les moyens de négliger notre retraite ? A nous les jeunes de 15 à 35 ans qui pensons que la retraite c'est dans longtemps, que de nombreux gouvernements auront changé maintes fois les règles du jeu d'ici là, nous qui avons des carrière...
Épisode de podcast
#14 Jeunes, Retraite et (In)dépendance financière: A-t-on les moyens de négliger notre retraite ? A nous les jeunes de 15 à 35 ans qui pensons que la retraite c'est dans longtemps, que de nombreux gouvernements auront changé maintes fois les règles du jeu d'ici là, nous qui avons des carrière...
deRichissime
0 évaluation
0% ont trouvé ce document utile
Comment Développer Son Réseau ? (Et Booster Son Chiffre D’Affaires) w/ Laura Strelezki: La méthode pour élargir son réseau et créer des opportunités
Épisode de podcast
Comment Développer Son Réseau ? (Et Booster Son Chiffre D’Affaires) w/ Laura Strelezki: La méthode pour élargir son réseau et créer des opportunités
deL’After Market’ ⚡️ le talk show du marketing digital
0 évaluation
0% ont trouvé ce document utile
LCC 292 - Enterprise Go Beans: Cet épisode nouvelles discute d’améliorations dans le JDK, d’Hibernate 6, de Service Weaver, de la fin d’options dans DockerHub pour certains projets open source, de Gradle, de cURL et pleins d’autres choses encore. Enregistré le 17 mars...
Épisode de podcast
LCC 292 - Enterprise Go Beans: Cet épisode nouvelles discute d’améliorations dans le JDK, d’Hibernate 6, de Service Weaver, de la fin d’options dans DockerHub pour certains projets open source, de Gradle, de cURL et pleins d’autres choses encore. Enregistré le 17 mars...
deLes Cast Codeurs Podcast
0 évaluation
0% ont trouvé ce document utile

Articles associés

Ignorer le carrousel

Créez Votre Site Web Perso (Partie 2)
Micro Pratique
Article
Créez Votre Site Web Perso (Partie 2)
10 juin 2020
Lecture de 6 min
Game Over Pour Les Traders ?
Science & Vie
Article
Game Over Pour Les Traders ?
15 déc. 2021
Lecture de 3 min
Le Classement Des Solutions antivirus 2022
Micro Pratique
Article
Le Classement Des Solutions antivirus 2022
18 janv. 2022
✒ Avec le développement d’Internet et des réseaux interconnectés, il est nécessaire voire indispensable de prendre certaines précautions pour ne pas voir son travail ou ses loisirs gâchés par des personnes ou des codes malveillants, qu’ils cherchent
Lecture de 4 min
Comprendre L’intelligence Artificielle
Micro Pratique
Article
Comprendre L’intelligence Artificielle
9 juil. 2021
Lecture de 5 min
« Métavers » : L’oeuvre De Dieu, La Part Du Diable
L'Express
Article
« Métavers » : L’oeuvre De Dieu, La Part Du Diable
1 sept. 2021
Lecture de 5 min
Créez Un Site Web Avec Google Sites
Micro Pratique
Article
Créez Un Site Web Avec Google Sites
10 juin 2021
Il existe de nombreux outils de création de sites web mais les outils les plus utilisés comme WordPress nécessite de bonnes connaissances techniques alors que d’autres sont payants. Google a mis en ligne une nouvelle version de son outil de création
Lecture de 7 min
Cyberattaques Quelles Menaces Pèsent Sur L’élection Présidentielle?
Science & Vie
Article
Cyberattaques Quelles Menaces Pèsent Sur L’élection Présidentielle?
23 févr. 2022
Lecture de 6 min
Comprendre Les De Recherche Moteurs
Micro Pratique
Article
Comprendre Les De Recherche Moteurs
17 janv. 2021
Lecture de 6 min
L’inventeur Oublié Du Web
Sept
Article
L’inventeur Oublié Du Web
1 juil. 2019
Lecture de 65 min
II. Comment Beeple A Cassé Le Marché De L’art
Vanity Fair France
Article
II. Comment Beeple A Cassé Le Marché De L’art
4 oct. 2021
Lecture de 15 min
Vos Posts Sur Les Réseaux Et Votre Site Web Avec Wix
Micro Pratique
Article
Vos Posts Sur Les Réseaux Et Votre Site Web Avec Wix
10 déc. 2021
Lecture de 3 min
Huit Acteurs Majeurs De L’économie Lyonnaise
The Good Life
Article
Huit Acteurs Majeurs De L’économie Lyonnaise
11 févr. 2021
Il serait injuste de prétendre que personne ne l’attendait à ce poste. Certes, à 46 ans, Grégory Doucet était un inconnu avant son élection du 28 juin 2020, mais cela faisait déjà plusieurs années qu’il se préparait à « déloger » Gérard Collomb d’une
Lecture de 12 min
Les Mille Visages Du Métavers
Science & Vie Junior
Article
Les Mille Visages Du Métavers
12 janv. 2022
Lecture de 6 min
Publicité En Ligne: Le Graal De La Grande Distribution
L'Express
Article
Publicité En Ligne: Le Graal De La Grande Distribution
17 nov. 2021
Lecture de 4 min
Créez Votre Site Web Perso (partie 4)
Micro Pratique
Article
Créez Votre Site Web Perso (partie 4)
13 août 2020
Lecture de 5 min
Succès Invisibles
The Good Life
Article
Succès Invisibles
15 févr. 2022
Lecture de 6 min
Google Chrome: Optimisez L’utilisation De La Mémoire Vive
Micro Pratique
Article
Google Chrome: Optimisez L’utilisation De La Mémoire Vive
11 déc. 2020
Lecture de 3 min
Management : Les Méthodes Qui Marchent
L'Express
Article
Management : Les Méthodes Qui Marchent
23 mars 2023
Lecture de 2 min
Gibraltar, The Rockchain
The Good Life
Article
Gibraltar, The Rockchain
28 juin 2022
Lecture de 9 min
Logiciels Gratuits sans Modération
Micro Pratique
Article
Logiciels Gratuits sans Modération
18 janv. 2022
Lecture de 3 min
Créez Votre Site Web Perso (Partie 5)
Micro Pratique
Article
Créez Votre Site Web Perso (Partie 5)
11 sept. 2020
Le dossier « Créez votre site Web perso » commencé il y a quatre mois se termine ici avec l’optimisation et la monétisation de son site web. Rappelons les chapitres de notre dossier: 1/ Faites les bons choix (Micro Pratique n°285) 2/ Créez votre site
Lecture de 6 min
Monnaie Numérique : La Nouvelle Donne
L'Express
Article
Monnaie Numérique : La Nouvelle Donne
5 janv. 2022
Changchun Mu comptetil chaque jour le nombre de nouveaux utilisateurs ? Ce qui est sûr, c’est que ce haut dirigeant de la Banque centrale chinoise surveille comme le lait sur le feu la courbe d’adoption du yuan numérique. Testée depuis un peu plus d’
Lecture de 2 min
L’encyclopédie De La Micro 2022
Micro Pratique
Article
L’encyclopédie De La Micro 2022
8 juil. 2022
Lecture de 25 min
Organisez Vos Projets Avec Monday.com
Micro Pratique
Article
Organisez Vos Projets Avec Monday.com
9 avr. 2021
Lecture de 3 min
L’entretien Au Quotidien De Sa Machine
Micro Pratique
Article
L’entretien Au Quotidien De Sa Machine
12 août 2022
La poussière étant la pire ennemie des composants électroniques, il est nécessaire de faire un grand ménage au moins une fois par an. Cela ne nécessite pas forcément beaucoup de matériel sur un ordinateur fixe. En effet, il suffit bien souvent d’ouvr
Lecture de 3 min
Créez Votre Site Internet Avec Webnode
Micro Pratique
Article
Créez Votre Site Internet Avec Webnode
18 janv. 2022
Lecture de 4 min
Les Designers Confrontés À La Stratégie De L’éphémère
Intramuros
Article
Les Designers Confrontés À La Stratégie De L’éphémère
15 avr. 2019
Lecture de 4 min
Les Nouveautés De L’été!
Moteur Boat Magazine
Article
Les Nouveautés De L’été!
20 juil. 2022
Les principaux acteurs mondiaux de l’électronique de navigation comme Navico (Simrad, Lowrance, B&G et C-Map), Garmin et Raymarine ont, à quelques semaines d’intervalle, présenté leurs nouveautés de début de saison. Malgré leurs différences, ces fabr
Lecture de 2 min
Les Réseaux Mesh: Performances Et Couverture Parfaite
Micro Pratique
Article
Les Réseaux Mesh: Performances Et Couverture Parfaite
10 juin 2020
Il s’agit classiquement d’un routeur principal et d’extensions que l’on va placer dans différentes pièces de la maison afin d’optimiser la couverture Wi-Fi. Mais l’originalité réside dans le fait que le routeur et toutes les extensions vont constitue
Lecture de 5 min

Catégories liées

Ignorer le carrousel

Avis sur Le traitement BigData

Évaluation : 0 sur 5 étoiles

0 évaluation

0 notation0 avis

Aperçu du livre

Le traitement BigData - Hadi Hashem

INTRODUCTION DE L’OUVRAGE

LA PROBLÉMATIQUE ET LE CONTEXTE DU TRAVAIL

Des volumes considérables de données sont créés tous les jours à partir des données utilisateur générées automatiquement sur Internet. Réseaux sociaux, appareils mobiles, messagerie électronique, blogs, vidéos, transactions bancaires et autres interactions utilisateur, pilotent désormais les campagnes Marketing, les études sociodémographiques, les enquêtes de polices et les intentions électorales, en établissant une nouvelle dimension appelée BigData.

Les moteurs de base de données basés sur le standard SQL et créés dans les années 1970 ont de bonnes performances lors du traitement de petites quantités de données relationnelles mais ces outils sont très limités face à l’expansion des données en volume et en complexité. Le traitement MPP créé initialement au début des années 1980 a amélioré légèrement les indicateurs de performance pour les volumes de données complexes. Cependant, ce traitement n’a pas pu être utilisé pour le traitement des données non-relationnelles à expansion permanente.

Des outils puissants sont requis pour stocker et exploiter ces données en expansion quotidienne, dans le but de soumettre un traitement simple et fiable, des données récoltées des utilisateurs. Des résultats rapides et de bonne qualité sont attendus. Pour les industriels et les décideurs en général, ces résultats sont aussi importants que les plus lourds investissements métier. Les opérateurs de modélisation traditionnels sont confrontés à leurs limitations dans ce défi, puisque les informations se multiplient en volume et complexité, une chose qui actuellement ne peut être gérée que par des techniques de modélisation non-relationnelles. Hadoop MapReduce est considéré comme la technique de traitement la plus efficace, comparée aux bases de données SQL et au traitement MPP. Hadoop dispose d’une performance proportionnelle à la complexité des données volumineuses. C’est un outil efficace pour résoudre les problèmes de données massives mais c’est aussi un concept qui a changé l’organisation des systèmes de traitement en large échelle. Cependant, malgré le succès qu’il a eu, ce modèle n’a pas encore atteint son aspect final en tant que solution informatique mature. Au contraire, il s’agit d’un point de départ vers d’autres perspectives.

Par ailleurs, l’interaction consommateur sur Internet est considérée comme un nouveau canal digital entre les marques et leur audience. Plusieurs EO de données sont créés au quotidien sous forme d’information basée sur des modèles de données en expansion continue, en volume et complexité. Les modèles de notation consommateur intégrant des fonctionnalités de prédiction ont atteint des résultats significatifs en termes de taux de conversion. En utilisant des techniques statistiques et d’autres données consommateurs disponibles sur Internet, des modèles de prédiction personnalisés peuvent être créés afin d’identifier le potentiel des consommateurs.

Dans le contexte de cet ouvrage, le travail consiste à adresser cette question en se basant sur une boîte à outils contenant des opérateurs de modélisation permettant d’établir un pré-traitement des données avant l’envoi au serveur de calcul. Ce travail propose également un mariage de 2 technologies du domaine informatique pour créer un modèle d’application générique : les systèmes de gestion des bases de données (SGBD) et le raisonnement par étude de cas (CBR). Les SGBD fournissent des facilités bas niveau, en revanche, ils assurent une assistance minime en termes d’interface utilisateur et d’extraction de données. Les SGBD ne permettent pas de faire des raisonnements logiques à partir des données stockées, ce qui empêche de mettre en avant la valeur intrinsèque des données. Comme nous le verrons, le SGBD couplé à un moteur d’inférence CBR est plus performant et plus efficace sur cet aspect.

Le rapprochement entre ces 2 techniques permet d’obtenir un concept personnalisable, facilitant la création d’une chaîne de traitement basée sur des opérateurs de modélisation à la carte et profitant des performances de calcul de Hadoop MapReduce. Il s’agit donc d’un traitement BigData en utilisant les règles du raisonnement par étude de cas à l’échelle des réseaux distribués et garantissant un traitement décentralisé, séquentiel, isolé du développeur et évolutif selon le besoin en vigueur.

LES OBJECTIFS DE CET OUVRAGE

L’objectif premier de ce travail est de contribuer à l’établissement d’une vision intégratrice du cycle de vie des données. Cette vision s’intéresse en particulier mais sans exclusive, au pré-traitement des données et s’appuie sur les 3 étapes suivantes :

1.L’acquisition des micro-données diverses et variées, de sources multiples, de tailles, de sémantiques et de formats différents, à travers des connecteurs assurant une conversion des flux en fichiers à stocker, selon le modèle de base de données utilisé.

2.Le pré-traitement via des opérateurs de modélisation sélectionnés par l’utilisateur selon une configuration précise et adéquate avec son besoin, dans le but d’identifier les données nécessaires pour calculer le résultat final parmi le reste.

3.Le traitement des données présélectionnées par les opérateurs de modélisation dans le moteur de calcul et l’obtention d’une indication sur le résultat final recherché.

Cette vision intégratrice mènera à l’étude d’un modèle de pré-traitement à base de cas reposant sur un rapprochement entre un système expert et un système de gestion de base de données permettant d’élaborer un concept de moteur d’inférence avec une base de connaissance de prédicats. Ce modèle étant un moyen efficace pour lancer un pré-traitement des données BigData en se basant sur des cas similaires et permettant par conséquent d’arriver rapidement à une indication sur le résultat final, avec un niveau de tolérance raisonnable. Les approches proposées ont été validées par des prototypes logiciels traitant des jeux de données réalistes et exhibant des gains d’efficacité tangibles.

Enfin, dans le cadre de ce travail, on veille à proposer un modèle intuitif clé en main, permettant d’améliorer les performances du traitement avec des coûts moins importants, ne nécessitant pas une connaissance technique approfondie dans un domaine technologique en expansion continue et ayant à la fois un impact positif sur les performances de la chaîne de traitement, par conséquent, sur l’environnement.

LE PLAN DE DÉVELOPPEMENT

Cet ouvrage est organisé en 4 parties, dans le but de fournir au lecteur une vue panoramique sur l’histoire de traitement des données.

La première partie introduira l’état de l’art du traitement des données BigData.

Dans le premier chapitre, on détaillera l’évolution des systèmes de gestion des bases de données non-relationnelles. On définira les bases de données NoSQL, dont l’usage est le plus répandu aujourd’hui dans les technologies de traitement BigData. Ensuite, on introduira sa dérivée, la base de données NewSQL, tout en exposant son architecture, ses avantages, ainsi que ses limitations. On exposera par la suite la technologie Hadoop MapReduce dans le cadre d’une analyse de l’efficacité des moteurs de traitement existants. Cela permettra de définir plus tard les différents modèles de base de données non-relationnelles existants et leur usage, ainsi que les bases de données multi-modèle. Ensuite, on consacrera la dernière section à l’activité principale des systèmes distribués en termes de consistance, de création des données, de coordination, ainsi que les autres aspects de gestion, notamment la répartition de la charge, la tolérance aux pannes et la haute disponibilité. Enfin, on terminera ce chapitre par la description des difficultés générales de mise en œuvre de ces technologies.

Le deuxième chapitre introduira le Framework MapReduce et ses principales caractéristiques le mettant en avant par rapport aux autres technologies. On présentera par la suite les différentes techniques de traitement et patrons de conception, tels que le tri, les jointures, l’indexation, le classement et la conversion. Le traitement des graphes avec MapReduce sera abordé, ainsi que les algorithmes de traitement de texte. Ensuite on évoquera les différents projets et évolutions de l’univers MapReduce, en particulier la nouvelle génération appelée YARN et les principaux projets dérivés d’Apache Hadoop, Apache Storm et Apache Spark. On évoquera par la suite la publication d’Apache Hadoop 3, pour finir ce chapitre avec un tableau comparatif des différentes possibilités proposées.

Le troisième chapitre exposera les recherches portant plus particulièrement sur l’approche de la modélisation intégratrice. On définira également les 3 grandes familles des techniques de modélisation, la modélisation conceptuelle, la modélisation générale et la modélisation hiérarchique. Ensuite, on présentera le périmètre de cette recherche et la motivation de ce travail qui consiste à proposer un modèle de traitement intuitif et clé en main, ne nécessitant pas une connaissance technique approfondie dans le domaine BigData et permettant d’optimiser les performances de la chaîne de traitement.

Le quatrième chapitre expliquera en détail les principaux algorithmes de modélisation avec MapReduce. Cela comprend les principaux opérateurs de modélisation, tels que le filtre, le découpage, la transformation ou la fusion, ainsi que les patrons basiques et non-basiques de MapReduce. Dans cette catégorie, on définira les algorithmes d’agrégation et d’assemblage, le tri, les tâches distribuées, ainsi que les algorithmes de traitement des graphes. Par la suite, on évoquera les patrons relationnels MapReduce, comme la sélection, l’intersection, la projection, l’union, les jointures et d’autres. Pour finir, on présentera l’API Trident d’Apache Storm, ainsi que les potentiels de l’apprentissage automatique (Machine Learning ou apprentissage-machine) avec MapReduce.

La seconde partie décrira le travail élaboré pour approcher la problématique de la modélisation.

Le cinquième chapitre introduira un algorithme de pré-traitement via un raisonnement par étude de cas et ce en 2 parties. D’abord, on présentera brièvement les systèmes experts et les avantages d’un rapprochement avec les systèmes de gestion des bases de données. On expliquera par la suite le concept du moteur d’inférence basé sur les règles et les profils à définir, ainsi que son utilisation dans un contexte de modélisation intégratrice à l’échelle BigData. Pour finir, on évoquera les perspectives d’enrichissement de la base de cas via l’apprentissage automatique. Dans la deuxième partie, on se situera dans un contexte de surveillance des réseaux sociaux. On appliquera alors le concept de pré-traitement par étude de cas et son adaptation aux besoins métier.

Le sixième chapitre permettra de présenter quelques cas d’emploi, ainsi que les résultats expérimentaux. Dans ce contexte, on réalisera d’abord une étude des données Twitter suivie d’une autre étude plus globale. Ensuite, on abordera le pré-traitement par étude de cas, à travers 3 cas d’emploi adaptés à la vie quotidienne en entreprise et le besoin d’outils performants de traitement des données :

1.L’évaluation du profil revendeur

2.Les changements dans le trafic routier

3.La détection d’un taux d’attrition élevé

La troisième partie est consacrée à l’Internet des objets en tant que concept et applications dans la vie quotidienne d’un individu, ainsi que dans le domaine professionnel.

Le septième chapitre décrira brièvement le mécanisme de l’Internet des objets. On détaillera ensuite l’histoire de sa naissance, son concept de base et ses applications dans la sphère privée sous la forme d’une maison intelligente et d’une ville intelligente, ainsi que dans la dimension professionnelle, notamment la notion d’industrie 4.0, la liaison par satellite et la technologie Blockchain. Pour finir, on expliquera les opportunités et les risques tout en mettant en avant l’aspect de la sécurité des échanges.

Le huitième chapitre sera consacré à la modélisation dans l’univers de l’Internet des objets. Dans ce contexte on présentera concrètement 2 aspects correspondants :

1.L’architecture et les plateformes

2.L’exploitation des données

Finalement, la dernière partie présentera la conclusion et les perspectives de développement de la modélisation en général et le pré-traitement par étude de cas.

PARTIE 1. ÉTAT DE L’ART

CHAPITRE 1. LE TRAITEMENT DES DONNÉES BIGDATA

1.1 Introduction au chapitre

Depuis leur création, les bases de données, à taille petite ou volumineuse, sont devenues une entité essentielle et inséparable d’un applicatif ou d’un site Internet quelconque. Les bases de données relationnelles les plus répandues à l’époque, avaient leurs SGBD disponibles par défaut dans les systèmes informatiques.

Avec l’expansion du nombre d’internautes et la multitude des terminaux et objets connectés, les bases de données relationnelles ne sont plus capables de supporter les données volumineuses (stocker, extraire, déplacer et copier), surtout si elles sont distribuées sur plusieurs serveurs. D’où la nécessité d’une nouvelle génération de bases de données avancées, compatible avec l’étendue géographique des réseaux immenses de serveurs, dits Clusters et capable de gérer des quantités importantes de données, principalement liées à l’essor des plateformes numériques, des capteurs sans fil, des applications de réalité virtuelle, et des milliards de smartphones en circulation.

Figure 1 : Expansion exponentielle des données échangées sur Internet

La Figure 1 montre l’évolution des systèmes d’information et des données échangées depuis la création des réseaux informatiques jusqu’à la nouvelle génération du Web, permettant aux internautes de contribuer à l’échange d’information et d’interagir de façon simple, à la fois au niveau du contenu et de la structure des pages, créant notamment ce qu’on appelle de nos jours, le Web social.

1.2 Les bases de données NoSQL

Désormais, l’ubiquité de la connexion Internet est une réalité (les voitures que nous conduisons, les montres que nous portons, nos petits appareils médicaux domestiques, nos réfrigérateurs et congélateurs, nos Smartphones et ordinateurs portables). De plus, les données numériques produites par les êtres humains, dont les documents, les enregistrements vocaux, les séquences vidéo, les photos et autres, atteignent des volumes importants de plusieurs EO par jour.

Ces données actuellement stockées dans des bases qui leur ont été conçues spécifiquement, sont gérées par des logiciels de gestion de bases de données volumineuses, jouant le rôle d’intermédiaires entre les bases de données d’un côté et les applicatifs et leurs utilisateurs de l’autre. On parle ici des bases de données non-relationnelles, dites NoSQL.

1.2.1 Le mouvement NoSQL et l’élaboration du terme

Carlo Strozzi a utilisé le terme NoSQL ou Not Only SQL en premier en 1998 pour désigner la base de données relationnelle Open Source qu’il a développée et qui ne disposait pas d’une interface SQL comme ses homologues. Carlo Strozzi a proposé par la suite de changer le terme NoSQL en NoRel pour non-relationnelles, vu que ce mouvement a convergé avec le temps vers les bases de données non-relationnelles uniquement. En 2009, le terme NoSQL a été réintroduit par Eric Evans à une échelle plus large, décrivant les nombreuses bases de données s’opposant à la notion relationnelle et possédant les caractéristiques suivantes :

1.Elles sont toutes compatibles avec les systèmes distribués.

2.Elles sont de type Open Source.

3.Elles sont de type non-relationnel.

1.2.2 La définition NoSQL et les avantages pour les développeurs

NoSQL est un type spécifique de bases de données, permettant de stocker et de récupérer les données après restructuration, en utilisant des techniques différentes de celles connues dans les bases de données relationnelles. Les développeurs de nos jours ont tendance à utiliser ce type de bases de données pour la simplicité de leur implémentation et leur évolutivité sans limites (horizontalement, à travers de nouvelles colonnes).

Afin d’obtenir de meilleures performances, les bases de données NoSQL ont abandonné certaines fonctionnalités proposées par défaut par les bases relationnelles comme les transactions ou encore les vérifications d’intégrités. Le premier besoin fondamental auquel répond NoSQL est la performance. C’est pour répondre à ce besoin que cette solution a vu le jour en procédant à des compromis sur le caractère ACID des systèmes de gestion de bases de données relationnels. Ces intelligents compromis sur la notion de relationnel ont permis de dégager les systèmes de gestion de bases de données relationnels de leurs freins à l’évolutivité.

De nos jours, NoSQL est devenu inséparable du BigData, le terme décrivant les données volumineuses et en expansion permanente, ainsi que des applicatifs temps réel. Cette technologie remplace progressivement les bases de données relationnelles, assurant ainsi une haute performance.

1.2.3 Les caractéristiques des bases de données NoSQL

Les bases de données NoSQL regroupent plusieurs caractéristiques apportant chacune une valeur ajoutée à leur usage :

1.Le coût raisonnable et la facilité de mise en œuvre.

2.Le partitionnement et la copie des fichiers de données sur plusieurs machines.

3.La structure dynamique n’ayant pas de schéma de données fixe.

4.L’évolutivité en rajoutant des colonnes, ce qui permet de traiter les données plus rapidement.

5.La rapidité du transfert des données, comparé aux bases de données classiques.

6.L’évolutivité en rajoutant des nœuds supplémentaires dans le Cluster sans avoir besoin de faire une répartition.

De plus les bases de données NoSQL sont sujettes au théorème CAP et ne sont pas conformes aux propriétés ACID, contrairement aux bases de données relationnelles. Les réseaux sociaux appliquent fortement l’utilisation des bases de données NoSQL, vu leurs besoins compatibles avec CAP et contrairement aux banques nécessitant plus de rigidité.

1.2.3.1 Les propriétés ACID

Il s’agit d’un ensemble de propriétés qui garantissent une transaction exécutée de façon fiable :

1.L’atomicité, dite Atomicity, est une propriété qui assure qu’une transaction se fait au complet ou pas du tout. Si une partie d’une transaction ne peut être faite, il faudra effacer toute trace de la transaction et remettre les données dans l’état où elles étaient avant la transaction. L’atomicité doit être respectée dans toute situation, comme une panne d’électricité, une défaillance de l’ordinateur ou une panne d’un disque magnétique.

2.La consistance, dite Consistency, qui assure que chaque transaction amènera le système d’un état valide à un autre état valide. Tout changement à la base de données doit être valide selon toutes les règles définies, incluant mais non-limitées aux contraintes d’intégrité, aux restaurations du système en cascade, dites Rollbacks, aux déclencheurs de base de données et à toute combinaison d’événements.

3.L’isolation, dite Isolation, qui fait en sorte que toute transaction doit s’exécuter comme si elle était la seule sur le système. Aucune dépendance possible entre les transactions. Cette propriété assure que l’exécution simultanée de transactions produit le même état que celui qui serait obtenu par l’exécution en série des transactions. Chaque transaction doit s’exécuter en isolation totale. Si 2 transactions s’exécutent simultanément, alors chacune devra demeurer indépendante de l’autre.

4.La durabilité, dite Durability, qui assure que lorsqu’une transaction a été confirmée, elle demeure enregistrée même à la suite d’une panne d’électricité, d’une panne de l’ordinateur ou d’un autre problème. Par exemple, dans une base de données relationnelle, lorsqu’un groupe de requêtes SQL est exécuté, les résultats doivent être enregistrés de façon permanente, même dans le cas d’une panne immédiatement après l’exécution des requêtes.

1.2.3.2 Le théorème CAP

Le théorème CAP, en français dit CDP, connu également sous le nom de théorème de Brewer, affirme qu’il est impossible sur un système informatique de calcul distribué de garantir en même temps les 3 contraintes de consistance, disponibilité et persistance au morcellement :

1.La consistance, dite Consistency, de façon à ce que tous les nœuds du système voient exactement les mêmes données au même moment.

2.La disponibilité, dite Availability, de façon à garantir que toutes les requêtes reçoivent une réponse.

3.La persistance au morcellement, dite Partition Tolerance, faisant en sorte qu’aucune panne moins importante qu’une coupure totale du réseau ne doit empêcher le système de répondre correctement (en cas de morcellement en sous-réseaux, chacun doit pouvoir fonctionner de manière autonome).

1.2.3.3 La consistance des données

Mis à part leurs nombreux avantages, les bases de données NoSQL ne sont pas à l’abri des problèmes de consistance des données. Les développeurs des applications et les concepteurs de bases de données doivent gérer cet aspect selon la nature du métier. À titre d’exemple, sur un site Internet de réservation de chambres d’hôtel, il est possible que 2 personnes puissent réserver à un intervalle de temps relativement réduit une même chambre d’hôtel. Il sera envoyé par la suite un mail à la personne qui a réservé en deuxième, lui expliquant que sa réservation n’a pas été prise en considération. Même principe lors de l’achat d’un produit sur une boutique en ligne. Les administrateurs des sites marchands préfèrent ce fonctionnement, plutôt que d’afficher un message d’erreur à l’écran, invitant l’utilisateur à recommencer.

1.2.4 Les limitations des bases de données NoSQL

Globalement les systèmes NoSQL ne respectent pas les propriétés ACID ou en tout cas pas complètement. Cet aspect ne permet pas d’offrir une grande sûreté dans l’accès aux données. Par ailleurs la base de données NoSQL reste très contraignante par certains aspects. Ainsi le traitement des requêtes de type OLAP nécessite une programmation importante au niveau applicatif.

1.2.5 Conclusion

Tout d’abord, cette génération de bases de données est encore relativement jeune et n’a pas encore atteint l’apogée de la maturité. Seules les petites et les moyennes entreprises les font évoluer pour le moment. Les grandes entreprises mettent encore en avant leurs SGBD classiques pour ce qu’ils offrent en termes de stabilité et de structuration. IBM toutefois, laisse le choix à l’utilisateur d’intégrer une base NoSQL sous forme d’application base de données.

1.3 NewSQL en route vers la base de données moderne

NewSQL est un stockage distribué et potentiellement entièrement en mémoire et pouvant être requêté classiquement par une interface SQL. NewSQL est tiré du monde NoSQL mais reste différent. Comme NoSQL il s’agit d’une nouvelle architecture logicielle qui propose de repenser le stockage des données. Cette base de données moderne profite des architectures distribuées, des progrès du matériel et des connaissances théoriques depuis 35 ans. Mais contrairement à NoSQL elle permet de conserver le modèle relationnel au cœur du système.

NewSQL est né de la rencontre de 3 types d’architecture, relationnelle, non-relationnelle et grille de données appelée également cache distribué, comme indiqué dans la Figure 2. En effet il se positionne comme un stockage distribué conçu dans le prolongement des architectures NoSQL, pour des accès transactionnels à fort débit, au moyen d’une interface SQL. Les systèmes NewSQL peuvent être généralement groupés en 3 catégories : les nouvelles architectures ; les moteurs SQL ; et enfin, le partage transparent. D’un point de vue évolutivité, il se situe en tant que concurrent direct des solutions NoSQL. Mais contrairement à ces solutions il conserve une interface relationnelle via le SQL, ce qui est l’une de ses forces.

Par ailleurs, la plupart des solutions NewSQL proposent un stockage en mémoire. Ce stockage en mémoire distribué sur plusieurs machines sous forme de grille de données est largement utilisé depuis une dizaine d’années dans les environnements où une faible latence est critique, notamment dans certaines applications des banques d’investissement et de traitement de commandes. Les solutions NewSQL partagent ainsi un positionnement intermédiaire entre les solutions NoSQL et les grilles de données.

Figure 2 : Naissance du NewSQL à partir de 3 architectures

1.3.1 L’architecture NewSQL

L’architecture NewSQL reprend des expériences antérieures du SQL relationnel et du NoSQL plusieurs caractéristiques, tout en ayant certaines particularités en termes de choix et d’avantages :

1.Le choix d’une interface SQL et d’un schéma relationnel.

2.Le schéma relationnel avec des limitations pour faciliter la distribution des données et des traitements.

3.La distribution et la réplication des données pour assurer l’évolutivité et la résilience.

1.3.2 Les avantages de la solution NewSQL

La solution NewSQL présente des avantages intéressants en termes de performances par rapport à ses prédécesseurs :

1.Elle utilise le SQL comme langage commun de requêtes.

2.Elle présente une architecture qui a de meilleures performances par nœud que les solutions classiques de type SGBD relationnel.

3.Elle minimise la complexité des applications tout en améliorant la consistance des données et en fournissant un support

Vous aimez cet aperçu ?

Page 1 sur 1

Le traitement BigData: Informatique

À propos de ce livre électronique

Hadi Hashem

Auteurs associés

Lié à Le traitement BigData

Livres électroniques liés

Ordinateurs pour vous

Épisodes de podcast liés

Articles associés

Catégories liées

Avis sur Le traitement BigData

Qu'avez-vous pensé ?

Aperçu du livre

Le traitement BigData - Hadi Hashem

LA PROBLÉMATIQUE ET LE CONTEXTE DU TRAVAIL

LES OBJECTIFS DE CET OUVRAGE

LE PLAN DE DÉVELOPPEMENT

1.1 Introduction au chapitre

1.2 Les bases de données NoSQL

1.2.1 Le mouvement NoSQL et l’élaboration du terme

1.2.2 La définition NoSQL et les avantages pour les développeurs

1.2.3 Les caractéristiques des bases de données NoSQL

1.2.4 Les limitations des bases de données NoSQL

1.2.5 Conclusion

1.3 NewSQL en route vers la base de données moderne

1.3.1 L’architecture NewSQL

1.3.2 Les avantages de la solution NewSQL