Livre électronique194 pages6 heures

Fouille de Données Complexes

Name: Fouille de Données Complexes
ISBN: 9791096289486

Par RNTI

Évaluation : 0 sur 5 étoiles

()

Lire l'aperçu

À propos de ce livre électronique

Le présent numéro spécial de la revue RNTI est le prolongement des 11ème et 12\ème éditions de l'atelier fouille de données complexes, organisé par le groupe de travail EGC "Fouille de Données Complexes". Ces ateliers se sont tenus au cours des conférence EGC'2014 à Rennes et EGC'2015 au Luxembourg. Ce numéro contient 5 articles traitant de la complexité des données (flux, volume, images, textes) par la proposition d'approches novatrices de fouille de données pouvant être basées sur les ouvertures technologiques du Big Data ou sur la combinaison originale de modèles de représentation.

Ignorer le carrousel

Ordinateurs

LangueFrançais

ÉditeurRNTI

Date de sortie28 juil. 2016

ISBN9791096289486

Lié à Fouille de Données Complexes

Titres dans cette série (3)

Ignorer le carrousel

Avancées récentes dans le domaine des Architectures Logicielles: articles sélectionnés et étendus de CAL'2015 et MODA'2015
Livre électronique
Avancées récentes dans le domaine des Architectures Logicielles: articles sélectionnés et étendus de CAL'2015 et MODA'2015
deIsmaël Bouassida Rodriguez
Évaluation : 0 sur 5 étoiles
0 évaluation
Fouille de Données Complexes
Livre électronique
Fouille de Données Complexes
deBoD - Books on Demand
Évaluation : 0 sur 5 étoiles
0 évaluation
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
Livre électronique
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
deLydia Boudjeloud-Assala
Évaluation : 5 sur 5 étoiles
5/5

Livres électroniques liés

Ignorer le carrousel

Le Dictionnaire du NEF
Livre électronique
Le Dictionnaire du NEF
deMarie Lebert
Évaluation : 1 sur 5 étoiles
1/5
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2018
Livre électronique
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2018
deBoD - Books on Demand
Évaluation : 0 sur 5 étoiles
0 évaluation
Les GENRES DE DOCUMENTS DANS LES ORGANISATIONS: Analyse théorique et pratique
Livre électronique
Les GENRES DE DOCUMENTS DANS LES ORGANISATIONS: Analyse théorique et pratique
deLouise Gagnon-Arguin
Évaluation : 0 sur 5 étoiles
0 évaluation
Typologie des dossiers des organisations: Analyse intégrée dans un contexte analogique et numérique
Livre électronique
Typologie des dossiers des organisations: Analyse intégrée dans un contexte analogique et numérique
deLouise Gagnon-Arguin
Évaluation : 0 sur 5 étoiles
0 évaluation
Typologie des documents des organisations, 2e édition: De la création à la conservation
Livre électronique
Typologie des documents des organisations, 2e édition: De la création à la conservation
deLouise Gagnon-Arguin
Évaluation : 5 sur 5 étoiles
5/5
Manuel de droit européen de la protection des données à caractère personnel
Livre électronique
Manuel de droit européen de la protection des données à caractère personnel
deOlivia Tambou
Évaluation : 0 sur 5 étoiles
0 évaluation
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
Livre électronique
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
deLydia Boudjeloud-Assala
Évaluation : 5 sur 5 étoiles
5/5
Analyse et représentation documentaires: Introduction à l'indexation, à la classification et à la condensation des documents
Livre électronique
Analyse et représentation documentaires: Introduction à l'indexation, à la classification et à la condensation des documents
deMichèle Hudon
Évaluation : 3 sur 5 étoiles
3/5
Initiation à l'écosytème Hadoop
Livre électronique
Initiation à l'écosytème Hadoop
deJuvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5
Les APPROCHES QUALITATIVES EN GESTION
Livre électronique
Les APPROCHES QUALITATIVES EN GESTION
dePaul Prévost
Évaluation : 0 sur 5 étoiles
0 évaluation
L' ESPRIT ENTREPRENEURIAL DES ARTISTES A L'ERE NUMERIQUE: Autoproduction et réseaux de collaboration dans les secteurs culturels au Québec
Livre électronique
L' ESPRIT ENTREPRENEURIAL DES ARTISTES A L'ERE NUMERIQUE: Autoproduction et réseaux de collaboration dans les secteurs culturels au Québec
deJoëlle Bissonnette
Évaluation : 0 sur 5 étoiles
0 évaluation
Droit des objets connectés et télécoms
Livre électronique
Droit des objets connectés et télécoms
deAlain Bensoussan
Évaluation : 0 sur 5 étoiles
0 évaluation
L'innovation collective: Quand créer avec devient essentiel
Livre électronique
L'innovation collective: Quand créer avec devient essentiel
deValérie Lehmann
Évaluation : 0 sur 5 étoiles
0 évaluation
Pratique de l'analyse statistique des données
Livre électronique
Pratique de l'analyse statistique des données
deRichard Bertrand
Évaluation : 0 sur 5 étoiles
0 évaluation
Systèmes Écologiques Fermés: Comment les ressources accessibles à la vie peuvent-elles être réutilisées ?
Livre électronique
Systèmes Écologiques Fermés: Comment les ressources accessibles à la vie peuvent-elles être réutilisées ?
deFouad Sabry
Évaluation : 0 sur 5 étoiles
0 évaluation
Les racines communicationnelles du Web et des médias sociaux, 2e édition
Livre électronique
Les racines communicationnelles du Web et des médias sociaux, 2e édition
deFrancine Charest
Évaluation : 0 sur 5 étoiles
0 évaluation
La fabrique de livres électroniques: Stratégies, idées et instructions opérationnelles pour créer des flux de revenus par la rédaction et la publication d'un livre électronique
Livre électronique
La fabrique de livres électroniques: Stratégies, idées et instructions opérationnelles pour créer des flux de revenus par la rédaction et la publication d'un livre électronique
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Gérer les rumeurs, ragots et autres bruits: Comment réagir face aux rumeurs
Livre électronique
Gérer les rumeurs, ragots et autres bruits: Comment réagir face aux rumeurs
deAurore Van de Winkel
Évaluation : 0 sur 5 étoiles
0 évaluation
Scrivener 3.0 Introduction aux Tutoriels anglais
Livre électronique
Scrivener 3.0 Introduction aux Tutoriels anglais
deGaelle Kermen
Évaluation : 0 sur 5 étoiles
0 évaluation
Le management municipal, Tome 2: Les défis de l'intégration locale
Livre électronique
Le management municipal, Tome 2: Les défis de l'intégration locale
deGérard Divay
Évaluation : 0 sur 5 étoiles
0 évaluation
Introduction au project finance
Livre électronique
Introduction au project finance
deNimrod Roger Tafotie Youmsi
Évaluation : 0 sur 5 étoiles
0 évaluation
La communication de crise à l'ère des médias socionumériques
Livre électronique
La communication de crise à l'ère des médias socionumériques
deXavier Manga
Évaluation : 0 sur 5 étoiles
0 évaluation
Les Machines de l'esprit: Humain++, #1
Livre électronique
Les Machines de l'esprit: Humain++, #1
deDima Zales
Évaluation : 0 sur 5 étoiles
0 évaluation
Contrats et marchés publics de défense
Livre électronique
Contrats et marchés publics de défense
deClaudine Chardigny
Évaluation : 5 sur 5 étoiles
5/5
Conception des systèmes - Pilotage, informations et risques: Méthode "Maze", une méthode pour sortir du labyrinthe de la complexité
Livre électronique
Conception des systèmes - Pilotage, informations et risques: Méthode "Maze", une méthode pour sortir du labyrinthe de la complexité
deGuy Trocellier
Évaluation : 0 sur 5 étoiles
0 évaluation
Agile & Scrum
Livre électronique
Agile & Scrum
deAjit Singh
Évaluation : 0 sur 5 étoiles
0 évaluation
La méthode Kanban: Optimiser le flux de travail pour une productivité maximale
Livre électronique
La méthode Kanban: Optimiser le flux de travail pour une productivité maximale
dePeter Lanore
Évaluation : 0 sur 5 étoiles
0 évaluation
LES MACROS AVEC GOOGLE SHEETS: Programmer en Javascript
Livre électronique
LES MACROS AVEC GOOGLE SHEETS: Programmer en Javascript
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
Les Héros de la stratégie: L'exécution détermine le succès ! 250 conseils pratiques
Livre électronique
Les Héros de la stratégie: L'exécution détermine le succès ! 250 conseils pratiques
deJeroen De Flander
Évaluation : 0 sur 5 étoiles
0 évaluation
Kaizen ? Vous avez dit Kaizen ?
Livre électronique
Kaizen ? Vous avez dit Kaizen ?
dePierre Charraud
Évaluation : 0 sur 5 étoiles
0 évaluation

Ordinateurs pour vous

Ignorer le carrousel

Pensez et investissez comme Warren Buffett: Le manuel qui révèle l'état d'esprit et les stratégies de réflexion du plus grand investisseur de tous les temps
Livre électronique
Pensez et investissez comme Warren Buffett: Le manuel qui révèle l'état d'esprit et les stratégies de réflexion du plus grand investisseur de tous les temps
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux
Livre électronique
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux
deKaj Berrah
Évaluation : 5 sur 5 étoiles
5/5
Revue des incompris revue d'histoire des oubliettes: Le Réveil de l'Horloge de Célestin Louis Maxime Dubuisson aliéniste et poète
Livre électronique
Revue des incompris revue d'histoire des oubliettes: Le Réveil de l'Horloge de Célestin Louis Maxime Dubuisson aliéniste et poète
deAgnès Bertomeu
Évaluation : 3 sur 5 étoiles
3/5
Apprendre Python rapidement: Le guide du débutant pour apprendre tout ce que vous devez savoir sur Python, même si vous êtes nouveau dans la programmation
Livre électronique
Apprendre Python rapidement: Le guide du débutant pour apprendre tout ce que vous devez savoir sur Python, même si vous êtes nouveau dans la programmation
deKevin Droz
Évaluation : 0 sur 5 étoiles
0 évaluation
Dans l'esprit des grand investisseurs: Un voyage à la découverte de la psychologie utilisée par les plus grands investisseurs de tous les temps à travers des analyses opérationnell
Livre électronique
Dans l'esprit des grand investisseurs: Un voyage à la découverte de la psychologie utilisée par les plus grands investisseurs de tous les temps à travers des analyses opérationnell
deStefano Calicchio
Évaluation : 5 sur 5 étoiles
5/5
La psychologie du trading facile à apprendre: Comment appliquer les stratégies et les attitudes psychologiques des traders gagnants pour réussir dans le trading.
Livre électronique
La psychologie du trading facile à apprendre: Comment appliquer les stratégies et les attitudes psychologiques des traders gagnants pour réussir dans le trading.
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
L'analyse technique facile à apprendre: Comment construire et interpréter des graphiques d'analyse technique pour améliorer votre activité de trading en ligne.
Livre électronique
L'analyse technique facile à apprendre: Comment construire et interpréter des graphiques d'analyse technique pour améliorer votre activité de trading en ligne.
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
La communication professionnelle facile à apprendre: Le guide pratique de la communication professionnelle et des meilleures stratégies de communication d'entreprise
Livre électronique
La communication professionnelle facile à apprendre: Le guide pratique de la communication professionnelle et des meilleures stratégies de communication d'entreprise
deStefano Calicchio
Évaluation : 5 sur 5 étoiles
5/5
Le plan marketing en 4 étapes: Stratégies et étapes clés pour créer des plans de marketing qui fonctionnent
Livre électronique
Le plan marketing en 4 étapes: Stratégies et étapes clés pour créer des plans de marketing qui fonctionnent
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Les Chandeliers Japonaises facile à apprendre: Le guide d'introduction aux voiles japonaises et les stratégies d'analyse technique les plus efficaces
Livre électronique
Les Chandeliers Japonaises facile à apprendre: Le guide d'introduction aux voiles japonaises et les stratégies d'analyse technique les plus efficaces
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
L'analyse fondamentale facile à apprendre: Le guide d'introduction aux techniques et stratégies d'analyse fondamentale pour anticiper les événements qui font bouger les marchés
Livre électronique
L'analyse fondamentale facile à apprendre: Le guide d'introduction aux techniques et stratégies d'analyse fondamentale pour anticiper les événements qui font bouger les marchés
deStefano Calicchio
Évaluation : 3 sur 5 étoiles
3/5
Introduction au Darknet: Darknet 101
Livre électronique
Introduction au Darknet: Darknet 101
deMartin Hoffer
Évaluation : 4 sur 5 étoiles
4/5
Travailler dans le Big Data - les 6 métiers vers lesquels s'orienter
Livre électronique
Travailler dans le Big Data - les 6 métiers vers lesquels s'orienter
deJuvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5
Forex Trading facile à apprendre: Le guide d'introduction au marché des changes et aux stratégies de négociation les plus efficaces dans l'industrie des devises.
Livre électronique
Forex Trading facile à apprendre: Le guide d'introduction au marché des changes et aux stratégies de négociation les plus efficaces dans l'industrie des devises.
deStefano Calicchio
Évaluation : 4 sur 5 étoiles
4/5
Python Offensif : Le guide du débutant pour apprendre les bases du langage Python et créer des outils de hacking.
Livre électronique
Python Offensif : Le guide du débutant pour apprendre les bases du langage Python et créer des outils de hacking.
deKevin Droz
Évaluation : 0 sur 5 étoiles
0 évaluation
Stratégie d'Investissement en Crypto-monnaie: Comment Devenir Riche Avec les Crypto-monnaies
Livre électronique
Stratégie d'Investissement en Crypto-monnaie: Comment Devenir Riche Avec les Crypto-monnaies
deSato Akira
Évaluation : 4 sur 5 étoiles
4/5
Le marketing d'affiliation en 4 étapes: Comment gagner de l'argent avec des affiliés en créant des systèmes commerciaux qui fonctionnent
Livre électronique
Le marketing d'affiliation en 4 étapes: Comment gagner de l'argent avec des affiliés en créant des systèmes commerciaux qui fonctionnent
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Résumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social
Livre électronique
Résumé Chatgpt ia Revolution in 2023: Guide de la Technologie Chatgpt et de son Impact Social
deTechnology Summary
Évaluation : 0 sur 5 étoiles
0 évaluation
Kali Linux pour débutant : Le guide ultime du débutant pour apprendre les bases de Kali Linux.
Livre électronique
Kali Linux pour débutant : Le guide ultime du débutant pour apprendre les bases de Kali Linux.
deKevin Droz
Évaluation : 5 sur 5 étoiles
5/5
Réseau Anonyme Tor 101: Une Introduction à la Partie la Plus Privée de l'Internet
Livre électronique
Réseau Anonyme Tor 101: Une Introduction à la Partie la Plus Privée de l'Internet
deSteven Gates
Évaluation : 2 sur 5 étoiles
2/5
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
Livre électronique
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
deRémy Lentzner
Évaluation : 0 sur 5 étoiles
0 évaluation
La psychologie du travail facile à apprendre: Le guide d'introduction à l'utilisation des connaissances psychologiques dans le domaine du travail et des organisations
Livre électronique
La psychologie du travail facile à apprendre: Le guide d'introduction à l'utilisation des connaissances psychologiques dans le domaine du travail et des organisations
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Cybersécurité: Le guide du débutant pour apprendre à reconnaître les cyber-risques et comment se défendre contre la cybercriminalité.
Livre électronique
Cybersécurité: Le guide du débutant pour apprendre à reconnaître les cyber-risques et comment se défendre contre la cybercriminalité.
deHackinGeeK Inc
Évaluation : 4 sur 5 étoiles
4/5
Créer Son Propre Site Internet Et Son Blog Gratuitement
Livre électronique
Créer Son Propre Site Internet Et Son Blog Gratuitement
deJason Matthews
Évaluation : 5 sur 5 étoiles
5/5
Le guide de survie de votre notoriété - Les 6 secrets de la renomée digitale
Livre électronique
Le guide de survie de votre notoriété - Les 6 secrets de la renomée digitale
deThomas Trautmann
Évaluation : 0 sur 5 étoiles
0 évaluation
Le neuromarketing en 7 réponses
Livre électronique
Le neuromarketing en 7 réponses
deStefano Calicchio
Évaluation : 0 sur 5 étoiles
0 évaluation
Agile & Scrum
Livre électronique
Agile & Scrum
deAjit Singh
Évaluation : 0 sur 5 étoiles
0 évaluation
Blockchain: Applications et compréhension du monde réel
Livre électronique
Blockchain: Applications et compréhension du monde réel
deWayne Walker
Évaluation : 4 sur 5 étoiles
4/5
Bien débuter avec VBA: Informatique
Livre électronique
Bien débuter avec VBA: Informatique
deRemy Lentzner
Évaluation : 5 sur 5 étoiles
5/5
Le secret De La Cybersécurité: Le guide pour protéger votre famille et votre entreprise de la cybercriminalité
Livre électronique
Le secret De La Cybersécurité: Le guide pour protéger votre famille et votre entreprise de la cybercriminalité
deHacking House
Évaluation : 5 sur 5 étoiles
5/5

Épisodes de podcast liés

Ignorer le carrousel

C'est quoi le job d'un CEO ? avec Franck Denglos le PDG d'Adidas Italie - episode 158: Dans l'épisode d'aujourd'hui j'ai le plaisir de recevoir un invité très spécial, il s'agit de Franck Denglos, le PDG d'Adidas Italie. J'avoue que j'ai été un peu impressionnée quand j'ai vu son nom s'afficher sur mon LinkedIn, et puis fin...
Épisode de podcast
C'est quoi le job d'un CEO ? avec Franck Denglos le PDG d'Adidas Italie - episode 158: Dans l'épisode d'aujourd'hui j'ai le plaisir de recevoir un invité très spécial, il s'agit de Franck Denglos, le PDG d'Adidas Italie. J'avoue que j'ai été un peu impressionnée quand j'ai vu son nom s'afficher sur mon LinkedIn, et puis fin...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
Organisation personnelle du Manager - Introduction 1: Si tu veux mettre en place un système d'organisation réaliste et adapté à ton management, je te propose une série de 9 mail que j'ai intitulée "Organisé pour le plaisir". C'est par ici pour la recevoir tout de suite : Cela fait...
Épisode de podcast
Organisation personnelle du Manager - Introduction 1: Si tu veux mettre en place un système d'organisation réaliste et adapté à ton management, je te propose une série de 9 mail que j'ai intitulée "Organisé pour le plaisir". C'est par ici pour la recevoir tout de suite : Cela fait...
deOutils du Manager
0 évaluation
0% ont trouvé ce document utile
#1 L'Inbound marketing comme source de croissance - avec Juliette Hervé, Allbound marketing manager chez Spendesk: Tu sais comme c’est fatiguant de prospecter tous les jours et de se faire jeter, parfois sans ménagement ? Pendant longtemps, c’était la seule façon de faire pour trouver de nouveaux clients. Et puis, l’Inbound marketing est arrivé ! L’Inbound, comp...
Épisode de podcast
#1 L'Inbound marketing comme source de croissance - avec Juliette Hervé, Allbound marketing manager chez Spendesk: Tu sais comme c’est fatiguant de prospecter tous les jours et de se faire jeter, parfois sans ménagement ? Pendant longtemps, c’était la seule façon de faire pour trouver de nouveaux clients. Et puis, l’Inbound marketing est arrivé ! L’Inbound, comp...
deLe café du market' ☕ ton podcast marketing B2B
0 évaluation
0% ont trouvé ce document utile
150. Les 7 tendances réseaux sociaux en 2022: Quelles sont les grandes tendances réseaux sociaux, marketing et communication pour cette année 2022 qui débute ? Quelles sont les nouveautés à ne pas ignorer, les bonnes pratiques à instaurer, les technologies à découvrir ? Dans cet épisode de podcast...
Épisode de podcast
150. Les 7 tendances réseaux sociaux en 2022: Quelles sont les grandes tendances réseaux sociaux, marketing et communication pour cette année 2022 qui débute ? Quelles sont les nouveautés à ne pas ignorer, les bonnes pratiques à instaurer, les technologies à découvrir ? Dans cet épisode de podcast...
deJ'peux Pas J'ai Business par TheBBoost
0 évaluation
0% ont trouvé ce document utile
201. Comment utiliser le Design Thinking pour augmenter ses conversions ? Avec Marine Aubaret: "Il suffit de 5 utilisateurs pour régler 85% des problèmes". Marine Aubaret est spécialisée dans l’optimisation de la productivité. Dans cet épisode exclusif, elle nous livre les 5 étapes pour améliorer notre taux de conversion, en utilisant le pouvo...
Épisode de podcast
201. Comment utiliser le Design Thinking pour augmenter ses conversions ? Avec Marine Aubaret: "Il suffit de 5 utilisateurs pour régler 85% des problèmes". Marine Aubaret est spécialisée dans l’optimisation de la productivité. Dans cet épisode exclusif, elle nous livre les 5 étapes pour améliorer notre taux de conversion, en utilisant le pouvo...
deMarketing Square : Les secrets Growth Marketing ⚡️
0 évaluation
0% ont trouvé ce document utile
471 - Comment un objectif peut-il nous rendre misérable ?
Épisode de podcast
471 - Comment un objectif peut-il nous rendre misérable ?
deOptimise ta vie (Le MorningNote Show)
0 évaluation
0% ont trouvé ce document utile
Les pubs facebook qui marchent avec Danilo Duchesnes - Episode 138: Quand je pense publicité facebook, je pense immédiatement à l'ad manager. J'ai longtemps pensé que la réussite d'une pub résidait dans le paramétrage du facebook ads manager : quelle cible, à quel moment, sur quels formats, avec...
Épisode de podcast
Les pubs facebook qui marchent avec Danilo Duchesnes - Episode 138: Quand je pense publicité facebook, je pense immédiatement à l'ad manager. J'ai longtemps pensé que la réussite d'une pub résidait dans le paramétrage du facebook ads manager : quelle cible, à quel moment, sur quels formats, avec...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
Comment développer ses soft skills ? avec Solenne Boquillon le Gouaziou - Episode 163: Curiosité, autonomie, capacité d'écoute, communication orale, respect, adaptabilité, confiance, sens des responsabilité, intégrité, ouverture à la nouveauté, etc. Les soft skills sont de plus en plus plébiscitées, parce que sans soft skills les hard skills ne va...
Épisode de podcast
Comment développer ses soft skills ? avec Solenne Boquillon le Gouaziou - Episode 163: Curiosité, autonomie, capacité d'écoute, communication orale, respect, adaptabilité, confiance, sens des responsabilité, intégrité, ouverture à la nouveauté, etc. Les soft skills sont de plus en plus plébiscitées, parce que sans soft skills les hard skills ne va...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
100%
100% ont trouvé ce document utile
Blockchain et le Bitcoin : vous allez tout comprendre (#06): Qu'est-ce que la blockchain ? Comment ça marche ? Quels liens avec le Bitcoin ? Réponse d'un expert. Inventée en 2008 par le mystérieux Satochi Nakamoto (https://fr.wikipedia.org/wiki/Satoshi_Nakamoto), la blockchain (chaîne de blocs) est un procédé d'...
Épisode de podcast
Blockchain et le Bitcoin : vous allez tout comprendre (#06): Qu'est-ce que la blockchain ? Comment ça marche ? Quels liens avec le Bitcoin ? Réponse d'un expert. Inventée en 2008 par le mystérieux Satochi Nakamoto (https://fr.wikipedia.org/wiki/Satoshi_Nakamoto), la blockchain (chaîne de blocs) est un procédé d'...
deMonde Numérique (Actualité des Technologies)
0 évaluation
0% ont trouvé ce document utile
Parler à son audience - Episode 160: Parler à son audience, parler à ses futurs clients c'est la première chose que doit faire toute personne qui veut travailler son marketing. Avant de faire quoi que ce soit, il faut commencer par discuter avec les personnes qui pourraient être ses fu...
Épisode de podcast
Parler à son audience - Episode 160: Parler à son audience, parler à ses futurs clients c'est la première chose que doit faire toute personne qui veut travailler son marketing. Avant de faire quoi que ce soit, il faut commencer par discuter avec les personnes qui pourraient être ses fu...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
La conduite du changement (1/2): En tant que manager, vous serez souvent chargé de mener le changement dans l'entreprise. C'est d'ailleurs une de vos principales fonctions. En général, le changement est préparé dans les détails par votre direction ou vous même : on...
Épisode de podcast
La conduite du changement (1/2): En tant que manager, vous serez souvent chargé de mener le changement dans l'entreprise. C'est d'ailleurs une de vos principales fonctions. En général, le changement est préparé dans les détails par votre direction ou vous même : on...
deOutils du Manager
0 évaluation
0% ont trouvé ce document utile
#97 - Devenir coach: Notes du podcast: http://sesentirbien.coach/podca…
Épisode de podcast
#97 - Devenir coach: Notes du podcast: http://sesentirbien.coach/podca…
deSe Sentir Bien
0 évaluation
0% ont trouvé ce document utile
Marketing local, comment faire ? - Episode 161: Je vois beaucoup d'entrepreneurs venir vers moi pour me demander quelle stratégie digitale implémenter pour leur business, alors que pour moi ce n'est surtout pas par le digital qu'il devraient commencer mais par le bon vieux marketing local.&nb...
Épisode de podcast
Marketing local, comment faire ? - Episode 161: Je vois beaucoup d'entrepreneurs venir vers moi pour me demander quelle stratégie digitale implémenter pour leur business, alors que pour moi ce n'est surtout pas par le digital qu'il devraient commencer mais par le bon vieux marketing local.&nb...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
064 – Adopter une approche sélective pour ses placements, avec Karl Toussaint du Wast
Épisode de podcast
064 – Adopter une approche sélective pour ses placements, avec Karl Toussaint du Wast
deLes Investisseurs 4.0
0 évaluation
0% ont trouvé ce document utile
La Gestion de Projet - Partie 4: QUI fait QUOI pour QUAND ? Le "QUAND" en gestion de projet : - pourquoi est-on en retard ? - les tâches sans deadline ... - comment fixer les deadlines ? - la durée maximale d'une tâche - comment "débloquer" un projet ? - réduire...
Épisode de podcast
La Gestion de Projet - Partie 4: QUI fait QUOI pour QUAND ? Le "QUAND" en gestion de projet : - pourquoi est-on en retard ? - les tâches sans deadline ... - comment fixer les deadlines ? - la durée maximale d'une tâche - comment "débloquer" un projet ? - réduire...
deOutils du Manager
0 évaluation
0% ont trouvé ce document utile
Les ateliers à la parentalité
Épisode de podcast
Les ateliers à la parentalité
deLa Matrescence
100%
100% ont trouvé ce document utile
Comment développer son leadership ? | #Leçon135
Épisode de podcast
Comment développer son leadership ? | #Leçon135
deLe Podcast de Pauline Laigneau
0 évaluation
0% ont trouvé ce document utile
La rentrée du manager - Partie 5: Préparer les objectifs et le planing du dernier quadrimestre
Épisode de podcast
La rentrée du manager - Partie 5: Préparer les objectifs et le planing du dernier quadrimestre
deOutils du Manager
0 évaluation
0% ont trouvé ce document utile
La rentrée du manager - Partie 4: La prise de note en 1 à 1
Épisode de podcast
La rentrée du manager - Partie 4: La prise de note en 1 à 1
deOutils du Manager
0 évaluation
0% ont trouvé ce document utile
(? Replay) #048 - Investir en bourse efficacement, avec Nicolas Chéron
Épisode de podcast
(? Replay) #048 - Investir en bourse efficacement, avec Nicolas Chéron
deLes Investisseurs 4.0
0 évaluation
0% ont trouvé ce document utile
#74 - Moussa Camara (Les Déterminés) : La détermination, la clé pour entreprendre: Pour ce 74ème épisode, je reçois Moussa Camara, le président et fondateur de l'association "Les Déterminés" qui aide à développer l'initiative et l'entrepreneuriat en banlieue et dans les milieux ruraux.
Épisode de podcast
#74 - Moussa Camara (Les Déterminés) : La détermination, la clé pour entreprendre: Pour ce 74ème épisode, je reçois Moussa Camara, le président et fondateur de l'association "Les Déterminés" qui aide à développer l'initiative et l'entrepreneuriat en banlieue et dans les milieux ruraux.
deSerial Entrepreneurs
0 évaluation
0% ont trouvé ce document utile
Danser pour préserver sa mémoire ?: L’activité physique est un élément qui semble assez important pour la préservation des fonctions cognitives au cours du vieillissement. Mais passé un certain âge, trouver la motivation nécessaire à la pratique d’une activité physique n’est pas toujours évident. Des chercheuses et chercheurs essentiellement étatsuniens se sont demandé si le fait de pratiquer une activité physique sous une forme plus ou moins déguisée ne pourrait pas avoir des effets intéressants sur la préservation du fonctionnement du cerveau. Plutôt que de demander à des individus âgés de faire des exercices physiques sans attrait particulier, les scientifiques ont proposés à plus de 160 participants de 55 ans et plus un programme de danse latine sur 4 mois. Si les chercheurs sont partis sur l’idée de proposer un tel programme de danse latine, ce n’était pas réellement pour évaluer l’intérêt que peut avoir ce type de danse sur le maintien des fonctions cognitives, mais bien plus car
Épisode de podcast
Danser pour préserver sa mémoire ?: L’activité physique est un élément qui semble assez important pour la préservation des fonctions cognitives au cours du vieillissement. Mais passé un certain âge, trouver la motivation nécessaire à la pratique d’une activité physique n’est pas toujours évident. Des chercheuses et chercheurs essentiellement étatsuniens se sont demandé si le fait de pratiquer une activité physique sous une forme plus ou moins déguisée ne pourrait pas avoir des effets intéressants sur la préservation du fonctionnement du cerveau. Plutôt que de demander à des individus âgés de faire des exercices physiques sans attrait particulier, les scientifiques ont proposés à plus de 160 participants de 55 ans et plus un programme de danse latine sur 4 mois. Si les chercheurs sont partis sur l’idée de proposer un tel programme de danse latine, ce n’était pas réellement pour évaluer l’intérêt que peut avoir ce type de danse sur le maintien des fonctions cognitives, mais bien plus car
deChoses à Savoir CERVEAU
0 évaluation
0% ont trouvé ce document utile
EP117 : 10 façons d'avoir un impact puissant sur son corps (fertilité, grossesse, postpartum) en lissant sa courbe de glucose - Jessie Inschauspé, biochimiste
Épisode de podcast
EP117 : 10 façons d'avoir un impact puissant sur son corps (fertilité, grossesse, postpartum) en lissant sa courbe de glucose - Jessie Inschauspé, biochimiste
deLa Matrescence
0 évaluation
0% ont trouvé ce document utile
Gugomondo le dinosaure blasé
Épisode de podcast
Gugomondo le dinosaure blasé
deHistoires pour enfants de la famille M.
0 évaluation
0% ont trouvé ce document utile
De Madoff au Loup de Wall de Street, profession escroc: Pour « La Story », le podcast d’actualité des « Echos », Pierrick Fay et Nessim Aït-Kacimi retracent les parcours de traders fous célèbres et autres escrocs de la finance.
Épisode de podcast
De Madoff au Loup de Wall de Street, profession escroc: Pour « La Story », le podcast d’actualité des « Echos », Pierrick Fay et Nessim Aït-Kacimi retracent les parcours de traders fous célèbres et autres escrocs de la finance.
deLa Story
0 évaluation
0% ont trouvé ce document utile
329 - Double ta capacité en travaillant moins avec le Protocol Smart Process: C’est parti pour l’épisode 3 de la série Protocol Smart Process : une série sur la manière de faire travailler ton équipe différemment pour doubler ses capacités, sans investissement et sans travailler davantage. J’ai fait appel à Lorry....
Épisode de podcast
329 - Double ta capacité en travaillant moins avec le Protocol Smart Process: C’est parti pour l’épisode 3 de la série Protocol Smart Process : une série sur la manière de faire travailler ton équipe différemment pour doubler ses capacités, sans investissement et sans travailler davantage. J’ai fait appel à Lorry....
deOutils du Manager
0 évaluation
0% ont trouvé ce document utile
Comment créer une publicité Facebook efficace – Episode 22: Joseph Donyo, consultant et formateur en spécialisé en publicité Facebook nous explique tout ce qu'il y a savoir pour créer une campagne Facebook efficace. L’article Comment créer une publicité Facebook efficace – Episode 22 (https://lepodcastdumarketi...
Épisode de podcast
Comment créer une publicité Facebook efficace – Episode 22: Joseph Donyo, consultant et formateur en spécialisé en publicité Facebook nous explique tout ce qu'il y a savoir pour créer une campagne Facebook efficace. L’article Comment créer une publicité Facebook efficace – Episode 22 (https://lepodcastdumarketi...
deLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 évaluation
0% ont trouvé ce document utile
LCC 259 - Interview Software Heritage avec Roberto Di Cosmo et Charles Sabourdin: Charles Sabourdin et Audrey interviewent Roberto Di Cosmo sur le projet , dont l’objectif est la collecte et la préservation des logiciels en tant que patrimoine culturel. Enregistré le 22 Juin 2021 Téléchargement de l’épisode Interview Ta...
Épisode de podcast
LCC 259 - Interview Software Heritage avec Roberto Di Cosmo et Charles Sabourdin: Charles Sabourdin et Audrey interviewent Roberto Di Cosmo sur le projet , dont l’objectif est la collecte et la préservation des logiciels en tant que patrimoine culturel. Enregistré le 22 Juin 2021 Téléchargement de l’épisode Interview Ta...
deLes Cast Codeurs Podcast
0 évaluation
0% ont trouvé ce document utile
#10 Nuit du code citoyen et la tech au service de l'intérêt général avec Yannick Morel: Dans cet épisode, on est à la Nuit du Code citoye…
Épisode de podcast
#10 Nuit du code citoyen et la tech au service de l'intérêt général avec Yannick Morel: Dans cet épisode, on est à la Nuit du Code citoye…
deTechologie
0 évaluation
0% ont trouvé ce document utile
Séminaire - Matthew Rosseinsky : Digital Routes to Inorganic Materials – A New Pathway for Ion Transport in Solids
Épisode de podcast
Séminaire - Matthew Rosseinsky : Digital Routes to Inorganic Materials – A New Pathway for Ion Transport in Solids
deChimie du solide et énergie - Jean-Marie Tarascon
0 évaluation
0% ont trouvé ce document utile

Articles associés

Ignorer le carrousel

Organisez Vos Projets Avec Monday.com
Micro Pratique
Article
Organisez Vos Projets Avec Monday.com
9 avr. 2021
Lecture de 3 min
Management : Les Méthodes Qui Marchent
L'Express
Article
Management : Les Méthodes Qui Marchent
23 mars 2023
Lecture de 2 min
Logiciels Gratuits sans Modération
Micro Pratique
Article
Logiciels Gratuits sans Modération
18 janv. 2022
Lecture de 3 min
L’inventeur Oublié Du Web
Sept
Article
L’inventeur Oublié Du Web
1 juil. 2019
Lecture de 65 min
Huit Acteurs Majeurs De L’économie Lyonnaise
The Good Life
Article
Huit Acteurs Majeurs De L’économie Lyonnaise
11 févr. 2021
Il serait injuste de prétendre que personne ne l’attendait à ce poste. Certes, à 46 ans, Grégory Doucet était un inconnu avant son élection du 28 juin 2020, mais cela faisait déjà plusieurs années qu’il se préparait à « déloger » Gérard Collomb d’une
Lecture de 12 min
Comprendre Les De Recherche Moteurs
Micro Pratique
Article
Comprendre Les De Recherche Moteurs
17 janv. 2021
Lecture de 6 min
Avantages Et Inconvénients Du Modèle Saas
Micro Pratique
Article
Avantages Et Inconvénients Du Modèle Saas
18 janv. 2022
La transition du local vers le cloud est un changement majeur dans nos habitudes. Et comme tout changement, il est parfois vécu comme une contrainte. La formule a pourtant de nombreux avantages. Le client bénéficie toujours des dernières versions du
Lecture de 1 min
Game Over Pour Les Traders ?
Science & Vie
Article
Game Over Pour Les Traders ?
15 déc. 2021
Lecture de 3 min
« Le Profit N’est Plus Le Seul Indice Du Succès »
Le Journal du dimanche
Article
« Le Profit N’est Plus Le Seul Indice Du Succès »
19 janv. 2020
Lecture de 6 min
Et Si On Retrouvait (enfin) Des Nuits Sereines?
Nous Deux Magazine
Article
Et Si On Retrouvait (enfin) Des Nuits Sereines?
20 oct. 2020
Lecture de 3 min
Toyota ROI Du Monde
L'auto-Journal
Article
Toyota ROI Du Monde
10 mars 2022
Lecture de 5 min
Google Chrome: Optimisez L’utilisation De La Mémoire Vive
Micro Pratique
Article
Google Chrome: Optimisez L’utilisation De La Mémoire Vive
11 déc. 2020
Lecture de 3 min
Créez Votre Site Internet Avec Webnode
Micro Pratique
Article
Créez Votre Site Internet Avec Webnode
18 janv. 2022
Lecture de 4 min
Ludovic Girodon : « Le Problème N° 1 Des Managers, C’est Le Temps »
L'Express
Article
Ludovic Girodon : « Le Problème N° 1 Des Managers, C’est Le Temps »
9 févr. 2023
Lecture de 5 min
Akio Naito, Made In Seiko
The Good Life
Article
Akio Naito, Made In Seiko
25 mai 2022
Lecture de 12 min
Petit Guide Du Télétravail Épanoui
Nous Deux Magazine
Article
Petit Guide Du Télétravail Épanoui
5 janv. 2021
Lecture de 4 min
Créez Un Site Web Avec Google Sites
Micro Pratique
Article
Créez Un Site Web Avec Google Sites
10 juin 2021
Il existe de nombreux outils de création de sites web mais les outils les plus utilisés comme WordPress nécessite de bonnes connaissances techniques alors que d’autres sont payants. Google a mis en ligne une nouvelle version de son outil de création
Lecture de 7 min
Créez Votre Site Web Perso (Partie 2)
Micro Pratique
Article
Créez Votre Site Web Perso (Partie 2)
10 juin 2020
Lecture de 6 min
L’IA, L’autre Révolution Du Service Client
L'Express
Article
L’IA, L’autre Révolution Du Service Client
30 mars 2023
Intelligence artificielle, automatisation, la progression technologique en la matière a permis, ces dernières années, de rendre l’expérience client plus fluide et agréable, mais ce n’est que le début de la révolution. Dans la dernière étude de Zendes
Lecture de 2 min
Accompagner La Démarche Qualité Au Pérou, Au Brésil Et Au Rwanda
Le français dans le monde
Article
Accompagner La Démarche Qualité Au Pérou, Au Brésil Et Au Rwanda
30 mars 2021
Financées et soutenues par l’Institut français de Paris, les interventions de France Éducation international s’organisent en plusieurs ateliers à distance de deux heures, auxquels participent les référents qualité des établissements du réseau. Orient
Lecture de 1 min
Université Paris-Saclay, Le MIT À La Française
The Good Life
Article
Université Paris-Saclay, Le MIT À La Française
26 avr. 2022
Lecture de 5 min
« Métavers » : L’oeuvre De Dieu, La Part Du Diable
L'Express
Article
« Métavers » : L’oeuvre De Dieu, La Part Du Diable
1 sept. 2021
Lecture de 5 min
Gérez Vos Projets En Ligne Avec Bubble Plan
Micro Pratique
Article
Gérez Vos Projets En Ligne Avec Bubble Plan
12 août 2022
Lecture de 4 min
Pièces Et Billets, Des Espèces En Voie De Disparition ?
Science & Vie Junior
Article
Pièces Et Billets, Des Espèces En Voie De Disparition ?
14 oct. 2020
Lecture de 4 min
Tout Comprendre Sur La 5G
Nous Deux Magazine
Article
Tout Comprendre Sur La 5G
5 janv. 2021
Lecture de 3 min
Les Temps Modernes : Créer Un Compte
Le Journal du dimanche
Article
Les Temps Modernes : Créer Un Compte
5 déc. 2021
UNE DES PARTICULARITÉS de l’informatique est de se servir des mots du langage de tous les jours pour désigner autre chose. Un glissement, parfois compréhensible, parfois très arbitraire, ajoute un sens nouveau à un mot ancien. C’est troublant et déso
Lecture de 2 min
Un Bon Moyen De Booster L’innovation
L'Express
Article
Un Bon Moyen De Booster L’innovation
19 mai 2021
Lecture de 5 min
Monnaie Numérique : La Nouvelle Donne
L'Express
Article
Monnaie Numérique : La Nouvelle Donne
5 janv. 2022
Changchun Mu comptetil chaque jour le nombre de nouveaux utilisateurs ? Ce qui est sûr, c’est que ce haut dirigeant de la Banque centrale chinoise surveille comme le lait sur le feu la courbe d’adoption du yuan numérique. Testée depuis un peu plus d’
Lecture de 2 min
Développement durable CLARINS, L’ENTREPRISE 100 % RSE
Paris Match
Article
Développement durable CLARINS, L’ENTREPRISE 100 % RSE
29 oct. 2020
Lecture de 2 min
Vers Un Numérique (un Peu Plus) Responsable
L'Express
Article
Vers Un Numérique (un Peu Plus) Responsable
19 mai 2021
«Nous, utilisateurs du numérique, grâce à nos usages, nous pouvons aussi être acteurs. Deuxième service le plus utilisé au monde sur Internet, le mail n’est pas l’usage le plus impactant, mais il est un vrai moyen de prise de conscience pour passer à
Lecture de 2 min

Avis sur Fouille de Données Complexes

Évaluation : 0 sur 5 étoiles

0 évaluation

0 notation0 avis

Aperçu du livre

Fouille de Données Complexes - RNTI

auteurs

Un système collectif d’utilisation d’un grand ensemble de classifieurs sur le Cloud pour la classification de Big Data

Rabah Mazouzi*, Cyril de Runz**, Herman Akdag*

*LIASD, Université Paris 8, 2 rue de la Liberté - 93526 Saint-Denis cedex

rabah@ai.univ-paris8.fr, akdag@ai.univ-paris8.fr

http://www.ai.univ-paris8.fr/

**CReSTIC, IUT de Reims, Chemin des Rouliers CS30012 51687 REIMS CEDEX 2

cyril.de-runz@univ-reims.fr

http://crestic.univ-reims.fr/

Résumé. Au vu de l’évolution des volumes de données (Big Data) et des problématiques associées (vélocité, variété et véracité), nous proposons dans cet article la conception d’un nouveau système collectif d’utilisation massive d’ensemble de classifieurs pour les Big Data sur le Cloud. Nous combinons les avantages de la labellisation par consensus entre plusieurs décisions de classifieurs distribués sur le Cloud avec l’utilisation du paradigme Map/Reduce pour l’apprentissage des modèles par chacun des classifieurs. Pour cela, nous considérons un réseau de classifieurs déployé sur le Cloud. Par l’intermédiaire des Mappers, nous répartissons les données d’apprentissage sur les différents nœuds (classifieurs) tandis que les Reducers lancent la phase d’apprentissage et retourne le modèle du classifieur ainsi qu’un indicateur de performance à optimiser. Ensuite, pour chaque donnée qui arrive, quel que soit le nœud du réseau sur lequel elle arrive, le nœud labellise la donnée et demande à ces voisins d’en faire tout autant. Ils forment ainsi un ensemble de classifieurs. Enfin, à l’aide d’un vote majoritaire pondéré, le nœud questionné renvoie la décision finale. Ainsi, plus le voisinage est étendu, plus la performance cherchée s’améliore. Cependant, il faut limiter cette extension car sinon nous n’obtenons plus des temps de traitements compatibles avec les Big Data.

1 Introduction

Généralement, les algorithmes de classification utilisent, pour la phase d’apprentissage, des ensembles de données limités en taille et en nature. La problématique de la classification prend une autre dimension avec des données très volumineuses (Big Data), notamment à cause du volume et de la variété des données, ainsi que de la vitesse de réponse du système. Pour pallier aux problèmes liés à la classification des Big Data, le partitionnement des données sur un nombre élevé de classifieurs de nature diverse, constitue, selon nous, une solution idéale.

De nos jours, de nombreuses ressources sont disponibles et mises à disposition dans l’objectif de mettre en place des solutions autrefois très coûteuses et peu accessibles. Ainsi, le développement du Cloud Computing a grandement facilité la construction de systèmes répartis, supportant des solutions distribuées et collaboratives. Ces systèmes ouvrent de nouvelles perspectives pour ce qui est de l’apprentissage automatique et notamment de la classification.

La classification distribuée, ou plus généralement la fouille de données distribuée ou DDM (Distributed Data Mining), ne se limite pas seulement aux faits de réaliser des gains en temps d’exécution, mais ouvre aussi des horizons en matière d’amélioration de la précision de calcul (défi de la véracité), de la scalabilité et de la capacité à traiter des données très volumineuses (Big Data).

De nombreuses recherches montrent que l’approche collective d’un système de classification améliore la qualité des résultats (Dietterich, 2000; Zouari, 2004). Cette approche trouve son implémentation idéale dans l’architecture totalement distribuée, sans entité centrale et sans hiérarchisation (à la manière des réseaux P2P ou un nœud joue à la fois le rôle du client et celui du serveur). Dans cet article, nous essayons de mettre en exergue certains bénéfices de l’utilisation d’une telle approche, notamment pour améliorer la classification de données en précision et en scalabilité.

Plusieurs approches basées Cloud Computing et/ou multi-agents ont récemment été utilisées dans divers domaines, où la mise en place d’une décision collective au sein du système conduit à l’amélioration de la pertinence des résultats globaux. On les trouve notamment dans le cas où le système est naturellement réparti, tel qu’en sécurité des réseaux, où des systèmes de détection d’intrusion distribués sont proposés (Zhou et al., 2010). C’est dans ce contexte que nous plaçons notre démarche.

Nous proposons d’utiliser la distribution des données et des traitements afin de réaliser un gain considérable en temps de calcul et de ressources utilisées. Nous souhaitons ainsi tendre vers le traitement de très grands volumes de données (Big Data). Pour ce faire, nous combinons l’utilisation du Cloud Computing et le paradigme Map/Reduce (Gillick et al., 2006), dont l’objectif est de montrer l’impact de l’utilisation des classifieurs massifs sur la qualité des résultats produits par un système Multi-Classifieurs. Map/Reduce est un patron de conception, ayant connu un grand succès, largement utilisé comme support de mise en œuvre pour la distribution de traitement et de données (Gillick et al., 2006).

L’objectif de cet article, qui est une extension de Mazouzi et al. (2014), est de proposer une spécification fonctionnelle et technique d’un système collectif de classification, qui prend en charge le Big Data et essaie d’en tirer profit afin d’améliorer la performance de la classification. Notre système utilise de manière massive différents classifieurs adaptés aux données à traiter, dans notre cadre des données multivariées et hétérogènes. Ainsi, nous prenons comme premier principe que la variété des Big Data est gérée par les méthodes de classifications exploitées dans notre système.

Nous partons de l’idée que dans le cas de l’apprentissage avec des données distribuées sur plusieurs classifieurs, le modèle sous-jacent de données est réparti sur l’ensemble de ces classifieurs, et de ce fait, le résultat obtenu par la combinaison des prédictions des différents classifieurs est meilleur que ceux de tous les classifieurs pris séparément. Ce travail porte sur la question de la véracité dans les traitements associés aux Big Data et sur la manière d’optimiser un indicateur de celle-ci.

Cependant, l’utilisation massive de classifieurs pose certaines questions : quelle méthode doit-on utiliser pour combiner les résultats ? Quelles techniques peut-on exploiter afin de pallier aux problèmes de temps et de ressource ? Et, surtout, quel est l’impact d’une telle approche sur la précision des résultats ? Dans le but de répondre à ces questions, nous proposons dans cet article une approche exploitant à la fois la dynamique Map/Reduce et le Cloud Computing dans le contexte des Big Data. Les problématiques de la vélocité et de la volumétrie sont traitées lors de la phase d’apprentissage par l’intermédiaire du support Map/Reduce et lors de la phase de décision par celui du Cloud. Nous mettrons en lumière l’intérêt de notre approche à l’aide d’une simulation sur un jeu de données de référence (KDD Cup 1999).

La suite de cet article est organisée comme suit. La section 2 présente des travaux connexes en classification distribuée, et collective de données massives. Ensuite, dans la section 3, nous décrivons notre système de classification distribuée et consensuelle. Puis, nous exposons, dans la section 4, une spécification technique possible de mise en œuvre de notre système et une implémentation de test. Enfin nous proposerons nos conclusions et perspectives.

2 Exemples de travaux connexes

2.1 Classification et Big Data

Pour classifier les Big Data, Suthaharan (2014) a eu recours aux outils mathématiques et statistiques pour effectuer une analyse préliminaire afin de déterminer les caractéristiques (volume, variété et vélocité) des données et les représenter dans un espace 3D défini sur la base de trois nouveaux paramètres : cardinalité, continuité et complexité. En se basant sur cette représentation, les auteurs ont utilisé des modèles d’apprentissage continu (Machine Lifelong Learning) pour s’adapter aux différentes caractéristiques de données en entrée du système. Cependant, leur méthode ne précise pas de topologie claire du réseau et ni ne démontre sa capacité à passer à l’échelle.

Dans une autre approche, Angiulli et Folino (2007) utilisent une version distribuée de l’algorithme du plus proche voisin (PFCNN) pour extraire des sous-ensembles condensés et représentatifs des Big Data pour construire des classifieurs performants, leur travail se focalise plus sur les gains en mémoire et en CPU, mais il ne traite que peu la précision. Or cette problématique est cruciale, car la qualité de l’analyse et de la prise de décision dépend grandement de la qualité de l’information exploitée. La précision est un indicateur important de cette qualité. Augmenter la précision permet d’avoir une information plus fiable et minimise le risque d’erreur. En cela, la précision est un indicateur de véracité dans les Big Data. C’est le principal objectif qui a guidé notre travail.

2.2 Classification distribuée

Nous présentons ici quelques travaux ayant traité le problème de l’apprentissage distribué, que ce soit pour la classification automatique, supervisée ou non supervisée, de données. On s’intéresse principalement à ceux qui visent à améliorer la précision de la classification globale obtenue à partir de multiples classifieurs locaux, entraînés individuellement.

Ping Luo et al. ont proposé, dans Luo et al. (2007), une approche collective pour la classification distribuée de données, dans un système P2P (paire à paire ou peer to peer). Selon leur approche, chaque paire construit ses propres classifieurs, en utilisant des données locales, et en exécutant l’algorithme d’apprentissage Pasting bites. Ensuite, tous les résultats sont combinés, en utilisant la technique du vote majoritaire. Il s’agit d’un protocole de vote distribué, basé sur l’échange de message entre les paires du réseau. Le modèle de distribution proposé dans ce travail, ne peut être envisagé dans le cas d’un réseau large échelle, étant donné que dans ce genre de réseau, le vote majoritaire de toutes les paires ne peut pas être envisagé.

Une version distribuée de l’algorithme de clustering k-moyennes, dans un environnement P2P a été proposé dans Datta et al. (2009). L’algorithme ne nécessite que l’échange d’information locale. Selon les auteurs, il s’agit du premier algorithme des K-moyennes qui pourrait être appliqué dans le cas d’un réseau large-échelle. Chaque nœud du réseau calcule les centroïdes des clusters, et les échange avec ses voisins. Chaque voisin recalcule ses centroïdes, en utilisant ses données locales, et les centroïdes obtenus de ses voisins. L’algorithme étant asynchrone et les nœuds ne communiquant qu’avec leurs voisins directs, la dynamique globale de décision qui permet l’émergence du clustering final est difficile à appréhender. D’ailleurs, les auteurs exploitent une horloge globale dans le cadre de leur expérimentation et considère le résultat majoritaire après un certain nombre de mises à jour du réseau.

En terme de distribution de données volumineuses d’apprentissage sur un réseau de nœuds, plusieurs approches ont été proposées dans la littérature (Moretti et al., 2008). On distingue quatre méthodes possibles de mise en œuvre de la distribution des données d’apprentissage, et ce en considérant l’emplacement de ces données sur les nœuds du système :

— La méthode Streaming : s’applique au cas de sources de données réparties, où la fonction de partitionnement relie simplement chaque source à un classifieur dans le système via un flux, telle qu’une connexion TCP.

— La méthode Pull : la fonction de partitionnement lit les données d’apprentissage à partir d’un nœud et écrit les partitions sur ce même nœud. Chacun des classifieurs des autres nœuds importe une partition.

— La méthode Push : la fonction de partitionnement lit les données d’un nœud et écrit les partitions directement sur les nœuds distants, où les classifieurs lisent leurs copies en local.

— La méthode Hybride : la fonction de partitionnement choisit un ensemble réduit de nœuds intermédiaires rapides, fiables, et d’une capacité suffisante pour écrire les données partitionnées. Lors de l’exécution, chaque nœud lit sa partition à partir de ces nœuds.

Mais dans le cadre du Big Data, une méthode est particulièrement exploitée du fait de sa forte scalabilité : l’approche Map/Reduce. Cette approche utilise une fonction de mapping qui répartit les données et une valeur sur les différents nœuds reducers. L’algorithme de mapping correspond à une

Vous aimez cet aperçu ?

Page 1 sur 1

Fouille de Données Complexes

À propos de ce livre électronique

Lié à Fouille de Données Complexes

Titres dans cette série (3)

Livres électroniques liés

Ordinateurs pour vous

Épisodes de podcast liés

Articles associés

Avis sur Fouille de Données Complexes

Qu'avez-vous pensé ?

Aperçu du livre

Fouille de Données Complexes - RNTI

Un système collectif d’utilisation d’un grand ensemble de classifieurs sur le Cloud pour la classification de Big Data

1 Introduction

2 Exemples de travaux connexes

2.1 Classification et Big Data

2.2 Classification distribuée