Découvrez nos solutions sans obligation d’achat
Dans cette section, il y sera examiner le processus de la base de connaissances (KDD) en y référant à des articles pertinents dans ce domaine. Ce document vise également à discuter des concepts d’exploration de données et à examiner leurs principes et algorithmes de création de connaissances. Le cours présente une variété d’approches du problème de la découverte de connaissances et de son application dans la science des données et l’analyse des données. Sources : 5,11,10]
La découverte de connaissances implique l’ensemble du processus d’extraction de connaissances, y compris la façon dont les données sont stockées et extraites, la façon dont des algorithmes efficaces et évolutifs sont utilisés pour analyser des ensembles de données massifs, et la façon dont les résultats sont interprétés, visualisés, interprétés et modélisés et soutenus par des interactions homme-machine. Sources : 2]
Une fois l’objectif défini, il convient de déterminer quelles données sont utilisées dans le processus de création de connaissances. Ce processus, qui peut sembler simple, implique la collecte de données provenant de plusieurs ensembles de données, chacun ayant ses propres objectifs, et nécessite de multiples itérations, en testant de nouvelles hypothèses en plus de l’analyse initiale des données d’un ensemble de données. Elle implique le processus de découverte des données disponibles, l’obtention des données supplémentaires nécessaires et l’intégration des données pour la découverte de connaissances dans un groupe par la suite. Déterminer lesquelles de ces données utilisées pour les connaissances découverte, la qualité des données auxquelles il y a l’accès, les données importantes que obtenir, y compris les attributs dont il faut tenir compte dans ce processus, et s’il s’agit de les intégrer dans une autre de nos bases de données, et si les données sont disponibles ou non à d’autres fins (par exemple, à des fins de recherche). [Sources : 6,8,12,8]
La découverte de connaissances et l’exploration de données (KDD) est un domaine interdisciplinaire qui se concentre sur la méthodologie permettant d’extraire des connaissances utiles des données. Au niveau de l’application, la détection et les concepts connexes (ontologies) ont montré le potentiel de s’engager dans la recherche de connaissances avec des données volumineuses, et la collecte de ces données dans de grandes bases de données peut encourager l’utilisation de techniques modernes de traitement des données – l’extraction pour découvrir des connaissances supplémentaires par des méthodes automatisées. Si l’intelligence artificielle peut générer des algorithmes informatiques capables de prédire des événements, des modèles peuvent également être reconnus et catégorisés en temps réel. Sources : 7,9,3]
Dans le cadre du processus de découverte, les services de qualité des données (DQS) analysent des échantillons de données provenant de sources de données dans un processus assisté par ordinateur et complètent la base de connaissances. Une technique d’exploration de données largement utilisée est un processus qui fait appel à des connaissances préalables de l’ensemble des données et interprète des solutions précises à partir des résultats observés. Sources : 2,1]
L’exploration de données est le processus de base du KDD, qui implique un algorithme qui examine les données, développe des modèles et trouve des modèles précédemment inconnus. Ces modèles sont utilisés pour extraire des connaissances des données et pour analyser et prédire les données. [Sources : 8,8]
L’exploration de données est un processus qui recherche dans une base de données les relations possibles, et c’est l’un des aspects les plus importants de l’exploration de données dans le processus KDD. L’exploration de données peut être définie comme l’analyse d’un grand nombre de types d’informations différents, tels que des données, des ensembles de données ou des modèles de données. Il s’agit de l’utilisation d’algorithmes et de modèles pour rechercher des relations entre les données et d’autres données. Sources : 10,6]
La majorité du travail impliqué dans la création de connaissances est le prétraitement des données ou la préparation des données pour l’analyse réelle dans le contexte de l’exploration de données. Le prétraitement des données est considéré comme une phase très sérieuse de l’exploration de données. Une bonne recherche dans une base de données doit être basée sur des données qui assurent le flux de connaissances. [Sources : 6,10]
La découverte intelligente de données consiste à automatiser les parties fastidieuses du processus de découverte de connaissances afin de réduire le temps de découverte et de le rendre accessible aux utilisateurs professionnels. La découverte de données consiste à découvrir des données et des informations pertinentes et à les mettre à la disposition des utilisateurs qui en ont besoin. Le profilage de la gestion des connaissances vous aide à évaluer quelles sont les sources de données les mieux adaptées pour créer des connaissances qui élargiront votre base de connaissances. Sources : 1,4,4]
Ces étapes comprennent l’apprentissage des sources de données pertinentes, des utilisateurs professionnels et des meilleures façons de découvrir les connaissances et le processus de découverte des données. Sources : 2]
Si vous voulez faire des recherches de connaissances sur une base de connaissances existante, sélectionnez-la, entrez un nom et une description, spécifiez ce pour quoi vous la créez, et cliquez sur « Créer » pour créer une nouvelle base de connaissances ou « Ouvrir » celle-ci. Si vous voulez présenter des découvertes de connaissances sur une base de connaissances plus récente, cliquez sur « Nouveau » ou sur les boutons « Connaissances » et « Découvrir » à droite de l’écran et sélectionnez « Créer ». Cela s’appellera Découverte / Discover et vous bloquera dans la base de connaissances. Une fois que vous l’avez créée, vous pouvez l’ouvrir en cliquant ou en sélectionnant Découverte et Découvrir. [Sources : 1,1,1,1,1]
Vous pouvez immédiatement utiliser la base de connaissances pour des projets de nettoyage, effectuer une gestion de domaine pour faire le ménage et ajouter des connaissances à votre ordinateur pour l’aider dans son processus d’acquisition de connaissances. En analysant les différentes étapes du processus KDD, on pourrait comprendre comment les données sont obtenues pour obtenir des informations et des connaissances utiles. Sources : 1,2]
Typiquement, on s’intéresse aux données disponibles sous la forme d’une liste, d’un tableau ou d’une série d’éléments de données, tels que des noms, des données, des adresses, etc. Typiquement, ces données sont recherchées et recherchées. Typiquement, ces points d’intérêt sont des informations sur l’objet, ses propriétés, son emplacement et ses propriétés. Sources : 0,0]
Sources :
- [0] : https://medium.com/analytics-vidhya/knowledge-discovery-data-kdd-a8b41509bff9
- [1] : https://docs.microsoft.com/en-us/sql/data-quality-services/perform-knowledge-discovery
- [2] : https://www.ijert.org/knowledge-discovery-in-data-mining
- [4] : https://www.sisense.com/glossary/data-discovery/
- [5] : https://machinelearningmastery.com/what-is-data-mining-and-kdd/
- [6] : https://www.informit.com/articles/article.aspx?p=30169
- [7] : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC546397/
- [8] : https://www.javatpoint.com/kdd-process-in-data-mining
- [9] : https://mospace.umsystem.edu/xmlui/handle/10355/49408
- [10] : https://www.grin.com/document/201604
- [11] : http://www.cs.wpi.edu/~cs548/f18/
- [12] : https://blog.udemy.com/knowledge-discovery-in-databases/