Découverte et classification des données

Dans le contexte de la sécurité de l’information, la détection des données s’effectue généralement au moyen d’outils de test conçus pour rechercher des types de données spécifiques dans les applications, les réseaux et les terminaux. En matière de cybersécurité, elle peut parfois être aussi importante que la sauvegarde des données elles-mêmes, voire plus importante. Sources : 9,9]

Il s’agit du processus d’identification du type de données dans une source de données découverte à l’aide d’un ensemble prédéfini de modèles, de mots-clés et de règles, et de l’attribution d’étiquettes de classification aux données. La classification des données se fait en pointant un outil sur une base de données et en devinant, grâce aux noms des colonnes, ce que contient la base de données. Sources : 11,4]

Le moteur de classification analyse la base de données à la recherche de colonnes qui contiennent des données potentiellement sensibles et fournit une liste de colonnes recommandées pour la classification. Les machines de classification analysent une base de données et identifient les colonnes contenant des données potentiellement sensibles. Le moteur de classification recherche dans une base de données les colonnes qui contiennent des données potentiellement vulnérables (par exemple, des données à haut risque d’être piratées). [Sources : 5,5]

Découvrez nos solutions sans obligation d’achat

L’identification et la classification des données constituent une partie importante de la protection des données confidentielles et de la conformité aux réglementations sur la protection des données. L’une des premières étapes consiste à identifier et à découvrir le contenu sensible afin de le surveiller et de le protéger. Avant de mettre en place la découverte ou la classification des données, assurez-vous d’être conscient de ce que vous devez d’abord savoir et de ce que les données vous aideront à réaliser. [Sources : 2,6,13,0]

La classification des données vous permet d’analyser les fichiers, les chaînes de caractères et les données afin de catégoriser correctement les données trouvées dans les sources de données structurées et non structurées. Nous savons également que la classification des données peut être effectuée à l’aide d’outils simples, vous pouvez créer des rapports étonnants et obtenir une meilleure compréhension de votre base de données et de sa gestion. Lier la découverte et la classification des données peut apporter de nombreux avantages à votre entreprise en matière de sécurité, comme une meilleure visibilité des données sensibles et le respect de la conformité. [Sources : 9,1,8]

Dans le rapport sur la classification des données ci-dessous, vous pouvez voir qu’il existe deux niveaux différents auxquels les données peuvent être classées : confidentiel et classifié. Les outils de découverte des données aident votre équipe de sécurité à savoir où se trouvent les données sensibles, mais la découverte et la classification sont importantes pour les données non classifiées. Si votre base de données, vos fichiers ou d’autres ressources de données contiennent des données classées au plus haut niveau, il est préférable de les classer. En surveillant constamment les données classifiées et non classifiées, vous pouvez détecter les utilisations abusives des données non classifiées et faire respecter la conformité. [Sources : 9,8,7,1]

SQL Server 2019 ne stocke pas les informations de classification comme une propriété étendue, mais ajoute des métadonnées sur la sensibilité de la classification à une ou plusieurs colonnes de la base de données. SQL Server 2018 et versions ultérieures, mais pas dans sa forme actuelle ; il ne stocke pas les informations secrètes en étendant la propriété, mais ajoute les sensibilités et les classifications aux métadonnées À une ou plusieurs colonnes de la base de données. Sql _ server _ 2019 ne stocke pas les informations de classification et n’étend pas les propriétés, mais ajoute plutôt des données thématiques autour des classifications sensibles. [Sources : 12,12]

L’exemple suivant utilise une base de données Azure SQL, mais vous pouvez utiliser Data Discovery and Classification dans SSMS 17.5 et plus. Vous devez sélectionner le produit approprié que vous souhaitez configurer pour la détection et la classification des données. La détection et la classification des données étant un outil intégré dans SSMS, il est recommandé de toujours disposer de la dernière version de SSMS. Il n’y a aucune preuve que la détection et la classification des données soient prises en charge dans SQL Server 2012 ou plus récent ; elles peuvent être utilisées avec SSMMS 18.0.1.2 ou même plus récent si vous sélectionnez « Tasks » et « Data Discovery & Classifieds » dans votre explorateur d’objets SSms. Sources : 3,5,3,1]

L’un des problèmes rencontrés par de nombreuses entreprises, notamment au niveau de l’entreprise, est la collecte et la classification manuelles des données, ce qui entraîne souvent une perte de temps pour les ressources les plus précieuses de l’équipe. Les entreprises sont en constante évolution, ce qui rend la collecte et la classification des données plus difficiles lorsqu’elles sont anciennes ou, inversement, lorsque de nouvelles technologies sont introduites. [Sources : 11,6]

Cette approche rend plus difficile la détection et la classification des données et rend plus difficile la protection et le contrôle des données sensibles, ce qui est finalement l’objectif. Imperva protège vos données où qu’elles se trouvent, que ce soit au bureau, dans le cloud ou dans un environnement hybride. L’entreprise dispose d’une gamme d’outils de reconnaissance et de classification des données, qui fournissent généralement à l’équipe les connaissances nécessaires pour élaborer une politique approfondie d’utilisation et de stockage des données. [Sources : 13,9,7]

Les outils de reconnaissance et de classification des données vous aident à protéger vos données en respectant les normes de protection des données et en contrôlant l’accès à ces données. Ces outils vous permettent de classer les données et de travailler sur la déclaration des données sensibles en moins de temps et d’efforts que les outils traditionnels de classification des données. La fonction de découverte et de classification des données vous permet également de créer un rapport résumant l’état de classification de votre base de données. Sources : 14,14,1]

Sources :

  • 0] : https://gttb.com/data-discovery-data-classification/
  • 1] : https://codingsight.com/sql-data-discovery-and-classification/
  • 2] : https://www.infosecurity-magazine.com/opinions/howto-data-discovery/
  • [3] : https://docs.microsoft.com/en-us/sql/relational-databases/security/sql-data-discovery-and-classification
  • [4] : https://www.dataversity.net/data-architects-its-time-to-improve-your-data-classification/
  • [5] : https://docs.microsoft.com/en-us/azure/azure-sql/database/data-discovery-and-classification-overview
  • [6] : https://www.spirion.com/blog/automating-data-discovery-and-data-classification-for-enhanced-privacy/
  • [7] : https://www.imperva.com/learn/data-security/data-classification/
  • [8] : https://digitalguardian.com/blog/data-discovery-and-classification-working-hand-in-hand
  • [9] : https://nightfall.ai/data-discovery-and-classification-secure-pii
  • [10] : https://sqlskull.com/2020/07/17/sql-data-discovery-and-classification/
  • [11] : https://securityintelligence.com/posts/data-discovery-and-classification-are-complicated-but-critical-to-your-data-protection-program/
  • [12] : https://dzone.com/articles/manage-your-sensitive-data-with-sql-data-discovery
  • [13] : https://en.fasoo.com/dont-complicate-data-discovery-and-classification/
  • [14] : https://www.sqlshack.com/whats-new-in-ssms-17-5-data-discovery-and-classification-and-more/