1. डेटा मास्किंगची संकल्पना
डेटा मास्किंगला डेटा मास्किंग म्हणून देखील ओळखले जाते. जेव्हा आम्ही मास्किंग नियम आणि धोरणे दिली जातात तेव्हा मोबाइल फोन नंबर, बँक कार्ड नंबर आणि इतर माहिती सारख्या संवेदनशील डेटा रूपांतरित करणे, सुधारित करणे किंवा कव्हर करणे ही एक तांत्रिक पद्धत आहे. हे तंत्र प्रामुख्याने संवेदनशील डेटा थेट अविश्वसनीय वातावरणात वापरण्यापासून रोखण्यासाठी वापरले जाते.
डेटा मास्किंग तत्त्व: डेटा मास्किंगने मूळ डेटा वैशिष्ट्ये, व्यवसाय नियम आणि डेटा प्रासंगिकता राखली पाहिजे की त्यानंतरच्या विकास, चाचणी आणि डेटा विश्लेषणावर मास्किंगमुळे परिणाम होणार नाही. मास्किंगच्या आधी आणि नंतर डेटा सुसंगतता आणि वैधता सुनिश्चित करा.
2. डेटा मास्किंग वर्गीकरण
डेटा मास्किंगला स्थिर डेटा मास्किंग (एसडीएम) आणि डायनॅमिक डेटा मास्किंग (डीडीएम) मध्ये विभागले जाऊ शकते.
स्थिर डेटा मास्किंग (एसडीएम): स्थिर डेटा मास्किंगसाठी उत्पादन वातावरणापासून अलगावसाठी नवीन नॉन-प्रॉडक्शन एन्व्हायर्नमेंट डेटाबेसची स्थापना आवश्यक आहे. संवेदनशील डेटा उत्पादन डेटाबेसमधून काढला जातो आणि नंतर उत्पादन नसलेल्या डेटाबेसमध्ये संग्रहित केला जातो. अशाप्रकारे, डिसेन्सिटाइज्ड डेटा उत्पादन वातावरणापासून वेगळा केला जातो, जो व्यवसायाच्या गरजा भागवते आणि उत्पादन डेटाची सुरक्षा सुनिश्चित करतो.
डायनॅमिक डेटा मास्किंग (डीडीएम): हे सामान्यत: उत्पादन वातावरणात रिअल टाइममध्ये संवेदनशील डेटा डिसेन्सिटाइझ करण्यासाठी वापरले जाते. कधीकधी, वेगवेगळ्या परिस्थितींमध्ये समान संवेदनशील डेटा वाचण्यासाठी विविध स्तरांचे मुखवटा आवश्यक असते. उदाहरणार्थ, भिन्न भूमिका आणि परवानग्या वेगवेगळ्या मास्किंग योजना अंमलात आणू शकतात.
डेटा रिपोर्टिंग आणि डेटा उत्पादने मास्किंग अनुप्रयोग
अशा परिस्थितींमध्ये प्रामुख्याने अंतर्गत डेटा देखरेख उत्पादने किंवा बिलबोर्ड, बाह्य सेवा डेटा उत्पादने आणि डेटा विश्लेषणावर आधारित अहवाल, जसे की व्यवसाय अहवाल आणि प्रकल्प पुनरावलोकन यांचा समावेश आहे.
3. डेटा मास्किंग सोल्यूशन
सामान्य डेटा मास्किंग योजनांमध्ये हे समाविष्ट आहे: अवैधता, यादृच्छिक मूल्य, डेटा बदलण्याची शक्यता, सममितीय कूटबद्धीकरण, सरासरी मूल्य, ऑफसेट आणि गोलिंग इ.
अवैधता: अवैधता एन्क्रिप्शन, काटछाट किंवा संवेदनशील डेटा लपविण्यास संदर्भित करते. ही योजना सामान्यत: वास्तविक डेटाची जागा विशेष प्रतीकांसह (जसे की *) सह पुनर्स्थित करते. ऑपरेशन सोपे आहे, परंतु वापरकर्त्यांना मूळ डेटाचे स्वरूप माहित नसते, जे त्यानंतरच्या डेटा अनुप्रयोगांवर परिणाम करू शकते.
यादृच्छिक मूल्य: यादृच्छिक मूल्य संवेदनशील डेटाच्या यादृच्छिक पुनर्स्थापनेस संदर्भित करते (अंकांची पुनर्स्थित करा अंक, अक्षरे अक्षरे पुनर्स्थित करतात आणि वर्णांची पुनर्स्थित करतात). ही मास्किंग पद्धत विशिष्ट प्रमाणात संवेदनशील डेटाचे स्वरूप सुनिश्चित करेल आणि त्यानंतरच्या डेटा अनुप्रयोगास सुलभ करेल. लोक आणि ठिकाणांची नावे यासारख्या अर्थपूर्ण शब्दांसाठी मास्किंग शब्दकोषांची आवश्यकता असू शकते.
डेटा बदलण्याची शक्यता: डेटा रिप्लेसमेंट शून्य आणि यादृच्छिक मूल्यांच्या मास्किंगसारखेच आहे, त्याशिवाय विशेष वर्ण किंवा यादृच्छिक मूल्ये वापरण्याऐवजी मास्किंग डेटा विशिष्ट मूल्यासह पुनर्स्थित केला जातो.
सममितीय कूटबद्धीकरण: सममितीय कूटबद्धीकरण ही एक विशेष उलटपक्षी मास्किंग पद्धत आहे. हे एन्क्रिप्शन की आणि अल्गोरिदमद्वारे संवेदनशील डेटा कूटबद्ध करते. सिफरटेक्स्ट स्वरूप लॉजिकल नियमांमधील मूळ डेटाशी सुसंगत आहे.
सरासरी: सरासरी योजना अनेकदा सांख्यिकीय परिस्थितींमध्ये वापरली जाते. संख्यात्मक डेटासाठी, आम्ही प्रथम त्यांच्या क्षुद्र गणना करतो आणि नंतर मध्यम आसपास डिसेन्सिटाइज्ड मूल्ये यादृच्छिकपणे वितरित करतो, ज्यामुळे डेटाची बेरीज स्थिर ठेवते.
ऑफसेट आणि गोल: ही पद्धत यादृच्छिक शिफ्टद्वारे डिजिटल डेटा बदलते. ऑफसेट गोलिंग डेटाची सुरक्षा राखताना श्रेणीची अंदाजे सत्यता सुनिश्चित करते, जी मागील योजनांपेक्षा वास्तविक डेटाच्या जवळ आहे आणि मोठ्या डेटा विश्लेषणाच्या परिस्थितीत त्याचे महत्त्व आहे.
शिफारस मॉडेल "एमएल-एनपीबी -5660"डेटा मास्किंगसाठी
4. सामान्यतः वापरली जाणारी डेटा मास्किंग तंत्र
(1). सांख्यिकीय तंत्रे
डेटा नमुना आणि डेटा एकत्रिकरण
- डेटा सॅम्पलिंगः डेटा सेटचा प्रतिनिधी सबसेट निवडून सेट केलेल्या मूळ डेटाचे विश्लेषण आणि मूल्यांकन ही डी-ओळख तंत्राची प्रभावीता सुधारण्यासाठी एक महत्वाची पद्धत आहे.
- डेटा एकत्रीकरण: सांख्यिकीय तंत्राचा संग्रह (जसे की सारांश, मोजणी, सरासरी, जास्तीत जास्त आणि किमान) मायक्रोडाटामधील गुणधर्मांवर लागू, परिणाम मूळ डेटा सेटमधील सर्व रेकॉर्डचे प्रतिनिधी आहे.
(2). क्रिप्टोग्राफी
क्रिप्टोग्राफी ही डिसेन्सिटायझेशनची प्रभावीता कमी करण्यासाठी किंवा वर्धित करण्यासाठी एक सामान्य पद्धत आहे. विविध प्रकारचे एन्क्रिप्शन अल्गोरिदम भिन्न डिसेन्सिटायझेशन प्रभाव प्राप्त करू शकतात.
- डिट्रिमिनिस्टिक एन्क्रिप्शन: एक नॉन-यादृच्छिक सममितीय कूटबद्धीकरण. हे सहसा आयडी डेटावर प्रक्रिया करते आणि आवश्यकतेनुसार मूळ आयडीवर सिफरटेक्स्ट डिक्रिप्ट आणि पुनर्संचयित करू शकते, परंतु की योग्यरित्या संरक्षित करणे आवश्यक आहे.
- अपरिवर्तनीय कूटबद्धीकरण: हॅश फंक्शन डेटावर प्रक्रिया करण्यासाठी वापरला जातो, जो सहसा आयडी डेटासाठी वापरला जातो. हे थेट डिक्रिप्ट केले जाऊ शकत नाही आणि मॅपिंग संबंध जतन केले जाणे आवश्यक आहे. याव्यतिरिक्त, हॅश फंक्शनच्या वैशिष्ट्यामुळे, डेटा टक्कर होऊ शकते.
- होमोमॉर्फिक एन्क्रिप्शन: सिफरटेक्स्ट होमोमॉर्फिक अल्गोरिदम वापरला जातो. त्याचे वैशिष्ट्य म्हणजे सिफरटेक्स्ट ऑपरेशनचा परिणाम डिक्रिप्शननंतर प्लेन टेक्स्ट ऑपरेशन प्रमाणेच आहे. म्हणूनच, हे सामान्यत: संख्यात्मक फील्डवर प्रक्रिया करण्यासाठी वापरले जाते, परंतु ते कामगिरीच्या कारणास्तव मोठ्या प्रमाणात वापरले जात नाही.
(3). सिस्टम तंत्रज्ञान
दडपशाही तंत्रज्ञान डेटा आयटम हटवते किंवा त्यांचे संरक्षण करते जे गोपनीयता संरक्षणाची पूर्तता करीत नाहीत, परंतु ते प्रकाशित करीत नाहीत.
- मुखवटा: हे प्रतिस्पर्धी क्रमांक, आयडी कार्डला तारांकित केले जाते किंवा पत्ता कमी केला जातो अशा विशेषता मूल्याचे मुखवटा लावण्यासाठी सर्वात सामान्य डिसेन्सिटायझेशन पद्धतीचा संदर्भ देते.
- स्थानिक दडपशाही: विशिष्ट विशेषता मूल्ये (स्तंभ) हटविण्याच्या प्रक्रियेस संदर्भित करते, अनावश्यक डेटा फील्ड काढून टाकणे;
- रेकॉर्ड दडपशाही: विशिष्ट रेकॉर्ड हटविण्याच्या प्रक्रियेस संदर्भित करते, अनावश्यक डेटा रेकॉर्ड हटविणे.
(4). टोपणनाव तंत्रज्ञान
स्यूडोमनिंग हे एक डी-आयडेंटिफिकेशन तंत्र आहे जे थेट अभिज्ञापक (किंवा इतर संवेदनशील अभिज्ञापक) पुनर्स्थित करण्यासाठी टोपणनाव वापरते. छद्म नावाची तंत्र थेट किंवा संवेदनशील अभिज्ञापकांऐवजी प्रत्येक वैयक्तिक माहिती विषयासाठी अद्वितीय अभिज्ञापक तयार करतात.
- मूळ आयडीशी संबंधित, मॅपिंग टेबल सेव्ह करण्यासाठी आणि मॅपिंग टेबलमध्ये प्रवेश काटेकोरपणे नियंत्रित करण्यासाठी हे स्वतंत्रपणे यादृच्छिक मूल्ये व्युत्पन्न करू शकते.
- आपण छद्म शब्द तयार करण्यासाठी कूटबद्धीकरण देखील वापरू शकता, परंतु डिक्रिप्शन की योग्यरित्या ठेवण्याची आवश्यकता आहे;
हे तंत्रज्ञान मोठ्या संख्येने स्वतंत्र डेटा वापरकर्त्यांच्या बाबतीत मोठ्या संख्येने वापरले जाते, जसे की ओपन प्लॅटफॉर्म परिस्थितीत ओपनआयडी, जेथे भिन्न विकसक समान वापरकर्त्यासाठी भिन्न ओपनआयडी प्राप्त करतात.
(5). सामान्यीकरण तंत्र
सामान्यीकरण तंत्र एक डी-आयडेंटिफिकेशन तंत्राचा संदर्भ देते जे डेटा सेटमधील निवडलेल्या गुणांची ग्रॅन्युलॅरिटी कमी करते आणि डेटाचे अधिक सामान्य आणि अमूर्त वर्णन प्रदान करते. सामान्यीकरण तंत्रज्ञान अंमलबजावणी करणे सोपे आहे आणि रेकॉर्ड-स्तरीय डेटाच्या सत्यतेचे संरक्षण करू शकते. हे सामान्यत: डेटा उत्पादने किंवा डेटा अहवालांमध्ये वापरले जाते.
- गोल: निवडलेल्या विशेषता, जसे की ऊर्ध्वगामी किंवा खालच्या फॉरेन्सिक्ससाठी एक फेरीचा बेस निवडणे, परिणाम 100, 500, 1 के आणि 10 के यांचा समावेश आहे.
- शीर्ष आणि तळाशी कोडिंग तंत्र: वरील (किंवा खाली) पातळीचे प्रतिनिधित्व करणारे उंबरठा वरील (किंवा खाली) वरील मूल्ये (किंवा खाली) बदला, "एक्स वरील" किंवा "एक्सच्या खाली" परिणाम देते
(6). यादृच्छिकतेची तंत्रे
एक प्रकारचे डी-आयडेंटिफिकेशन तंत्र म्हणून, यादृच्छिकरण तंत्रज्ञान यादृच्छिकतेद्वारे गुणधर्मांचे मूल्य सुधारित करणे होय, जेणेकरून यादृच्छिकरणानंतरचे मूल्य मूळ वास्तविक मूल्यापेक्षा भिन्न असेल. ही प्रक्रिया आक्रमणकर्त्याची क्षमता समान डेटा रेकॉर्डमधील इतर विशेषता मूल्यांकडून विशेषता मूल्य मिळविण्याची क्षमता कमी करते, परंतु परिणामी डेटाच्या सत्यतेवर परिणाम करते, जे उत्पादन चाचणी डेटामध्ये सामान्य आहे.
पोस्ट वेळ: सप्टेंबर -27-2022