Hadoop में डेटा लेक क्या है?
Hadoop में डेटा लेक क्या है?

वीडियो: Hadoop में डेटा लेक क्या है?

वीडियो: Hadoop में डेटा लेक क्या है?
वीडियो: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, मई
Anonim

ए हडूप डेटा लेक एक है आंकड़े प्रबंधन मंच जिसमें एक या अधिक शामिल हैं हडूप समूह यह मुख्य रूप से गैर-संबंधपरक को संसाधित करने और संग्रहीत करने के लिए उपयोग किया जाता है आंकड़े , जैसे लॉग फ़ाइलें, इंटरनेट क्लिकस्ट्रीम रिकॉर्ड, सेंसर आंकड़े , JSON ऑब्जेक्ट, इमेज और सोशल मीडिया पोस्ट।

इस संबंध में, डेटा वेयरहाउस और डेटा लेक में क्या अंतर है?

डेटा झीलें तथा आंकड़े गोदामों का व्यापक रूप से बड़े भंडारण के लिए उपयोग किया जाता है आंकड़े , लेकिन वे विनिमेय शब्द नहीं हैं। ए डेटा लेक कच्चे का एक विशाल पूल है आंकड़े , जिसका उद्देश्य अभी तक परिभाषित नहीं किया गया है। ए डेटा वेयरहाउस संरचित, फ़िल्टर्ड के लिए एक भंडार है आंकड़े जिसे पहले ही एक विशिष्ट उद्देश्य के लिए संसाधित किया जा चुका है।

इसके अतिरिक्त, डेटा लेक आर्किटेक्चर क्या है? ए डाटा लेक एक भंडारण भंडार है जो बड़ी मात्रा में संरचित, अर्ध-संरचित और असंरचित संग्रहीत कर सकता है आंकड़े . एक पदानुक्रमित डेटावेयर हाउस के विपरीत जहां आंकड़े Files and Folder में Stored होता है, डेटा लेक एक फ्लैट है वास्तुकला.

इसके संबंध में डेटा लेक से क्या तात्पर्य है?

ए डेटा लेक एक भंडारण भंडार है जिसमें बड़ी मात्रा में कच्चा है आंकड़े अपने मूल स्वरूप में जब तक इसकी आवश्यकता न हो। जबकि एक पदानुक्रमित आंकड़े गोदाम भंडार आंकड़े फ़ाइलों या फ़ोल्डरों में, a डेटा लेक स्टोर करने के लिए एक सपाट वास्तुकला का उपयोग करता है आंकड़े . शब्द डेटा लेक अक्सर Hadoop-ओरिएंटेड ऑब्जेक्ट स्टोरेज से जुड़ा होता है।

क्या इलास्टिक्स खोज एक डेटा लेक है?

ए डेटा लेक बस पार्क करने के लिए एक जगह है आंकड़े जब तक आपको इसकी आवश्यकता न हो, और इसमें एचडीएफएस (सबसे आम), ऑब्जेक्ट स्टोरेज, एनएएस बॉक्स, या कुछ और शामिल हो सकता है। मूल रूप से, Elasticsearch अनुक्रमण के लिए एक उपकरण है आंकड़े , के भंडारण के लिए नहीं आंकड़े अपने आप।

सिफारिश की: