एमएपी पक्ष चिंगारी में क्या शामिल है?
एमएपी पक्ष चिंगारी में क्या शामिल है?

वीडियो: एमएपी पक्ष चिंगारी में क्या शामिल है?

वीडियो: एमएपी पक्ष चिंगारी में क्या शामिल है?
वीडियो: Justice For Shivani Is At Full Swing - Maddam Sir - Ep 647 - Full Episode - 1 Nov 2022 2024, मई
Anonim

मैप साइड जॉइन एक प्रक्रिया है जहाँ मिलती है दो तालिकाओं के बीच में किया जाता है नक्शा चरण कम करें चरण की भागीदारी के बिना। नक्शा - साइड जॉइन एक टेबल को बहुत तेजी से सुनिश्चित करने के लिए मेमोरी में लोड होने की अनुमति देता है में शामिल होने के ऑपरेशन, पूरी तरह से एक मैपर के भीतर किया जाता है और वह भी दोनों का उपयोग किए बिना नक्शा और चरणों को कम करें।

यह भी जानिए, MAP साइड जॉइन और रिड्यूस साइड जॉइन हाइव क्या है?

मैप साइड जॉइन आमतौर पर इसका उपयोग तब किया जाता है जब एक डेटा सेट बड़ा होता है और दूसरा डेटा सेट छोटा होता है। जहांकि साइड जॉइन कम करें कर सकते हैं में शामिल होने के दोनों बड़े डेटा सेट। NS मैप साइड जॉइन तेज़ है क्योंकि इसमें सभी मैपर के पूरा होने का इंतज़ार नहीं करना पड़ता जैसा कि के मामले में होता है कम करने . अत साइड जॉइन को कम करें धीमा है।

एमएपी साइड जॉइन का उपयोग करने के क्या फायदे हैं? मैप साइड जॉइन का उपयोग करने के लाभ : नक्शा - साइड जॉइन फेरबदल में छँटाई और विलय और चरणों को कम करने के लिए होने वाली लागत को कम करने में मदद करता है। नक्शा - साइड जॉइन कार्य को पूरा करने के लिए समय कम करके कार्य के प्रदर्शन को बेहतर बनाने में भी मदद करता है।

इसके बाद, सवाल यह है कि चिंगारी में प्रसारण क्या शामिल है?

स्पार्क एसक्यूएल उपयोग करता है ब्रॉडकास्ट ज्वाइन (उर्फ प्रसारण हैश में शामिल होने के ) हैश के बजाय में शामिल होने के अनुकूलन करने के लिए में शामिल होने के प्रश्न जब एक तरफ डेटा का आकार नीचे होता है स्पार्क . यह नेटवर्क पर बड़ी तालिका के सभी डेटा भेजने से बच सकता है।

ब्रॉडकास्ट जॉइन क्या है?

प्रसारण जुड़ता है सत्य डेटा फ़ाइलों के अपेक्षाकृत छोटे एकल स्रोत में संग्रहीत डेटा को बड़े डेटाफ़्रेम में जोड़ने का एक शानदार तरीका है। 2GB तक के डेटाफ़्रेम को प्रसारित किया जा सकता है, इसलिए दसियों या सैकड़ों हज़ार पंक्तियों वाली डेटा फ़ाइल एक है प्रसारण उम्मीदवार।

सिफारिश की: