कुंजी द्वारा कम करना क्या है?
कुंजी द्वारा कम करना क्या है?

वीडियो: कुंजी द्वारा कम करना क्या है?

वीडियो: कुंजी द्वारा कम करना क्या है?
वीडियो: 3.1 कुंजी द्वारा कम करें बनाम समूह द्वारा कुंजी | स्पार्क साक्षात्कार प्रश्न | स्पार्क ट्यूटोरियल 2024, मई
Anonim

स्पार्क आरडीडी कम बायकी फ़ंक्शन प्रत्येक के लिए मानों को मर्ज करता है चाभी एक सहयोगी का उपयोग करना कम करना समारोह। इसका सहज अर्थ है, यह फ़ंक्शन समान परिणाम उत्पन्न करता है जब तत्व के क्रम के बावजूद कई विभाजनों के साथ RDD डेटा के एक ही सेट पर बार-बार लागू किया जाता है।

फिर, GroupByKey और reduceByKey में क्या अंतर है?

ग्रुपबायकी () केवल एक कुंजी के आधार पर आपके डेटासेट को समूहीकृत करने के लिए है। कम बायकी () समूहीकरण + एकत्रीकरण जैसा कुछ है। कम बायकी जब हम बड़े डेटा सेट पर चलते हैं तो इसका उपयोग किया जा सकता है। एग्रीगेटबायके () तार्किक रूप से समान है कम बायकी () लेकिन यह आपको परिणाम वापस करने देता है को अलग प्रकार।

यह भी जानिए, चिंगारी में कार्रवाई क्यों कम होती है? स्पार्क कम करें ऑपरेशन एक है कार्य ऑपरेशन का प्रकार और यह सभी पंक्तिबद्ध आलसी निर्देशों के लिए एक पूर्ण डीएजी निष्पादन को ट्रिगर करता है। स्पार्क आरडीडी कम करना फ़ंक्शन निर्दिष्ट कम्यूटेटिव और एसोसिएटिव बाइनरी ऑपरेटर का उपयोग करके इस आरडीडी के तत्वों को कम करता है। स्पार्क कम करें ऑपरेशन लगभग समान है कम करना स्कैला में विधि।

ऊपर के अलावा, Pairrdd क्या है?

स्पार्क कुंजी/मूल्य जोड़े वाले आरडीडी पर विशेष संचालन प्रदान करता है। इन RDD को युग्म RDD कहा जाता है। पेयर आरडीडी कई कार्यक्रमों में एक उपयोगी बिल्डिंग ब्लॉक हैं, क्योंकि वे ऐसे संचालन को उजागर करते हैं जो आपको नेटवर्क में समानांतर या पुनर्समूहित डेटा में प्रत्येक कुंजी पर कार्य करने की अनुमति देते हैं। PairRDDs KEY/VALUE जोड़े हैं।

क्या कम बायकी एक क्रिया है?

कम करें () एक संग्रह को आउटपुट करता है जो निर्देशित एसाइक्लिक ग्राफ (डीएजी) में नहीं जोड़ता है, इसलिए इसे एक के रूप में लागू किया जाता है कार्य . तथापि, कम बायकी () एक आरडीडी देता है जो डीएजी में सिर्फ एक और स्तर/राज्य है, इसलिए एक परिवर्तन है।

सिफारिश की: