स्कैला में RDD क्या है?
स्कैला में RDD क्या है?

वीडियो: स्कैला में RDD क्या है?

वीडियो: स्कैला में RDD क्या है?
वीडियो: आरडी क्या होता है | बैंक में आरडी क्या है हिंदी में | बैंक में क्या होता है | तीसरा अकाउंट क्या होता है 2024, मई
Anonim

लचीला वितरित डेटासेट ( आरडीडी ) स्पार्क की एक मौलिक डेटा संरचना है। यह वस्तुओं का एक अपरिवर्तनीय वितरित संग्रह है। आरडीडी किसी भी प्रकार का पायथन, जावा, या हो सकता है स्केला उपयोगकर्ता परिभाषित वर्गों सहित वस्तुओं। औपचारिक रूप से, एक आरडीडी अभिलेखों का केवल-पढ़ने के लिए, विभाजित संग्रह है।

यह भी सवाल है कि RDD और DataFrame में क्या अंतर है?

आरडीडी – आरडीडी कई मशीनों में फैले डेटा तत्वों का एक वितरित संग्रह है में समूह। आरडीडी डेटा का प्रतिनिधित्व करने वाले जावा या स्कैला ऑब्जेक्ट्स का एक सेट है। डेटा ढांचा - ए डेटा ढांचा नामित स्तंभों में व्यवस्थित डेटा का एक वितरित संग्रह है। यह अवधारणात्मक रूप से एक तालिका के बराबर है में एक संबंध का डेटाबेस।

इसके अलावा, RDD कैसे वितरित किया जाता है? लचीला वितरित डेटासेट ( आरडीडी ) वे एक हैं वितरित वस्तुओं का संग्रह, जो स्मृति में या क्लस्टर की विभिन्न मशीनों के डिस्क पर संग्रहीत होते हैं। एक भी आरडीडी कई तार्किक विभाजनों में विभाजित किया जा सकता है ताकि इन विभाजनों को एक क्लस्टर की विभिन्न मशीनों पर संग्रहीत और संसाधित किया जा सके।

स्पार्क आरडीडी कैसे काम करता है?

आरडीडी में स्पार्क उन अभिलेखों का संग्रह है जिनमें विभाजन होते हैं। आरडीडी में स्पार्क डेटा के छोटे तार्किक हिस्सों में विभाजित होते हैं - विभाजन के रूप में जाना जाता है, जब कोई क्रिया निष्पादित की जाती है, तो प्रति विभाजन एक कार्य लॉन्च किया जाएगा। में विभाजन आरडीडी समानता की मूल इकाइयाँ हैं।

कौन सा तेज RDD या DataFrame है?

आरडीडी - सरल समूहीकरण और एकत्रीकरण संचालन करते समय आरडीडी एपीआई धीमा है। डेटा ढांचा - खोजपूर्ण विश्लेषण करने में, डेटा पर समेकित आंकड़े बनाना, डेटाफ्रेम हैं और तेज . आरडीडी - जब आप निम्न-स्तरीय परिवर्तन और कार्य चाहते हैं, तो हम उपयोग करते हैं आरडीडी . इसके अलावा, जब हमें उच्च-स्तरीय एब्स्ट्रैक्शन की आवश्यकता होती है तो हम इसका उपयोग करते हैं आरडीडी.

सिफारिश की: