Amazon Elastic MapReduce के पीछे डेटा प्रोसेसिंग इंजन क्या है?
Amazon Elastic MapReduce के पीछे डेटा प्रोसेसिंग इंजन क्या है?

वीडियो: Amazon Elastic MapReduce के पीछे डेटा प्रोसेसिंग इंजन क्या है?

वीडियो: Amazon Elastic MapReduce के पीछे डेटा प्रोसेसिंग इंजन क्या है?
वीडियो: अमेज़ॅन ईएमआर क्या है और मैं डेटा प्रोसेसिंग के लिए इसका उपयोग कैसे कर सकता हूं? 2024, नवंबर
Anonim

अमेज़न ईएमआर अपने वितरित के रूप में Apache Hadoop का उपयोग करता है डाटा प्रोसेसिंग इंजन . हडूप एक खुला स्रोत, जावा सॉफ्टवेयर ढांचा है जो समर्थन करता है आंकड़े -बड़े समूहों पर चलने वाले गहन वितरित अनुप्रयोग का लोहे की उपयोगी वस्तुएं।

इसके अलावा, Amazon Elastic MapReduce क्या है?

अमेज़ॅन लोचदार मानचित्र कम करें ( ईएमआर ) एक अमेज़न वेब सेवाएँ ( एडब्ल्यूएस ) बिग डेटा प्रोसेसिंग और विश्लेषण के लिए उपकरण। अमेज़न ईएमआर वर्चुअल सर्वर के Hadoop क्लस्टर में बड़े डेटा को संसाधित करता है अमेज़ॅन लोचदार गणना बादल ( ईसी2 ) तथा वीरांगना सरल भंडारण सेवा ( S3 ).

इसके अलावा, क्या Amazon EMR पूरी तरह से प्रबंधित है? यह है पूरी तरह से प्रबंधित डेटा लेक सेवा जो कंप्यूट संसाधनों से डेटा भंडारण को अलग कर सकती है और इसके बजाय गणना समूहों को स्केलेबल बनाती है, जो मांग पर उपयोग करने के लिए उपलब्ध है, और एक ही समय में एक ही डेटासेट तक पहुंचने के लिए कई समूहों की क्षमता शामिल है।

कोई यह भी पूछ सकता है कि AWS EMR कैसे काम करता है?

आम तौर पर, जब आप डेटा को संसाधित करते हैं अमेज़न ईएमआर , इनपुट आपके चुने हुए अंतर्निहित फ़ाइल सिस्टम में फ़ाइलों के रूप में संग्रहीत डेटा है, जैसे कि वीरांगना S3 या HDFS। यह डेटा प्रोसेसिंग क्रम में एक चरण से दूसरे चरण में जाता है। अंतिम चरण आउटपुट डेटा को एक निर्दिष्ट स्थान पर लिखता है, जैसे कि a वीरांगना S3 बाल्टी।

ईसी 2 और ईएमआर में क्या अंतर है?

भिन्न ईएमआर , ईसी2 दास नोड्स को कोर और टास्क नोड्स में वर्गीकृत नहीं करता है। इससे नोड के हटाए जाने/खोने की स्थिति में एचडीएफएस डेटा खोने का खतरा बढ़ जाता है। ईसी2 s3 पर डेटा एक्सेस करने के लिए Apache लाइब्रेरी (s3a) का उपयोग करता है। दूसरी ओर, ईएमआर s3 तक तेजी से पहुंच प्राप्त करने के लिए AWS मालिकाना कोड का उपयोग करता है।

सिफारिश की: