विषयसूची:

Hadoop में विभिन्न फ़ाइल स्वरूप क्या हैं?
Hadoop में विभिन्न फ़ाइल स्वरूप क्या हैं?

वीडियो: Hadoop में विभिन्न फ़ाइल स्वरूप क्या हैं?

वीडियो: Hadoop में विभिन्न फ़ाइल स्वरूप क्या हैं?
वीडियो: Lec-121: Introduction to Hadoop🐘| What is Hadoop🐘| Hadoop Framework🖥 2024, नवंबर
Anonim

सौभाग्य से आपके लिए, बड़ा डेटा समुदाय मूल रूप से तीन अनुकूलित पर बस गया है फ़ाइल स्वरूप में उपयोग के लिए हडूप क्लस्टर: अनुकूलित पंक्ति स्तंभकार (ओआरसी), एवरो, और लकड़ी की छत।

इसके बाद, कोई यह भी पूछ सकता है कि विभिन्न प्रकार के डेटा प्रारूप क्या हैं?

वहाँ तीन हैं डेटा के प्रकार मैपिंग और जीआईएस डेटा प्रारूप . प्रत्येक प्रकार अलग ढंग से संभाला जाता है।

डेटा प्रारूप प्रकार

  • फाइल-आधारित- शेपफाइल्स, माइक्रोस्टेशन डिजाइन फाइल्स (डीजीएन), जियो टीआईएफएफ इमेज।
  • निर्देशिका-आधारित - ईएसआरआई आर्कइन्फो कवरेज, अमेरिकी जनगणना टाइगर।
  • डेटाबेस कनेक्शन - पोस्टजीआईएस, ईएसआरआई आर्कएसडीई, माईएसक्यूएल।

साथ ही, हाइव में कौन सा फ़ाइल स्वरूप सबसे अच्छा है? RCFile पंक्ति स्तंभ है फाइल प्रारूप . यह का दूसरा रूप है हाइव फ़ाइल प्रारूप जो उच्च पंक्ति स्तर संपीड़न दर प्रदान करता है। यदि आपको एक समय में कई पंक्तियाँ करने की आवश्यकता है तो आप RCFile का उपयोग कर सकते हैं प्रारूप.

इसे ध्यान में रखते हुए, Hadoop में सामान्य इनपुट प्रारूप क्या हैं?

इनपुटफॉर्मैट इनपुटस्प्लिट बनाता है।

  • सबसे आम इनपुटफॉर्मेट हैं:
  • FileInputFormat- यह सभी फ़ाइल-आधारितInputFormat के लिए आधार वर्ग है।
  • TextInputFormat- यह MapReduce का डिफ़ॉल्ट InputFormat है।
  • KeyValueTextInputFormat- यह TextInputFormat के समान है।
  • Hadoop में InputFormat के बारे में अधिक जानने के लिए लिंक का अनुसरण करें।

Hadoop में orc फ़ाइल स्वरूप क्या है?

ओआरसी फ़ाइल प्रारूप अनुकूलित पंक्ति स्तंभकार ( ओआरसी ) फाइल प्रारूप हाइव डेटा स्टोर करने का एक अत्यधिक कुशल तरीका प्रदान करता है। इसे अन्य हाइव की सीमाओं को दूर करने के लिए डिज़ाइन किया गया था फ़ाइल प्रारूप . का उपयोग करते हुए ओआरसी फाइलें डेटा पढ़ने, लिखने और संसाधित करने के दौरान Hiveis के प्रदर्शन में सुधार होता है।

सिफारिश की: