वीडियो: डेटा में आउटलेयर का क्या कारण है?
2024 लेखक: Lynn Donovan | [email protected]. अंतिम बार संशोधित: 2023-12-15 23:47
बाहरी कारकों के कारण अक्सर हैं वजह मानवीय त्रुटि से, जैसे त्रुटियों में आंकड़े संग्रह, रिकॉर्डिंग, या प्रविष्टि। आंकड़े एक साक्षात्कार से गलत तरीके से दर्ज किया जा सकता है, या गलत तरीके से दर्ज किया जा सकता है आंकड़े प्रवेश।
इसे ध्यान में रखते हुए, डेटा में आउटलेयर क्यों हैं?
आंकड़ों में, एक ग़ैर एक है आंकड़े बिंदु जो अन्य अवलोकनों से काफी भिन्न है। एक ग़ैर में परिवर्तनशीलता के कारण हो सकता है NS माप या यह प्रयोगात्मक त्रुटि का संकेत दे सकता है; NS बाद वाले को कभी-कभी इससे बाहर रखा जाता है आँकड़े सेट। एक ग़ैर सांख्यिकीय विश्लेषण में गंभीर समस्याएं पैदा कर सकता है।
इसके अलावा, शोध में आउटलेयर क्या है? की परिभाषा बाहरी कारकों के कारण . एक ग़ैर एक अवलोकन है जो जनसंख्या से यादृच्छिक नमूने में अन्य मूल्यों से असामान्य दूरी पर स्थित है। एक मायने में, यह परिभाषा यह तय करने के लिए विश्लेषक (या आम सहमति प्रक्रिया) पर छोड़ देती है कि क्या असामान्य माना जाएगा।
यह भी जानने के लिए कि आप डेटा में आउटलेयर कैसे ढूंढते हैं?
एक बिंदु जो के बाहर पड़ता है आंकड़े सेट की आंतरिकता को नाबालिग के रूप में वर्गीकृत किया गया है ग़ैर , जबकि बाहरी बाड़ के बाहर गिरने वाले को एक प्रमुख के रूप में वर्गीकृत किया जाता है ग़ैर . अपने लिए आंतरिक बाड़ खोजने के लिए आंकड़े पहले सेट करें, इंटरक्वेर्टाइल रेंज को 1.5 से गुणा करें। फिर, परिणाम को Q3 में जोड़ें और Q1 से घटाएं।
बाहरी होने का क्या मतलब है?
एक " ग़ैर "कोई भी या कुछ भी है जो सामान्य सीमा से बहुत दूर है। व्यापार में, एक ग़ैर बहुमत की तुलना में नाटकीय रूप से कम या ज्यादा सफल व्यक्ति है। करना आप एक बनना चाहते हैं ग़ैर वित्तीय सफलता के ऊपरी छोर पर? निश्चित रूप से। बाहरी कारकों के कारण मैल्कम ग्लैडवेल की एक बहुत लोकप्रिय पुस्तक भी है।
सिफारिश की:
डेटा वेयरहाउस में किस तालिका में बहुआयामी डेटा होता है?
तथ्य तालिका में डेटा वेयरहाउस में बहुआयामी डेटा होता है। बहुआयामी डेटाबेस का उपयोग 'ऑनलाइन विश्लेषणात्मक प्रसंस्करण' (OLAP) और डेटा वेयरहाउस को अनुकूलित करने के लिए किया जाता है
डेटा विश्लेषण में आउटलेयर क्या हैं?
आँकड़ों में, एक बाहरी एक डेटा बिंदु है जो अन्य टिप्पणियों से महत्वपूर्ण रूप से भिन्न होता है। माप में परिवर्तनशीलता के कारण अधिक हो सकता है या यह प्रयोगात्मक त्रुटि का संकेत दे सकता है; बाद वाले को कभी-कभी डेटा सेट से बाहर रखा जाता है। सांख्यिकीय विश्लेषण में एक बाहरी गंभीर समस्या पैदा कर सकता है
यूनीवेरिएट आउटलेयर क्या है?
एक अविभाज्य बाह्यरेखा एक डेटा बिंदु है जिसमें एक चर पर एक चरम मान होता है। एक बहुभिन्नरूपी बाह्यरेखा कम से कम दो चरों पर असामान्य अंकों का एक संयोजन है। दोनों प्रकार के आउटलेयर सांख्यिकीय विश्लेषण के परिणाम को प्रभावित कर सकते हैं
डेटा माइनिंग में विभिन्न प्रकार के डेटा क्या हैं?
आइए चर्चा करें कि किस प्रकार के डेटा का खनन किया जा सकता है: फ्लैट फ़ाइलें। संबंधपरक डेटाबेस। डेटा वेयरहाउस। लेन-देन संबंधी डेटाबेस। मल्टीमीडिया डेटाबेस। स्थानिक डेटाबेस। समय श्रृंखला डेटाबेस। वर्ल्ड वाइड वेब (डब्ल्यूडब्ल्यूडब्ल्यू)
कॉलम ओरिएंटेड डेटा स्टोरेज, रो ओरिएंटेड डेटा स्टोरेज की तुलना में डिस्क पर डेटा एक्सेस को तेज क्यों बनाता है?
कॉलम ओरिएंटेड डेटाबेस (उर्फ कॉलमर डेटाबेस) विश्लेषणात्मक वर्कलोड के लिए अधिक उपयुक्त हैं क्योंकि डेटा फॉर्मेट (कॉलम फॉर्मेट) खुद को तेजी से क्वेरी प्रोसेसिंग - स्कैन, एग्रीगेशन आदि के लिए उधार देता है। दूसरी ओर, रो ओरिएंटेड डेटाबेस एक सिंगल रो (और इसके सभी) को स्टोर करते हैं। कॉलम) लगातार