बाहरी सूत्र - बाह्यरेखा की चरण गणना (उदाहरण के साथ)

बाह्य सूत्र, उस डेटा की गणना करने के लिए एक ग्राफिकल टूल प्रदान करता है जो वितरण के दिए गए सेट के बाहर स्थित होता है जो कि चर के आधार पर आंतरिक या बाहरी तरफ हो सकता है।

बाहरी सूत्र क्या है?

एक आउटलेयर दिए गए नमूने या दिए गए अवलोकन या एक वितरण में डेटा बिंदु है जो समग्र पैटर्न के बाहर स्थित होगा। एक सामान्य रूप से उपयोग किया जाने वाला नियम जो कहता है कि एक डेटा बिंदु को एक बाहरी के रूप में माना जाएगा यदि इसकी पहली चतुर्थक से नीचे या तीसरे चतुर्थक के ऊपर 1.5 IQR से अधिक है।

अलग ढंग से कहा, कम outliers Q1-1.5 से नीचे झूठ होगा IQRand उच्च outliers Q3 + 1.5IQR झूठ होगा

एक को IQR, Q1 और Q3 सहित माध्यिका, चतुर्थक की गणना करने की आवश्यकता है।

बाह्य सूत्र को निम्नानुसार दर्शाया गया है,

Q1 के लिए सूत्र = ¼ (n + 1) वें अवधि  Q3 के लिए सूत्र = ¾ (n + 1) वें अवधि  Q2 के लिए सूत्र = Q3 - Q1

बाह्य की गणना के चरण दर चरण

आउटलियर की गणना के लिए नीचे दिए गए चरणों का पालन करने की आवश्यकता है।

  • चरण 1: सबसे पहले चतुर्थक अर्थात, क्यू 1, क्यू 2 और इंटरक्वेर्टाइल की गणना करें
  • चरण 2: अब मूल्य की गणना करें Q2 * 1.5
  • चरण 3: अब चरण 2 में गणना मूल्य से Q1 मूल्य घटाएं
  • चरण 4: यहां चरण 2 में गणना मूल्य के साथ Q3 जोड़ें
  • चरण 5: चरण 3 और चरण 4 में गणना किए गए मानों की श्रेणी बनाएँ
  • चरण 6: आरोही क्रम में डेटा को व्यवस्थित करें
  • चरण 7: जांचें कि क्या कोई मान है जो चरण 5 में बनाई गई सीमा से नीचे या उससे अधिक है।

उदाहरण

निम्नलिखित संख्याओं के डेटा सेट पर विचार करें: 10, 2, 4, 7, 8, 5, 11, 3, 12. आपको सभी आउटलेर की गणना करने की आवश्यकता है।

उपाय:

सबसे पहले, हमें माध्यिका को खोजने के लिए आरोही क्रम में डेटा की व्यवस्था करने की आवश्यकता है, जो हमारे लिए Q2 होगा।

2, 3, 4, 5, 7, 8, 10, 11, 12

अब चूंकि टिप्पणियों की संख्या विषम है, जो 9 है, मंझला 5 वें स्थान पर झूठ होगा , जो कि 7 है, और इस उदाहरण के लिए Q2 होगा।

इसलिए, Q1 की गणना इस प्रकार है -

Q1 = 9 (9 + 1)

= 10 (10)

Q1 होगा -

Q1 = 2.5 पद

इसका मतलब है कि Q1 टिप्पणियों के 2 एनडी और 3 आरडी स्थिति का औसत है , जो यहां 3 और 4 है, और उसी का औसत है (3 + 4) / 2 = 3.5

इसलिए, Q3 की गणना इस प्रकार है -

Q3 = 9 (9 + 1)

= 10 (10)

क्यू 3 होगा -

Q3 = 7.5 अवधि

इसका मतलब यह है कि Q3 टिप्पणियों के 7 वें और 8 वें स्थान का औसत है , जो यहां 10 और 11 है, और उसी का औसत है (10 + 11) / 2 = 10.5

अब, कम आउटलेरर्स Q1-1.5IQR से नीचे झूठ बोलेंगे, और उच्च आउटलेरर्स Q3 + 1.5IQR से झूठ बोलेंगे

तो, मान 3.5 हैं - (1.5 * 7) = -7 और उच्चतर श्रेणी 10.5 + (1.5 * 7) = 110.25 है।

चूंकि 110.25 और -7 की तुलना में ऊपर या नीचे झूठ बोलने वाली कोई टिप्पणी नहीं है, इसलिए हमारे पास इस नमूने में कोई आउटलेयर नहीं है।

एक्सेल में बाह्य फॉर्मूला का उदाहरण (एक्सेल टेम्पलेट के साथ)

क्रिएटिव कोचिंग क्लास उन छात्रों को पुरस्कृत करने पर विचार कर रहे हैं जो शीर्ष 25% में हैं, हालांकि, वे किसी भी आउटलेयर से बचना चाहते हैं। डेटा 25 छात्रों के लिए है। यदि कोई आउटलाइन है, तो यह निर्धारित करने के लिए बाह्य समीकरण का उपयोग करें?

उपाय:

नीचे उल्लिखित गणना करने के लिए डेटा दिया गया है।

यहाँ टिप्पणियों की संख्या 25 है, और हमारा पहला कदम ऊपर के कच्चे डेटा को आरोही क्रम में परिवर्तित करना होगा।

मेडियन होगा -

औसत मूल्य = ½ (n + 1)

= = = ½ (26)

= 13 वें कार्यकाल

Q2 या मंझला 68.00 है

जो कि जनसंख्या का 50% है।

Q1 होगा -

Q1 = n (n + 1) वें कार्यकाल

= = (25 + 1)

= = (26)

= 6.5 वीं अवधि, जो 7 वें कार्यकाल के बराबर है

Q1 56.00 है, जो 25% से नीचे है

क्यू 3 होगा -

अंत में, Q3 =, (n + 1) वें कार्यकाल

= = (26)

= 19.50 शब्द

यहाँ औसत लेने की आवश्यकता है, जो 19 वें और 20 वें शब्दों की है जो 77 और 77 हैं और उसी का औसत (77 + 77) / 2 = 77.00 है

क्यू 3 77 है, जो शीर्ष 25% है

निम्न श्रेणी

अब, कम आउटलेरर्स Q1-1.5IQR से नीचे झूठ बोलेंगे, और उच्च आउटलेरर्स Q3 + 1.5IQR से झूठ बोलेंगे

उच्च श्रेणी -

तो, मान 56 हैं - (1.5 * 68) = -46 और उच्च श्रेणी 77 + (1.5 * 68) = 179 है।

कोई आउटलेयर नहीं हैं।

प्रासंगिकता और उपयोग

आउटलेयर्स फॉर्मूला जानना बहुत जरूरी है क्योंकि ऐसा डेटा हो सकता है जो इस तरह के मूल्य से तिरछा हो जाए। टिप्पणियों 2, 4, 6, 101 का उदाहरण लें और अब अगर कोई इन मूल्यों का औसत लेता है, तो यह 28.25 होगा, लेकिन 75% अवलोकन 7 से नीचे रहते हैं, और इसलिए एक टिप्पणियों के संबंध में एक गलत निर्णय होगा। यह नमूना है।

यहाँ यह देखा जा सकता है कि 101 स्पष्ट रूप से उल्लिखित प्रतीत होता है, और यदि इसे हटा दिया जाता है, तो औसत 4 होगा, जो उन मूल्यों या टिप्पणियों के बारे में कहता है जो वे 4 की सीमा के भीतर झूठ बोलते हैं। इसलिए यह आचरण करना बहुत महत्वपूर्ण है डेटा की किसी भी गलत सूचना से बचने के लिए गणना। दुनिया भर के सांख्यिकीविदों द्वारा इनका व्यापक रूप से उपयोग किया जाता है जब भी वे कोई शोध कर रहे होते हैं।

दिलचस्प लेख...