रैखिक प्रतिगमन (परिभाषा, उदाहरण) - व्याख्या कैसे करें?

रैखिक प्रतिगमन क्या है?

रैखिक प्रतिगमन मूल रूप से एक सांख्यिकीय मॉडलिंग तकनीक है जो एक आश्रित चर और एक या अधिक स्वतंत्र चर के बीच के संबंध को दिखाने के लिए उपयोग किया जाता है। यह सबसे आम प्रकार के पूर्वानुमान विश्लेषण में से एक है। इस प्रकार का वितरण एक पंक्ति में होता है इसलिए इसे रैखिक प्रतिगमन कहा जाता है। इस लेख में, हम एक्सेल में रैखिक प्रतिगमन विश्लेषण के उदाहरण लेंगे।

पहले रैखिक प्रतिगमन विश्लेषण करने के लिए, हमें निम्नलिखित चरणों में एक्सेल ऐड-इन्स जोड़ने की आवश्यकता है।

फ़ाइल पर क्लिक करें - विकल्प (यह आपके लिए एक्सेल विकल्प खुल जाएगा)।

ऐड-इन्स पर क्लिक करें - एक्सेल में मैनेज ड्रॉप डाउन से एक्सेल ऐड-इन्स चुनें, फिर गो पर क्लिक करें।

यह ऐड-इन्स पॉप अप खोलेगा। विश्लेषण टूलपैक चुनें फिर ओके पर क्लिक करें।

डेटा विश्लेषण ऐड-इन इन्सर्ट टैब के तहत दिखाई देगा।

आइए एक्सेल में रैखिक प्रतिगमन विश्लेषण के नीचे के उदाहरणों को समझते हैं।

रैखिक प्रतिगमन विश्लेषण उदाहरण

उदाहरण 1

मान लीजिए कि हमारी मासिक बिक्री है और पिछले साल के लिए विपणन पर खर्च किया गया है, और अब हमें पिछले साल की बिक्री और खर्च किए गए विपणन के आधार पर भविष्य की बिक्री की भविष्यवाणी करने की आवश्यकता है।

महीना विज्ञापन बिक्री
जन 40937 है 502729 है
फ़रवरी 42376 507553 है
मार 43355 है 516885
अप्रैल 44126 528347 है
मे 45060 है ५३२ ९ 29
जून 49546 है 544066 है
जुल 56105 553664 है
अगस्त 59322 है 563201 है
सिपाही 59877 है 568657 है
अक्टूबर 60481 है 569384 है
नवम्बर 62356 है 573764 है
दिसंबर 63246 है 582746

डेटा टैब के तहत डेटा विश्लेषण पर क्लिक करें, और यह आपके लिए डेटा विश्लेषण पॉप अप खोलेगा।

अब सूची से प्रतिगमन का चयन करें और ओके पर क्लिक करें।

प्रतिगमन पॉप अप खुल जाएगा।

Y- अक्ष बॉक्स में बिक्री $ C $ 1: $ C $ 13 की रेंज का चयन करें क्योंकि यह आश्रित चर है और X-धुरी में $ B $ 1: $ B $ 14 है क्योंकि विज्ञापन में खर्च किया जाने वाला स्वतंत्र चर है।

लेबल बॉक्स पर चेकमार्क यदि आपने हेडर को डेटा में चुना है तो यह आपको त्रुटि देगा।

आउटपुट रेंज का चयन करें यदि आप वर्कशीट पर विशिष्ट रेंज पर मान प्राप्त करना चाहते हैं तो नई वर्कशीट प्लाई का चयन करें: और यह एक नई वर्कशीट जोड़ देगा और आपको परिणाम देगा।

फिर रेजीड्यूल्स बॉक्स पर चेक करें और ओके पर क्लिक करें।

यह कार्यपत्रक जोड़ देगा और आपको निम्न परिणाम देगा।

चलिए आउटपुट को समझते हैं।

सारांश आउटपुट

एकाधिक आर: यह सहसंबंध गुणांक का प्रतिनिधित्व करता है। मान 1 एक सकारात्मक संबंध दिखाता है, और मान 0 कोई संबंध नहीं दिखाता है।

आर स्क्वायर: आर स्क्वायर निर्धारण के गुणांक का प्रतिनिधित्व करता है। यह बताता है कि प्रतिगमन रेखा पर बिंदुओं का प्रतिशत गिरता है। 0.49 का अर्थ है कि 49% मूल्य मॉडल के अनुकूल हैं

समायोजित आर वर्ग : यह आर वर्ग समायोजित किया जाता है, जिसकी आवश्यकता तब होती है जब आपके पास एक से अधिक एक्स चर होते हैं।

मानक त्रुटि: यह त्रुटि के मानक विचलन का अनुमान दर्शाता है। यह वह शुद्धता है जिसे प्रतिगमन गुणांक मापा जाता है।

अवलोकन: यह उन टिप्पणियों की संख्या है जो आपने नमूने में ली हैं।

एनोवा - डीएफ: स्वतंत्रता की डिग्री

एसएस: चौकों का योग।

MS: हमारे पास दो MS हैं

  • प्रतिगमन एमएस प्रतिगमन एसएस / प्रतिगमन डीएफ है।
  • अवशिष्ट एमएस औसत चुकता त्रुटि (अवशिष्ट एसएस / अवशिष्ट डीएफ) है।

एफ: शून्य परिकल्पना के लिए एफ परीक्षण।

महत्व F: P- मान महत्व के साथ जुड़ा हुआ है

गुणांक: गुणांक आपको कम से कम वर्गों का अनुमान देता है।

टी स्टेटिस्टिक: टी स्टेटिस्टिक फॉर नेल परिकल्पना बनाम वैकल्पिक परिकल्पना।

पी-मूल्य: यह परिकल्पना परीक्षण के लिए पी-मूल्य है।

निचला 95% और ऊपरी 95%: ये निचली सीमा और विश्वास अंतराल के लिए ऊपरी सीमा हैं

अवशिष्ट आउटपुट: हमारे पास डेटा के आधार पर 12 अवलोकन हैं। 2 एन डी कॉलम अनुमानित बिक्री और 3 आरडी कॉलम अवशिष्ट का प्रतिनिधित्व करता है । अवशिष्ट मूल रूप से वास्तविक एक से अनुमानित बिक्री में अंतर हैं।

उदाहरण # 2

अनुमानित बिक्री और विपणन कॉलम का चयन करें

सम्मिलित टैब के तहत चार्ट समूह पर जाएं। तितर बितर चार्ट आइकन का चयन करें

यह एक्सेल में स्कैटर प्लॉट डालेगा। नीचे देखें इमेज

किसी भी बिंदु पर राइट-क्लिक करें फिर एक्सेल में Add Trendline चुनें यह आपके चार्ट में एक ट्रेंडलाइन जोड़ देगा।

  • आप ट्रेंडलाइन पर कहीं भी राइट-क्लिक करके ट्रेंडलाइन को प्रारूपित कर सकते हैं और फिर प्रारूप ट्रेंडलाइन का चयन कर सकते हैं।
  • आप चार्ट में और सुधार कर सकते हैं। यानी, ट्रेंडलाइन, रंग और परिवर्तन शीर्षक, आदि का प्रारूपण
  • आप चार्ट पर प्रदर्शन सूत्र में जाँच करके ग्राफ़ पर सूत्र भी दिखा सकते हैं, और चार्ट पर R चुकता मान प्रदर्शित कर सकते हैं।

रैखिक प्रतिगमन विश्लेषण के कुछ और उदाहरण:

  1. बारिश के आधार पर बेचे गए छाता की भविष्यवाणी एरिया में हुई।
  2. समर में टेम्परेचर के आधार पर बिकने वाली एसी की भविष्यवाणी।
  3. परीक्षा के मौसम के दौरान, स्टेशनरी की बिक्री मूल रूप से, परीक्षा गाइड की बिक्री में वृद्धि हुई।
  4. बिक्री की भविष्यवाणी जब विज्ञापन उच्च टीआरपी धारावाहिक पर आधारित होता है जहां एक विज्ञापन किया जाता है, ब्रांड एंबेसडर की लोकप्रियता, और एक विज्ञापन प्रकाशित होने के स्थान पर फुटफॉल।
  5. इलाके, क्षेत्र और कीमत के आधार पर एक घर की बिक्री।

उदाहरण # 3

मान लीजिए कि हमारे पास अपने IQ स्तर के साथ नौ छात्र हैं और उन्होंने टेस्ट में जो अंक प्राप्त किए हैं।

छात्र परीक्षा अंक बुद्धि
राम 100 145
श्याम 97 140
कुल 93 130
कप्पू 91 125
राजू 89. है 115
विशाल 86. है 110 है
विवेक .२ 100
विनय 78 95. है
कुमार .५ 90

चरण 1: सबसे पहले, आश्रित और स्वतंत्र चर का पता लगाएं। यहां टेस्ट स्कोर आश्रित चर है, और आईक्यू स्वतंत्र चर है क्योंकि टेस्ट स्कोर अलग-अलग होता है क्योंकि आईक्यू परिवर्तन होता है।

चरण 2: डेटा टैब पर जाएं - डेटा विश्लेषण पर क्लिक करें - चयन प्रतिगमन - ठीक क्लिक करें।

यह आपके लिए रिग्रेशन विंडो खोलेगा।

चरण 3. इनपुट वाई रेंज बॉक्स और इनपुट एक्स रेंज बॉक्स में आईक्यू टेस्ट स्कोर रेंज। (यदि आपके डेटा रेंज में हेडर हैं तो लेबल पर जाँच करें। आउटपुट विकल्पों का चयन करें, फिर वांछित अवशिष्ट पर जाँच करें। ओके पर क्लिक करें।

आपको नीचे दिए गए Image में सारांश आउटपुट दिखाई देगा।

चरण 4: सारांश आउटपुट द्वारा प्रतिगमन का विश्लेषण

सारांश आउटपुट

मल्टीपल आर: यहां, सहसंबंध गुणांक 0.99 है, जो 1 के बहुत निकट है, जिसका अर्थ है कि रैखिक संबंध बहुत सकारात्मक है।

आर स्क्वायर: आर स्क्वायर वैल्यू 0.983 है, जिसका अर्थ है कि 98.3% मूल्य मॉडल को फिट करते हैं।

P-value: यहाँ, P-value 1.86881E-07 है, जो कि .1 से बहुत कम है, जिसका अर्थ है कि IQ में महत्वपूर्ण भविष्य कहनेवाला मूल्य हैं।

नीचे दिया गया चार्ट देखें।

आप देख सकते हैं कि लगभग सभी बिंदु इनलाइन या नजदीकी ट्रेंडलाइन में गिर रहे हैं।

उदाहरण # 4

हमें एक अलग महीने के लिए बिक्री और तापमान के आधार पर एसी की बिक्री की भविष्यवाणी करने की आवश्यकता है।

महीना अस्थायी बिक्री
जन २५ 38893 है
फ़रवरी २। 42254 है
मार ३१ 42845 है
अप्रैल ३३ ४। ९ १17
मे ३। 51243
जून ४० 69588 है
जुल ३। 56570 है
अगस्त ३। 50000 रु

प्रतिगमन परिणाम प्राप्त करने के लिए नीचे दिए गए चरणों का पालन करें।

चरण 1: सबसे पहले, आश्रित और स्वतंत्र चर का पता लगाएं। यहाँ सेल्स डिपेंडेंट वेरिएबल है, और टेम्परेचर एक स्वतंत्र वेरिएबल है क्योंकि सेल्स में बदलाव हो रहा है क्योंकि टेम्प में बदलाव होता है।

चरण 2: डेटा टैब पर जाएं - डेटा विश्लेषण पर क्लिक करें - चयन प्रतिगमन - ठीक क्लिक करें।

यह आपके लिए रिग्रेशन विंडो खोलेगा।

चरण 3. इनपुट वाई रेंज बॉक्स में इनपुट बिक्री और इनपुट एक्स रेंज बॉक्स में अस्थायी। (यदि आपके डेटा रेंज में हेडर हैं तो लेबल पर जाँच करें। आउटपुट विकल्पों का चयन करें, फिर वांछित अवशिष्ट पर जाँच करें। ओके पर क्लिक करें।

यह आपको नीचे के रूप में एक सारांश आउटपुट देगा।

चरण 4: परिणाम का विश्लेषण करें।

मल्टीपल आर: यहां, सहसंबंध गुणांक 0.877 है, जो कि 1 के पास है, जिसका अर्थ है कि रैखिक संबंध सकारात्मक है।

आर स्क्वायर: आर स्क्वायर वैल्यू 0.770 है, जिसका अर्थ है कि 77% मूल्य मॉडल को फिट करते हैं

P-Value: यहाँ, P-value 1.86881E-07 है, जो कि .1 से बहुत कम है, जिसका अर्थ है कि IQ में महत्वपूर्ण भविष्य कहनेवाला मूल्य हैं।

उदाहरण # 5

अब हम कई स्वतंत्र चर के लिए एक प्रतिगमन विश्लेषण करते हैं:

आपको एक मोबाइल की बिक्री की भविष्यवाणी करने की आवश्यकता है जो अगले साल लॉन्च होने जा रही है। आपके पास उन देशों की कीमत और जनसंख्या है जो मोबाइल की बिक्री को प्रभावित कर रहे हैं।

मोबाइल वर्शन बिक्री मात्रा आबादी
यू.एस. 63860 है 858 823
ब्रिटेन 61841 है 877 है 660 है
केजेड 60876 है 873 631
सीएच 58188 726 है 842 है
एच। एन ५२28२28 864 है 573
एयू 52388 है 680 है 809 है
एनजेड 51075 है 728 661 है
आर यू 49019 है 689 778

प्रतिगमन परिणाम प्राप्त करने के लिए नीचे दिए गए चरणों का पालन करें।

चरण 1. सबसे पहले, आश्रित और स्वतंत्र चर का पता लगाएं। यहां बिक्री निर्भर चर और मात्रा और जनसंख्या है। दोनों स्वतंत्र चर हैं क्योंकि बिक्री देश की मात्रा और जनसंख्या के साथ भिन्न है।

चरण 2. डेटा टैब पर जाएं - डेटा विश्लेषण पर क्लिक करें - प्रतिगमन का चयन करें - ठीक क्लिक करें।

यह आपके लिए रिग्रेशन विंडो खोलेगा।

चरण 3. इनपुट वाई रेंज बॉक्स में इनपुट बिक्री और इनपुट एक्स रेंज बॉक्स में मात्रा और जनसंख्या का चयन करें। (यदि आपके डेटा रेंज में हेडर हैं तो लेबल पर जाँच करें। आउटपुट विकल्पों का चयन करें, फिर वांछित अवशिष्ट पर जाँच करें। ओके पर क्लिक करें।

अब डेटा टैब के तहत डेटा विश्लेषण का उपयोग करके प्रतिगमन चलाएँ। यह आपको नीचे परिणाम देगा।

सारांश आउटपुट

मल्टीपल आर: यहां, सहसंबंध गुणांक 0.93 है, जो 1 के बहुत निकट है, जिसका अर्थ है कि रैखिक संबंध बहुत सकारात्मक है।

आर स्क्वायर: आर स्क्वायर मान 0.866 है, जिसका अर्थ है कि 86.7% मूल्य मॉडल को फिट करते हैं।

महत्व एफ: सिग्नेचर एफ 1 से कम है, जिसका अर्थ है कि प्रतिगमन समीकरण में महत्वपूर्ण पूर्वानुमान मूल्य है।

पी-मूल्य : यदि आप मात्रा और जनसंख्या के लिए पी-मूल्य को देखते हैं, तो आप देख सकते हैं कि मान 1 से कम हैं, जिसका अर्थ है कि मात्रा और जनसंख्या का महत्वपूर्ण पूर्वानुमान मूल्य है। कम पी मूल्यों का मतलब है कि एक चर में अधिक महत्वपूर्ण भविष्य कहनेवाला मूल्य हैं।

हालांकि, मात्रा और जनसंख्या दोनों में महत्वपूर्ण भविष्य कहनेवाला मूल्य है, लेकिन यदि आप मात्रा और जनसंख्या के लिए पी-मूल्य देखते हैं, तो आप देख सकते हैं कि मात्रा का जनसंख्या की तुलना में एक्सेल में कम पी-मूल्य है। इसका मतलब है कि जनसंख्या की तुलना में मात्रा का अधिक महत्वपूर्ण पूर्वानुमान है।

याद रखने वाली चीज़ें

  • जब भी आप किसी डेटा का चयन कर रहे हों, हमेशा डिपेंडेंट और इंडिपेंडेंट वेरिएबल्स की जांच करें।
  • रैखिक प्रतिगमन विश्लेषण चर के माध्य के बीच संबंध को मानता है।
  • यह केवल उन वैरिएबल के बीच संबंध को मॉडल करता है जो रैखिक होते हैं
  • कभी-कभी यह वास्तविक दुनिया की समस्या के लिए सबसे उपयुक्त नहीं है। उदाहरण के लिए: (आयु और मजदूरी)। अधिकांश समय, वेतन में वृद्धि आयु के रूप में बढ़ रही है। हालांकि, सेवानिवृत्ति के बाद, आयु बढ़ जाती है लेकिन मजदूरी कम हो जाती है।

दिलचस्प लेख...