جب آپ نے اپنے نظام یا عمل پر ڈیٹا جمع کیا ہے، تو اگلے مرحلے کا تعین کرنا ہے کہ کس قسم کی ممکنہ تقسیم کی ہے. امکانات کی تقسیم کی اقسام یہ ہیں کہ: ڈھوک یونیفارم، برونولی، بنومیل، منفی بینومیل، Poisson، جیومیٹک، مسلسل وردی، عام (گھنٹی وکر)، گونج، گاما اور بیٹا کی تقسیم. امکانات کی فہرست میں سے کچھ بھی کم کرنا اس بات کا تعین کرتا ہے کہ قریبی R squared قدر زیادہ سے زیادہ تیزی سے ہے.
آپ کی ضرورت ہو گی
-
گرافنگ سافٹ ویئر
-
R squared value (بہترین فٹ تجزیہ) کا حساب کرنے کا مطلب
اعداد و شمار کی قسم کے بصری نمائندگی کے لئے اعداد و شمار کو پلاٹ کریں.
اعداد و شمار کی تقسیم میں سے ایک کا تعین کرنے کے پہلے مرحلے میں سے ایک - اور اس طرح ڈیٹا کے ماڈل کو استعمال کرنے کے لئے مساوات کی قسم - حکمرانی کرنا ہے کہ یہ کیا نہیں ہوسکتا ہے. • اگر اعداد و شمار سیٹ میں کوئی چوٹی موجود ہے، تو یہ متفقہ وردی تقسیم نہیں ہوسکتی. • اگر اعداد و شمار ایک سے زائد چوٹی سے زیادہ ہے، تو یہ Poisson یا binomial نہیں ہے. • اگر یہ ایک واحد وکر ہے، کوئی سیکنڈری چوٹی، اور ہر طرف ایک سست ڈھال ہے، تو یہ شاید Poisson یا ایک گاما تقسیم ہو. لیکن یہ غیر متفق وردی تقسیم نہیں ہوسکتی. • اگر اعداد و شمار کو تقسیم کیا جاتا ہے تو، اور یہ ایک طرف بغیر کسی خالی جگہ کے بغیر ہے، یہ ایک گاما یا ویبول تقسیم کو مستحکم کرنے کے لئے محفوظ ہے. • اگر فعل ایک بھی تقسیم یا انگور کے نتائج کے وسط میں ایک چوٹی ہے، یہ ایک جامد درجہ یا تقسیم کی تقسیم نہیں ہے. • اگر ایک عنصر کا واقعہ ماحولیاتی متغیر سے مختلف ہوتا ہے، تو شاید شاید وہ پوسن کی تقسیم نہیں ہے.
احتساب کی تقسیم کی قسم کو محدود کرنے کے بعد، ممکنہ تقسیم کے ہر ممکن قسم کی ایک R squared تجزیہ کرتے ہیں. سب سے زیادہ R squared قدر کے ساتھ سب سے زیادہ امکان درست ہے.
ایک آؤٹ ڈوم ڈیٹا پوائنٹ کو ختم کردیں. اس کے بعد R squared دوبارہ کریں. اگر ممکنہ طور پر تقسیم کی نوعیت کی نوعیت قریبی میچ کے طور پر آتا ہے، تو وہاں ایک اعلی اعتماد موجود ہے کہ یہ اعداد و شمار سیٹ کے لئے استعمال کرنے کے لئے یہ صحیح امکانات کی تقسیم ہے.
تجاویز
-
اگر اعداد و شمار ایک سے زیادہ چوٹیوں کو ایک وسیع سکریٹر سے پتہ چلتا ہے تو، یہ ممکن ہے کہ دو الگ الگ عمل چل رہے ہیں یا نمونہ ہونے والی مصنوعات کو مخلوط کیا جائے. اعداد و شمار کو دوبارہ منتخب کریں اور پھر دوبارہ تجزیہ کریں.
انتباہ
بعد میں اعداد و شمار سیٹ کے خلاف پیدا مساوات کی توثیق کرنے کی تصدیق کریں کہ یہ اب بھی اعداد و شمار سیٹ کے لئے درست ہے. یہ ممکن ہے کہ ماحولیاتی عوامل اور عمل بڑھانے میں موجودہ مساوات اور ماڈل غلط ہیں.