شمارش در همه جا وجود دارد، بنابراین بدون توجه به پیشینه شما، این توزیع داده ها مفید خواهند بود. توزیع داده ها به ما می گوید که مقادیر ممکن یک متغیر چیست و این مقادیر هر چند وقت یکبار رخ می دهند. هنگام کار با داده های شمارش، توزیع پواسون معمولاً نقطه شروع است. اگر واریانس داده های شما بالاتر از میانگین باشد، رگرسیون داده های شمارش با توزیع دوجمله ای منفی یک گزینه عالی است. در این مورد، برای ثبت پراکندگی داده ها به پارامتر دیگری نیاز دارید. اگر انتظار صفرهای زیادی دارید، توزیع صفر تورم را امتحان کنید.
نیکولا او.
ایده هایی از علوم داده، علوم انسانی و علوم اجتماعی را ترکیب می کند. از تفکر، علمی تخیلی و طراحی لذت می برد.
در سه ماهه آینده چند گوشی فروخته می شود؟ چند نفر در ماه آینده به آنفولانزا مبتلا می شوند؟ CPU چند بار خرد می شود؟ رگرسیون داده های شمارش می تواند به ما در پاسخ به این سوالات کمک کند. شمارش در همه جا وجود دارد، بنابراین بدون توجه به پیشینه شما، این توزیع داده ها مفید خواهند بود.
توزیع داده ها چیست؟
توزیع داده ها به ما می گوید که مقادیر ممکن یک متغیر چیست و این مقادیر هر چند وقت یکبار رخ می دهند. ما میتوانیم هر چیزی را از قد یک فرد گرفته تا نمرات IQ بگیریم و ببینیم همه مقادیر ممکن چقدر تکرار میشوند. نمرات قد و ضریب هوشی نمونه ای عالی از توزیع به اصطلاح نرمال است…