توزیع داده چیست؟

توزیع داده لیستی از تمام مقادیر و تعداد تکرار هرکدام است.

چنین لیست هایی برای وققت هایی که ما با آمار و علم داده کار میکنیم بسیار مهم هستند.

توزیع تصادفی

توضیع داده از مجموعه ایی از داده های تصادفی در لیست استفاده میکنئد اما همانظور که گفتیم چیزی به عنوان کاملا تصادفی بدون الکو نداریم و در اینجا لیست ما از یک تابع چگالی پیروی میکند.

 

نکته: تابع چگالی تابعی است که مشخص میکند هر داده چند درصد احتمال برای آمدن در لیست اعمال شود.

 

درسته است که  مقدار دقیق داده ها را نمیتوانیم مشخص کنیم اما شکل پراکندگی داده هارا میشود با تابع چگالی پیشبینی کنیم.

برای مثال ما در normal distrbution بیشتر داده ها حول میانگین جمع میشوند و هرچه مقدار داده از میانگین دورتر شود احتمال رخداد ان کمتر میشود.

ما میتونم با کمک ماژول random و متد ()choice یک لیست از داده ها و احتمال هرکدام ایجاد کنیم و با کمک این متد یک آرایه تصادفی از داده های این لیست ایجاد کنیم.

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

نکته: مجموع احتمال داده ها نباید بیشتر از 1 شود.

 برای آرایه دو بعدی در متغیر size میتوانید تعداد ردیف های آرایه وتعداد المان درون هر ردیف  را مشخص کنیم.

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

خلاصه درس

تمرین


مشاهده پاسخ
توسعه دهندگان
ارسلان میرزایی