در این مطلب، ویدئو پایتون برای تجزیه و تحلیل داده ها: توزیع های احتمال با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:32:46
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,080 –> 00:00:03,360
سلام به همه
2
00:00:03,360 –> 00:00:05,040
در این درس، ما قصد داریم در
3
00:00:05,040 –> 00:00:07,440
مورد توزیع های احتمال
4
00:00:07,440 –> 00:00:09,200
و نحوه کار با
5
00:00:09,200 –> 00:00:12,080
توزیع های احتمال مختلف در پایتون بیاموزیم،
6
00:00:12,080 –> 00:00:14,080
اکنون بسیاری از ابزارها و
7
00:00:14,080 –> 00:00:16,800
تکنیک های آماری مورد استفاده در تجزیه و تحلیل داده
8
00:00:16,800 –> 00:00:19,920
ها بر اساس
9
00:00:19,920 –> 00:00:22,160
اندازه گیری های احتمال احتمالی هستند که چقدر احتمال وقوع یک رویداد
10
00:00:22,160 –> 00:00:23,039
11
00:00:23,039 –> 00:00:25,760
در آن وجود دارد. مقیاسی از صفر که به این معنی است که
12
00:00:25,760 –> 00:00:27,199
رویداد هرگز به یک رخ نمی دهد،
13
00:00:27,199 –> 00:00:29,519
به این معنی که رویداد همیشه
14
00:00:29,519 –> 00:00:30,400
15
00:00:30,400 –> 00:00:32,800
هنگام کار با متغیرهای داده در
16
00:00:32,800 –> 00:00:33,520
ستون ها رخ می دهد،
17
00:00:33,520 –> 00:00:36,079
می توان به عنوان متغیرهای تصادفی در نظر گرفت
18
00:00:36,079 –> 00:00:38,079
که متغیرهایی هستند که به دلیل
19
00:00:38,079 –> 00:00:38,960
شانس تغییر می کنند،
20
00:00:38,960 –> 00:00:42,079
یک توزیع احتمال توضیح می دهد که
21
00:00:42,079 –> 00:00:44,879
یک متغیر تصادفی چگونه است. به معنای توزیع شده
22
00:00:44,879 –> 00:00:45,680
به ما می گوید
23
00:00:45,680 –> 00:00:48,480
که یک متغیر تصادفی به
24
00:00:48,480 –> 00:00:49,840
احتمال زیاد
25
00:00:49,840 –> 00:00:52,399
کدام مقادیر را می گیرد و کدام مقادیر در آمار کمتر محتمل است
26
00:00:52,399 –> 00:00:54,399
، طیفی از
27
00:00:54,399 –> 00:00:55,840
28
00:00:55,840 –> 00:00:58,000
توزیع های احتمال دقیقاً تعریف شده وجود دارد که
29
00:00:58,000 –> 00:01:00,000
اشکال مختلفی دارند و می توان از آنها برای
30
00:01:00,000 –> 00:01:00,719
مدل سازی
31
00:01:00,719 –> 00:01:03,039
انواع مختلف رویدادهای تصادفی استفاده کرد. در
32
00:01:03,039 –> 00:01:04,640
این درس قصد داریم در مورد برخی
33
00:01:04,640 –> 00:01:05,280
از
34
00:01:05,280 –> 00:01:07,760
توزیعهای احتمال رایجتر بحث کنیم یون ها
35
00:01:07,760 –> 00:01:09,840
و نحوه کار با آنها در پایتون
36
00:01:09,840 –> 00:01:11,520
برای شروع ما به توزیع یکنواخت نگاه می کنیم.
37
00:01:11,520 –> 00:01:13,040
38
00:01:13,040 –> 00:01:15,040
توزیع یکنواخت یک
39
00:01:15,040 –> 00:01:16,880
توزیع احتمال است که در آن
40
00:01:16,880 –> 00:01:19,280
هر مقدار در یک محدوده خاص به یک
41
00:01:19,280 –> 00:01:21,439
اندازه احتمال دارد رخ دهد
42
00:01:21,439 –> 00:01:23,920
و مقادیر خارج از محدوده هرگز
43
00:01:23,920 –> 00:01:24,960
رخ نمی دهد
44
00:01:24,960 –> 00:01:26,960
اگر ما یک نمودار چگالی از
45
00:01:26,960 –> 00:01:28,320
توزیع یکنواخت ایجاد
46
00:01:28,320 –> 00:01:30,960
می کنیم، به نظر می رسد مسطح است، زیرا هیچ مقداری
47
00:01:30,960 –> 00:01:32,560
محتمل تر از مقدار دیگری
48
00:01:32,560 –> 00:01:34,720
نیست، بنابراین چگالی در هر نقطه از
49
00:01:34,720 –> 00:01:36,640
توزیع یکسان است،
50
00:01:36,640 –> 00:01:38,560
اکنون بسیاری از توابع برای کار
51
00:01:38,560 –> 00:01:41,119
با توزیع های احتمال در پایتون
52
00:01:41,119 –> 00:01:45,119
در scipy موجود است. کتابخانه .stats
53
00:01:45,119 –> 00:01:46,960
بنابراین برای شروع، ما فقط
54
00:01:46,960 –> 00:01:49,360
در برخی از بستههای ضروری
55
00:01:49,360 –> 00:01:51,840
برای این درس بارگذاری میکنیم تا نشان
56
00:01:51,840 –> 00:01:53,920
دهیم توزیع یکنواخت چگونه به نظر میرسد،
57
00:01:53,920 –> 00:01:56,240
با تولید 10000
58
00:01:56,240 –> 00:01:57,040
59
00:01:57,040 –> 00:01:59,360
عدد از یک توزیع یکنواخت شروع میکنیم و
60
00:01:59,360 –> 00:02:00,560
سپس آنها را رسم میکنیم.
61
00:02:00,560 –> 00:02:02,880
بنابراین برای تولید برخی داده های تصادفی می توانیم
62
00:02:02,880 –> 00:02:06,000
از stats.uniform استفاده کنیم که می گوید از توزیع یکنواخت استفاده کنید
63
00:02:06,000 –> 00:02:07,520
64
00:02:07,520 –> 00:02:10,080
و rvs نقطه تابعی است که
65
00:02:10,080 –> 00:02:11,440
d تصادفی را تولید می کند. ata،
66
00:02:11,440 –> 00:02:13,520
بنابراین ما می گوییم تولید اعداد تصادفی
67
00:02:13,520 –> 00:02:15,280
از اندازه توزیع یکنواخت
68
00:02:15,280 –> 00:02:17,680
برابر با 10000 است، یعنی ما 10000 عدد
69
00:02:17,680 –> 00:02:18,400
از آنها را می خواهیم
70
00:02:18,400 –> 00:02:21,040
و سپس مقیاس محلی محدوده ای را نشان می دهد
71
00:02:21,040 –> 00:02:22,000
که می خواهیم از کجا
72
00:02:22,000 –> 00:02:23,680
تولید کنیم، بنابراین
73
00:02:23,680 –> 00:02:25,440
در واقع صد هزار عدد تولید می کنیم.
74
00:02:25,440 –> 00:02:28,080
بین صفر تا ده، پس با اجرا شروع کنید
75
00:02:28,080 –> 00:02:29,680
که برای تولید داده ها ممکن است
76
00:02:29,680 –> 00:02:30,720
یک ثانیه طول بکشد زیرا آنها صد
77
00:02:30,720 –> 00:02:31,440
هزار هستند
78
00:02:31,440 –> 00:02:33,440
و سپس ما فقط از نمودار روی آن استفاده می
79
00:02:33,440 –> 00:02:35,599
کنیم تا آن را به یک قاب داده تبدیل کنیم و نوع
80
00:02:35,599 –> 00:02:36,720
نمودار نقطه ای را اجرا
81
00:02:36,720 –> 00:02:38,560
کنیم. برای ایجاد نمودار چگالی برابر است با چگالی،
82
00:02:38,560 –> 00:02:41,040
بنابراین نمودار چگالی حاصل
83
00:02:41,040 –> 00:02:43,280
نشان می دهد که با توزیع یکنواخت
84
00:02:43,280 –> 00:02:45,360
ما اساساً یک توزیع مسطح
85
00:02:45,360 –> 00:02:45,920
در اینجا داریم
86
00:02:45,920 –> 00:02:47,840
که در آن هر مقدار در محدوده ای
87
00:02:47,840 –> 00:02:50,400
که از 0 تا 10 مشخص کرده ایم به همان اندازه
88
00:02:50,400 –> 00:02:51,200
احتمال دارد که
89
00:02:51,200 –> 00:02:54,080
اکنون بسته scipy.stats با آن همراه باشد.
90
00:02:54,080 –> 00:02:55,519
برخی از توابع مفید
91
00:02:55,519 –> 00:02:56,800
برای کار با توزیعهای احتمال،
92
00:02:56,800 –> 00:02:58,959
ما قبلاً به یکی
93
00:02:58,959 –> 00:02:59,519
از آنها نگاه
94
00:02:59,519 –> 00:03:02,800
کردیم، تابع نقطه توزیع.rvs
95
00:03:02,800 –> 00:03:04,480
است که اعداد تصادفی را از
96
00:03:04,480 –> 00:03:05,920
توزیع مشخص شده تولید میکند
97
00:03:05,920 –> 00:03:07,840
تا از آن استفاده کنیم. قبلاً دیدیم که شما می گویید
98
00:03:07,840 –> 00:03:09,760
stats dot و سپس نام
99
00:03:09,760 –> 00:03:11,200
توزیعی که با
100
00:03:11,200 –> 00:03:13,440
آن کار می کنید، ما از یونیفرم استفاده می کردیم، بنابراین ما یکنواخت نقطه را در آنجا قرار دادیم
101
00:03:13,440 –> 00:03:14,560
، اما
102
00:03:14,560 –> 00:03:16,319
شما می توانید نام های توزیع دیگر را
103
00:03:16,319 –> 00:03:17,840
نیز در آنجا قرار دهید و سپس dot
104
00:03:17,840 –> 00:03:19,760
rvs و
105
00:03:19,760 –> 00:03:22,080
اعداد تصادفی از توزیع مشخص شده
106
00:03:22,080 –> 00:03:24,080
آرگومان های مربوط به آن به توزیعی که با آن کار می کنید بستگی دارد،
107
00:03:24,080 –> 00:03:25,680
108
00:03:25,680 –> 00:03:28,080
بنابراین برای لباس یک
109
00:03:28,080 –> 00:03:29,360
نقطه شروع و پایان را مشخص کردیم
110
00:03:29,360 –> 00:03:31,120
توزیع های دیگر آرگومان های متفاوتی خواهند داشت
111
00:03:31,120 –> 00:03:32,560
و بعداً به برخی از
112
00:03:32,560 –> 00:03:33,360
آنها خواهیم پرداخت،
113
00:03:33,360 –> 00:03:34,879
اما این چیزی است که شما می خواهید استفاده برای
114
00:03:34,879 –> 00:03:36,640
تولید اعداد تصادفی از
115
00:03:36,640 –> 00:03:40,280
یک توزیع داده شده، stats.distribution.cdf نیز وجود دارد،
116
00:03:40,280 –> 00:03:41,680
117
00:03:41,680 –> 00:03:44,560
تابع توزیع تجمعی یا cdf
118
00:03:44,560 –> 00:03:45,519
119
00:03:45,519 –> 00:03:48,640
برای یافتن احتمال اینکه یک
120
00:03:48,640 –> 00:03:49,760
مشاهدات
121
00:03:49,760 –> 00:03:52,319
گرفته شده از توزیع زیر
122
00:03:52,319 –> 00:03:54,000
یک مقدار مشخص قرار می گیرد، استفاده می شود،
123
00:03:54,000 –> 00:03:57,040
بنابراین اساساً cdf مساحت زیر را به شما می دهد.
124
00:03:57,040 –> 00:03:59,840
منحنی چگالی توزیع
125
00:03:59,840 –> 00:04:01,280
تا یک مقدار معین
126
00:04:01,280 –> 00:04:03,360
در محور x به عنوان مثال با
127
00:04:03,360 –> 00:04:05,519
توزیع یکنواختی که در بالا ایجاد کردیم، عدد
128
00:04:05,519 –> 00:04:08,000
2 خواهد بود. به احتمال 5 درصد
129
00:04:08,000 –> 00:04:09,760
که مشاهده ای بین
130
00:04:09,760 –> 00:04:10,640
محدوده 0
131
00:04:10,640 –> 00:04:14,159
تا 2.5 و احتمال 75
132
00:04:14,159 –> 00:04:16,238
بین دامنه 2.5 و 10 قرار می گیرد
133
00:04:16,238 –> 00:04:17,918
به دلیل نحوه ساخت
134
00:04:17,918 –> 00:04:20,560
توزیع در محدوده 0 تا 10 است
135
00:04:20,560 –> 00:04:22,720
و می توانیم تعیین کنیم که با استفاده از
136
00:04:22,720 –> 00:04:24,800
تابع cdf نقطه، بنابراین ما فقط یک
137
00:04:24,800 –> 00:04:26,080
مثال از استفاده را نشان می
138
00:04:26,080 –> 00:04:29,840
دهیم که می گوییم stats.uniform برای تابع توزیع تجمعی
139
00:04:29,840 –> 00:04:31,360
140
00:04:31,360 –> 00:04:32,800
، می گوییم می خواهیم
141
00:04:32,800 –> 00:04:35,199
چگالی تجمعی را تا مقدار
142
00:04:35,199 –> 00:04:37,840
x برابر با 2.5 بررسی کنیم و سپس ما از همان
143
00:04:37,840 –> 00:04:40,160
مقادیر برش 0 و 10 استفاده می کنیم که قبلاً استفاده می کردیم
144
00:04:40,160 –> 00:04:40,880
145
00:04:40,880 –> 00:04:42,479
و وقتی این را اجرا می کنیم می بینیم که
146
00:04:42,479 –> 00:04:43,919
25
147
00:04:43,919 –> 00:04:46,960
شانس وجود دارد که یک مقدار با این توزیع به زیر 2.5
148
00:04:46,960 –> 00:04:48,720
149
00:04:48,720 –> 00:04:52,400
بیفتد اکنون تابع stats.distribution.ppf
150
00:04:52,400 –> 00:04:55,199
اساساً معکوس است. تابع cdf
151
00:04:55,199 –> 00:04:56,080
152
00:04:56,080 –> 00:04:58,880
مقدار قطع محور x
153
00:04:58,880 –> 00:05:00,240
یا چندک
154
00:05:00,240 –> 00:05:02,960
مربوط به یک احتمال معین را برمی گرداند، برای
155
00:05:02,960 –> 00:05:04,639
مثال اگر بخواهیم
156
00:05:04,639 –> 00:05:07,680
مقدار برش را بدانیم، مقدار محور x را
157
00:05:07,680 –> 00:05:10,000
که برای آن 40 درصد شانس داریم
158
00:05:10,000 –> 00:05:12,400
که مشاهده ای زیر آن مقدار ترسیم کنیم.
159
00:05:12,400 –> 00:05:15,039
ما شرکت می کنیم دریابید که با استفاده از ppf، پس
160
00:05:15,039 –> 00:05:16,479
مثالی برای انجام
161
00:05:16,479 –> 00:05:18,960
دوباره آن می زنیم، این
162
00:05:18,960 –> 00:05:20,720
تابع time.ppf stats.uniform را انجام
163
00:05:20,720 –> 00:05:23,039
می دهیم، مقیاس locan یکسان خواهد بود و
164
00:05:23,039 –> 00:05:24,080
در اینجا
165
00:05:24,080 –> 00:05:27,120
یک کمیت 0.4
166
00:05:27,120 –> 00:05:29,280
را بررسی می کنیم، بنابراین ما. دوباره درخواست می کنیم، بنابراین در اینجا اساساً می
167
00:05:29,280 –> 00:05:31,759
پرسیم که چه مقدار محور x را
168
00:05:31,759 –> 00:05:32,960
باید تنظیم کنیم
169
00:05:32,960 –> 00:05:35,759
تا 40 درصد از
170
00:05:35,759 –> 00:05:36,639
توزیع
171
00:05:36,639 –> 00:05:38,960
را در سمت چپ آن برش دهیم، بنابراین وقتی این را اجرا می کنیم می
172
00:05:38,960 –> 00:05:41,199
بینیم که مقدار محور x در این
173
00:05:41,199 –> 00:05:42,639
مورد 4.0 است.
174
00:05:42,639 –> 00:05:44,880
زیرا ما یک یکنواخت در
175
00:05:44,880 –> 00:05:46,320
محدوده 0 تا 10 ایجاد کردیم.
176
00:05:46,320 –> 00:05:50,000
در نهایت تابع
177
00:05:50,000 –> 00:05:50,880
178
00:05:50,880 –> 00:05:53,840
stats.distribution.pdf چگالی احتمال واقعی را به شما می دهد
179
00:05:53,840 –> 00:05:56,080
که ارتفاع توزیع
180
00:05:56,080 –> 00:05:58,479
در هر مقدار x داده شده در حال حاضر است زیرا
181
00:05:58,479 –> 00:06:00,639
توزیع یکنواخت
182
00:06:00,639 –> 00:06:04,000
همه مقادیر x در داخل آن مسطح است. محدوده
183
00:06:04,000 –> 00:06:05,840
توزیع قرار است چگالی احتمال یکسانی داشته
184
00:06:05,840 –> 00:06:07,280
باشد
185
00:06:07,280 –> 00:06:09,440
اما مقادیر x خارج از آن محدوده
186
00:06:09,440 –> 00:06:11,600
چگالی احتمالی 0
187
00:06:11,600 –> 00:06:12,880
خواهند داشت زیرا هرگز اتفاق نمیافتند،
188
00:06:12,880 –> 00:06:14,560
بنابراین برای نشان دادن ما فقط
189
00:06:14,560 –> 00:06:15,919
یک حلقه برای در اینجا ایجاد میکنیم
190
00:06:15,919 –> 00:06:19,120
که از منفی 1 به بالا میرود. 11
191
00:06:19,120 –> 00:06:21,600
و چگالی را در هر یک از t چاپ کنید شیلنگ
192
00:06:21,600 –> 00:06:22,319
193
00:06:22,319 –> 00:06:24,960
مقادیر x متفاوت است و باید ببینیم که منفی
194
00:06:24,960 –> 00:06:25,440
195
00:06:25,440 –> 00:06:27,440
1 هیچ مقداری نخواهد داشت زیرا
196
00:06:27,440 –> 00:06:28,720
خارج از محدوده
197
00:06:28,720 –> 00:06:29,759
توزیع
198
00:06:29,759 –> 00:06:32,560
11 نیز نباید چگالی داشته باشد اما
199
00:06:32,560 –> 00:06:34,319
هر چیزی بین آن محدوده
200
00:06:34,319 –> 00:06:37,039
از 0 تا 10 باید چگالی
201
00:06:37,039 –> 00:06:38,240
0.1
202
00:06:38,240 –> 00:06:40,880
داشته باشد. ما این را اجرا می کنیم و می بینیم که مقادیر
203
00:06:40,880 –> 00:06:42,000
خارج از
204
00:06:42,000 –> 00:06:43,919
محدوده اصلاً چگالی ندارند،
205
00:06:43,919 –> 00:06:45,360
206
00:06:45,360 –> 00:06:47,360
وقتی روی توزیع یکنواختی هستیم
207
00:06:47,360 –> 00:06:48,880
که فقط از 0 تا 10 می رود، نمی توانیم مقدار منفی 1 را بدست آوریم.
208
00:06:48,880 –> 00:06:50,880
باز هم نمی توانیم ببینیم 11 اما هر چیزی
209
00:06:50,880 –> 00:06:51,919
در محدوده باشد،
210
00:06:51,919 –> 00:06:53,360
بنابراین برخی از این مقادیر مختلف
211
00:06:53,360 –> 00:06:56,160
همگی چگالی 0.1 یکسانی دارند،
212
00:06:56,160 –> 00:06:58,160
اکنون قبل از اینکه با این
213
00:06:58,160 –> 00:06:59,919
درس به یادگیری توزیعهای احتمال مختلف
214
00:06:59,919 –> 00:07:00,880
215
00:07:00,880 –> 00:07:02,639
ادامه دهیم، یک ثانیه
216
00:07:02,639 –> 00:07:04,880
در مورد تولید اعداد تصادفی به
217
00:07:04,880 –> 00:07:05,440
طور کلی
218
00:07:05,440 –> 00:07:08,160
و تنظیم دانه تصادفی بنابراین زمانی که
219
00:07:08,160 –> 00:07:10,080
نیاز به تولید اعداد تصادفی در یک
220
00:07:10,080 –> 00:07:11,120
محدوده معین
221
00:07:11,120 –> 00:07:13,520
با احتمال زوج دارید، فقط می توانید
222
00:07:13,520 –> 00:07:15,680
اعداد را از توزیع یکنواخت
223
00:07:15,680 –> 00:07:18,639
با استفاده از تابع stats.distribution.rvs که قبلاً دیدیم، بکشید.
224
00:07:18,639 –> 00:07:20,400
225
00:07:20,400 –> 00:07:23,120
پایتون همچنین با کتابخانه ای
226
00:07:23,120 –> 00:07:24,160
به نام تصادفی ارائه می شود
227
00:07:24,160 –> 00:07:26,479
که به شما امکان می دهد عملیات مختلفی را انجام دهید
228
00:07:26,479 –> 00:07:28,160
که شامل تصادفی سازی می شوند،
229
00:07:28,160 –> 00:07:29,520
بنابراین
230
00:07:29,520 –> 00:07:32,880
اگر ماژول تصادفی را وارد
231
00:07:32,880 –> 00:07:35,360
کنیم به چند تابع دسترسی پیدا می کنیم که
232
00:07:35,360 –> 00:07:37,199
233
00:07:37,199 –> 00:07:40,960
اولاً می توانیم از تصادفی استفاده کنیم.
234
00:07:40,960 –> 00:07:43,039
تابع randint برای تولید یک عدد صحیح تصادفی
235
00:07:43,039 –> 00:07:44,720
از یک محدوده مشخص،
236
00:07:44,720 –> 00:07:46,800
بنابراین اگر میخواستیم یک عدد تصادفی
237
00:07:46,800 –> 00:07:48,080
از 0 تا 10 به دست
238
00:07:48,080 –> 00:07:51,039
آوریم، میتوانیم از تصادفی برای انجام این کار استفاده کنیم، بنابراین در
239
00:07:51,039 –> 00:07:52,560
آنجا عدد 6 را تولید کردیم.
240
00:07:52,560 –> 00:07:56,319
همچنین میتوانید از random.choice برای انتخاب
241
00:07:56,319 –> 00:07:58,879
یک عنصر تصادفی از بین استفاده کنید. یک دنباله برای
242
00:07:58,879 –> 00:08:00,400
مثال اگر ما لیستی
243
00:08:00,400 –> 00:08:02,400
از این چهار عدد داشتیم و می
244
00:08:02,400 –> 00:08:03,440
خواستیم یکی از آنها را به
245
00:08:03,440 –> 00:08:06,000
صورت تصادفی انتخاب کنیم، می توانیم از random.choice برای این کار استفاده
246
00:08:06,000 –> 00:08:06,560
کنیم،
247
00:08:06,560 –> 00:08:08,240
بنابراین اگر این را اجرا کنیم باید
248
00:08:08,240 –> 00:08:10,080
خروجی یکی از این چهار عدد را ببینیم.
249
00:08:10,080 –> 00:08:11,680
نمیدانم کدام یک، اما یکی از آنها را دریافت میکنیم
250
00:08:11,680 –> 00:08:12,319
251
00:08:12,319 –> 00:08:14,720
و اگر میخواهید اعداد واقعی تصادفی
252
00:08:14,720 –> 00:08:16,080
در محدوده
253
00:08:16,080 –> 00:08:19,160
صفر تا یک تولید کنید، میتوانید این کار را با
254
00:08:19,160 –> 00:08:20,560
255
00:08:20,560 –> 00:08:22,960
256
00:08:22,960 –> 00:08:25,120
random.random انجام دهید. محدوده صفر
257
00:08:25,120 –> 00:08:25,759
تا یک
258
00:08:25,759 –> 00:08:28,160
را میتوانید به جای آن از random.uniform استفاده کنید تا
259
00:08:28,160 –> 00:08:30,160
این کار اساساً یک عدد از توزیع یکنواخت رسم میکند،
260
00:08:30,160 –> 00:08:31,919
261
00:08:31,919 –> 00:08:34,240
بنابراین میتوانید random.uniform را انجام دهید و سپس
262
00:08:34,240 –> 00:08:35,760
فقط محدوده خود را مشخص کنید،
263
00:08:35,760 –> 00:08:37,519
بنابراین در این مورد به جای ترسیم از
264
00:08:37,519 –> 00:08:39,519
صفر به یک، ما یک عدد
265
00:08:39,519 –> 00:08:40,958
از 0 تا 10 رسم می کنیم.
266
00:08:40,958 –> 00:08:42,519
اکنون توجه کنید که اگر این
267
00:08:42,519 –> 00:08:44,159
تابع تصادفی یکنواخت را
268
00:08:44,159 –> 00:08:46,000
دوباره اجرا کنیم،
269
00:08:46,000 –> 00:08:47,839
خروجی متفاوتی برای عددی
270
00:08:47,839 –> 00:08:50,160
که در اینجا اعداد تصادفی تولید می کنیم دریافت خواهیم کرد، بنابراین
271
00:08:50,160 –> 00:08:51,760
هر بار که آن را اجرا می کنیم، می بینیم چیز
272
00:08:51,760 –> 00:08:52,720
متفاوتی
273
00:08:52,720 –> 00:08:54,880
از یک طرف خوب است زیرا با
274
00:08:54,880 –> 00:08:56,560
یک عدد تصادفی ما باید
275
00:08:56,560 –> 00:08:57,920
هر بار اعداد مختلفی را ببینیم
276
00:08:57,920 –> 00:08:58,959
زیرا تصادفی است
277
00:08:58,959 –> 00:09:00,959
از طرف دیگر
278
00:09:00,959 –> 00:09:02,800
279
00:09:02,800 –> 00:09:05,279
اگر
280
00:09:05,279 –> 00:09:08,080
میخواهید نتایج شما قابل تکرار باشد، اگر میخواهید نتایج شما قابل تکرار باشد، داشتن نتایج از یک اجرا به دیگری متفاوت است.
281
00:09:08,080 –> 00:09:10,320
می توانید با انجام کاری که به عنوان تنظیم دانه تصادفی شناخته می شود،
282
00:09:10,320 –> 00:09:11,760
هر بار
283
00:09:11,760 –> 00:09:13,600
که تابعی را اجرا می کنید که شامل
284
00:09:13,600 –> 00:09:16,160
تصادفی می شود، نتایج شما یکسان است
285
00:09:16,160 –> 00:09:18,000
286
00:09:18,000 –> 00:09:19,839
تا اعداد تولید شده توسط
287
00:09:19,839 –> 00:09:21,920
مولدهای اعداد تصادفی در پایتون و سایر
288
00:09:21,920 –> 00:09:23,279
زبانهای برنامهنویسی
289
00:09:23,279 –> 00:09:25,920
معمولاً واقعاً تصادفی نیستند، آنها
290
00:09:25,920 –> 00:09:27,600
چیزی هستند که به عنوان تصادفی شبه شناخته میشوند،
291
00:09:27,600 –> 00:09:29,279
بنابراین در واقع توسط یک
292
00:09:29,279 –> 00:09:30,800
فرآیند قطعی
293
00:09:30,800 –> 00:09:33,200
در زیر هود ایجاد میشوند که بر اساس یک
294
00:09:33,200 –> 00:09:33,839
295
00:09:33,839 –> 00:09:36,880
حالت شروع اولیه یا seed است و اگر
296
00:09:36,880 –> 00:09:37,600
از همان
297
00:09:37,600 –> 00:09:39,839
حالت اولیه برای اعداد تصادفی استفاده کنید.
298
00:09:39,839 –> 00:09:42,000
مولد دقیقاً همان اعداد را تولید خواهید کرد،
299
00:09:42,000 –> 00:09:43,440
300
00:09:43,440 –> 00:09:45,680
بنابراین با مقداردهی اولیه مولد اعداد تصادفی
301
00:09:45,680 –> 00:09:47,440
302
00:09:47,440 –> 00:09:49,519
به همان چیز قبل از اجرای
303
00:09:49,519 –> 00:09:51,120
تابعی که شامل تصادفی است
304
00:09:51,120 –> 00:09:53,279
، در واقع همان نتیجه
305
00:09:53,279 –> 00:09:54,959
را ایجاد خواهید کرد که اگر
306
00:09:54,959 –> 00:09:55,839
میخواهید توابع شما
307
00:09:55,839 –> 00:09:58,720
کاملاً قابل تکرار باشند، چیز خوبی است. بنابراین ما در اینجا
308
00:09:58,720 –> 00:10:00,959
مثالی از نحوه انجام این کار ارائه می دهیم
309
00:10:00,959 –> 00:10:02,800
تا با بسته تصادفی داخلی پایتون
310
00:10:02,800 –> 00:10:04,079
بتوانید
311
00:10:04,079 –> 00:10:07,360
با استفاده از random.seed، seed را تنظیم کنید، سپس فقط
312
00:10:07,360 –> 00:10:09,519
یک مقدار عددی دلخواه را به
313
00:10:09,519 –> 00:10:10,640
آن تابع ارسال کنید
314
00:10:10,640 –> 00:10:13,360
و اکنون مولد اعداد تصادفی را مقداردهی اولیه کنید.
315
00:10:13,360 –> 00:10:14,399
تا به شما نشان دهیم
316
00:10:14,399 –> 00:10:17,040
که این در واقع مولد اعداد تصادفی را مقداردهی اولیه میکند
317
00:10:17,040 –> 00:10:18,480
و
318
00:10:18,480 –> 00:10:19,519
319
00:10:19,519 –> 00:10:22,160
پس از تنظیم همان دانهای که میخواهیم، همان نتایج را دریافت کن
320
00:10:22,160 –> 00:10:23,279
د. برای تنظیم دانه
321
00:10:23,279 –> 00:10:25,839
با 12. تعدادی اعداد تصادفی تولید می
322
00:10:25,839 –> 00:10:26,720
323
00:10:26,720 –> 00:10:29,360
کنیم، سپس دانه را دوباره به 12 بازنشانی می کنیم
324
00:10:29,360 –> 00:10:31,200
و اعداد را دقیقاً به همان
325
00:10:31,200 –> 00:10:33,040
روش تولید می کنیم و اینها همین نتایج را در اینجا ایجاد می کنند،
326
00:10:33,040 –> 00:10:34,160
327
00:10:34,160 –> 00:10:35,760
بنابراین این را اجرا می کنیم و می بینیم که ما
328
00:10:35,760 –> 00:10:37,360
همان
329
00:10:37,360 –> 00:10:40,160
اعداد تصادفی تصادفی را تولید کرد، حتی اگر
330
00:10:40,160 –> 00:10:42,000
تصادفی نبود، زیرا آنها بر اساس
331
00:10:42,000 –> 00:10:43,200
یک دانه اولیه بودند
332
00:10:43,200 –> 00:10:45,120
و سپس یک فرآیند قطعی
333
00:10:45,120 –> 00:10:46,880
در واقع آنها را ایجاد کرد،
334
00:10:46,880 –> 00:10:48,800
بنابراین به طور کلی این اعداد شبه تصادفی
335
00:10:48,800 –> 00:10:50,880
تولید شده توسط رایانه شما به
336
00:10:50,880 –> 00:10:51,839
اندازه کافی
337
00:10:51,839 –> 00:10:54,480
برای تصادفی بودن برای بیشتر اهداف خوب هستند.
338
00:10:54,480 –> 00:10:56,079
فقط بدانید که در واقعیت
339
00:10:56,079 –> 00:10:58,640
آنها کاملاً تصادفی نیستند زیرا
340
00:10:58,640 –> 00:10:59,360
رایانه
341
00:10:59,360 –> 00:11:02,399
ها در نهایت ماشین های قطعی
342
00:11:02,399 –> 00:11:05,200
هستند آنها قادر به تولید اعداد تصادفی واقعی نیستند،
343
00:11:05,200 –> 00:11:06,320
344
00:11:06,320 –> 00:11:07,920
بنابراین اگر می خواهید اعدادی را
345
00:11:07,920 –> 00:11:09,839
که واقعاً تصادفی هستند تولید
346
00:11:09,839 –> 00:11:12,160
کنید می توانید این کار را با نمونه برداری از
347
00:11:12,160 –> 00:11:14,560
منابع تصادفی واقعی انجام دهید.
348
00:11:14,560 –> 00:11:17,519
یا آنتروپی از محیط، به
349
00:11:17,519 –> 00:11:19,360
عنوان مثال اگر
350
00:11:19,360 –> 00:11:20,480
351
00:11:20,480 –> 00:11:23,519
سنسوری به رایانه خود متصل کرده بودید که نویز تصادفی جو را تشخیص
352
00:11:23,519 –> 00:11:24,240
می داد
353
00:11:24,240 –> 00:11:26,000
و سپس اندازه گیری می کردید. نتایج حاصل از آن
354
00:11:26,000 –> 00:11:27,279
حسگر در طول زمان
355
00:11:27,279 –> 00:11:29,040
که به طور بالقوه می تواند منبع
356
00:11:29,040 –> 00:11:30,800
تصادفی واقعی باشد،
357
00:11:30,800 –> 00:11:33,200
اما برای اکثر اهداف، مولدهای اعداد تصادفی
358
00:11:33,200 –> 00:11:35,040
ساخته شده در
359
00:11:35,040 –> 00:11:37,279
محیط محاسباتی یا زبان های شما
360
00:11:37,279 –> 00:11:38,320
خوب خواهند بود و
361
00:11:38,320 –> 00:11:40,240
ممکن است در واقع مطلوب باشند، زیرا
362
00:11:40,240 –> 00:11:41,760
ممکن است بخواهید
363
00:11:41,760 –> 00:11:43,839
دقیقاً اکنون بتوانید نتایج را بازتولید کنید.
364
00:11:43,839 –> 00:11:45,519
لازم به ذکر است که وقتی
365
00:11:45,519 –> 00:11:46,880
از numpy استفاده می کنید
366
00:11:46,880 –> 00:11:49,200
و بسته در بالای آن ساخته شده است، در
367
00:11:49,200 –> 00:11:51,279
واقع دارای یک مولد اعداد تصادفی متفاوت
368
00:11:51,279 –> 00:11:52,320
369
00:11:52,320 –> 00:11:54,639
از بسته تصادفی داخلی در
370
00:11:54,639 –> 00:11:55,519
پایتون است،
371
00:11:55,519 –> 00:11:58,079
بنابراین وقتی از numpy scipy و
372
00:11:58,079 –> 00:11:58,720
سایر
373
00:11:58,720 –> 00:12:00,399
موارد ساخته شده بر روی آن استفاده می کنید. بالای numpy برای
374
00:12:00,399 –> 00:12:02,399
تصادفی برای تنظیم دانه تصادفی،
375
00:12:02,399 –> 00:12:05,160
در واقع می خواهید از np.random.seed استفاده کنید
376
00:12:05,160 –> 00:12:06,480
377
00:12:06,480 –> 00:12:08,160
و سپس یک عدد را به آن
378
00:12:08,160 –> 00:12:09,680
تابع ارسال کنید تا
379
00:12:09,680 –> 00:12:11,200
وقتی از تصادفی استفاده می کنید که
380
00:12:11,200 –> 00:12:12,959
بر اساس numpy
381
00:12:12,959 –> 00:12:14,639
next ما است، دانه را تنظیم کنید. اکنون میخواهیم به توزیع
382
00:12:14,639 –> 00:12:16,240
نرمال
383
00:12:16,240 –> 00:12:19,120
که به نام توزیع گاوسی نیز معروف است نگاهی بیندازیم،
384
00:12:19,120 –> 00:12:20,639
اکنون توزیع نرمال
385
00:12:20,639 –> 00:12:23,120
یک توزیع احتمال پیوسته است،
386
00:12:23,120 –> 00:12:25,279
به این معنی که میتواند هر مقداری را
387
00:12:25,279 –> 00:12:27,040
در i بگیرد. ts حتی
388
00:12:27,040 –> 00:12:29,680
مقادیر کسری را در بر می گیرد و
389
00:12:29,680 –> 00:12:30,880
با یک
390
00:12:30,880 –> 00:12:33,760
منحنی زنگوله شکل متقارن مشخص می شود که در آن مقدار میانگین و
391
00:12:33,760 –> 00:12:34,800
میانه
392
00:12:34,800 –> 00:12:36,959
هر دو در مرکز دقیق
393
00:12:36,959 –> 00:12:38,240
توزیع قرار دارند
394
00:12:38,240 –> 00:12:40,240
، عمده مشاهدات با
395
00:12:40,240 –> 00:12:41,519
توزیع نرمال
396
00:12:41,519 –> 00:12:44,480
نزدیک به میانگین قرار می گیرند، بنابراین به عنوان یک
397
00:12:44,480 –> 00:12:45,519
قاعده کلی.
398
00:12:45,519 –> 00:12:48,240
حدود 68 درصد از دادهها با
399
00:12:48,240 –> 00:12:49,600
توزیع نرمال
400
00:12:49,600 –> 00:12:52,240
در یک انحراف استاندارد
401
00:12:52,240 –> 00:12:53,120
از میانگین قرار دارند
402
00:12:53,120 –> 00:12:56,240
در حالی که 95 از دادهها در دو
403
00:12:56,240 –> 00:12:57,680
انحراف استاندارد
404
00:12:57,680 –> 00:13:00,800
و 99.7 درصد در سه
405
00:13:00,800 –> 00:13:02,160
انحراف معیار قرار دارند،
406
00:13:02,160 –> 00:13:04,399
بنابراین اگر میشنوید که افراد درباره
407
00:13:04,399 –> 00:13:05,519
مواردی که
408
00:13:05,519 –> 00:13:07,920
دو یا سه انحراف معیار هستند صحبت میکنند. به دور
409
00:13:07,920 –> 00:13:08,720
از میانگینی
410
00:13:08,720 –> 00:13:10,240
که آنها در مورد رویدادهایی صحبت می کنند که
411
00:13:10,240 –> 00:13:12,959
نسبتاً نادر هستند، توزیع نرمال
412
00:13:12,959 –> 00:13:14,800
شاید مهم ترین
413
00:13:14,800 –> 00:13:17,360
توزیع در تمام آمار باشد،
414
00:13:17,360 –> 00:13:19,519
زیرا به نظر می رسد که بسیاری از
415
00:13:19,519 –> 00:13:21,040
پدیده های دنیای واقعی مانند
416
00:13:21,040 –> 00:13:24,000
آزمون iq دامنه قد انسان
417
00:13:24,000 –> 00:13:24,639
418
00:13:24,639 –> 00:13:27,040
و سایر موارد موجود در طبیعت از
419
00:13:27,040 –> 00:13:29,120
یک توزیع تقریباً نرمال پیروی می کند،
420
00:13:29,120 –> 00:13:31,519
بنابراین اغلب برای مدل سازی متغیرهای تصادفی
421
00:13:31,519 –> 00:13:32,480
422
00:13:32,480 –> 00:13:35,040
و بسیاری از آمارهای رایج استفاده می شود آزمایشها و
423
00:13:35,040 –> 00:13:36,160
عملیات
424
00:13:36,160 –> 00:13:39,199
425
00:13:39,199 –> 00:13:40,560
426
00:13:40,560 –> 00:13:42,639
تیکال فرض میکنند که توزیعها نرمال یا تقریباً نرمال هستند، نام مستعار برای توزیع نرمال
427
00:13:42,639 –> 00:13:44,320
هنجار است،
428
00:13:44,320 –> 00:13:47,199
بنابراین اجازه دهید مقداری داده نرمال تولید کنیم
429
00:13:47,199 –> 00:13:48,480
و شکل
430
00:13:48,480 –> 00:13:49,760
توزیع را بررسی کنیم،
431
00:13:49,760 –> 00:13:51,360
بنابراین در مرحله بعد، یک نمودار توزیع نرمال ایجاد میکنیم
432
00:13:51,360 –> 00:13:53,360
تا بتوانیم یک مفهوم را به دست آوریم. از آنچه
433
00:13:53,360 –> 00:13:54,560
که به نظر می رسد لازم نیست
434
00:13:54,560 –> 00:13:56,000
نگران این همه کد ترسیمی باشید، این فقط
435
00:13:56,000 –> 00:13:56,720
436
00:13:56,720 –> 00:13:58,560
یک نمودار از یک توزیع نرمال ایجاد می
437
00:13:58,560 –> 00:14:00,800
کند تا ما به آن نگاه کنیم، اما در اینجا می بینیم
438
00:14:00,800 –> 00:14:02,880
که یک توزیع نرمال به
439
00:14:02,880 –> 00:14:05,120
طور کلی چگونه به نظر می رسد ما یک نوع متقارن داریم.
440
00:14:05,120 –> 00:14:08,560
منحنی زنگشکل با حدود 68
441
00:14:08,560 –> 00:14:10,000
درصد دادهها
442
00:14:10,000 –> 00:14:12,079
در یک انحراف استاندارد
443
00:14:12,079 –> 00:14:14,560
میانگین قرار دارد و حدود 16 درصد
444
00:14:14,560 –> 00:14:15,279
از دادهها
445
00:14:15,279 –> 00:14:17,839
در هر یک از دنبالهها وجود دارد که بیش از
446
00:14:17,839 –> 00:14:19,760
یک انحراف استاندارد با
447
00:14:19,760 –> 00:14:20,720
میانگین
448
00:14:20,720 –> 00:14:22,160
اکنون در کار با یک نرمال فاصله دارند.
449
00:14:22,160 –> 00:14:24,560
توزیع معمولاً
450
00:14:24,560 –> 00:14:27,519
سؤالاتی در مورد افراط یا
451
00:14:27,519 –> 00:14:28,800
انتهای توزیع وجود دارد
452
00:14:28,800 –> 00:14:31,040
و برای مثال می خواهید بدانید چه
453
00:14:31,040 –> 00:14:32,320
مقدار از داده ها
454
00:14:32,320 –> 00:14:35,680
زیر یک نقطه برش خاص قرار دارد. یا
455
00:14:35,680 –> 00:14:39,120
اینکه نقطه برش قطع کردن
456
00:14:39,120 –> 00:14:40,880
مقدار معینی از داده ها چیست
457
00:14:40,880 –> 00:14:42,480
تا بتوانیم
458
00:14:42,480 –> 00:14:44,560
با
459
00:14:44,560 –> 00:14:48,240
استفاده از توابع نقطه ای ppf و cdf نقطه ای
460
00:14:48,240 –> 00:14:49,120
که قبلاً در مورد آنها یاد گرفتیم به این نوع سؤالات با توزیع عادی پاسخ
461
00:14:49,120 –> 00:14:51,279
دهیم، فقط باید از آن برای
462
00:14:51,279 –> 00:14:52,959
توزیع عادی استفاده کنیم. زمان به
463
00:14:52,959 –> 00:14:53,680
جای یکنواخت،
464
00:14:53,680 –> 00:14:55,440
بنابراین چند مثال برای انجام این کار در
465
00:14:55,440 –> 00:14:57,760
زیر میآوریم، به عنوان مثال، اگر
466
00:14:57,760 –> 00:15:00,160
بخواهیم توزیع نرمال خود را در بالا بگیریم
467
00:15:00,160 –> 00:15:02,880
و مقدار قطع یا
468
00:15:02,880 –> 00:15:03,680
مقدار کمی را پیدا
469
00:15:03,680 –> 00:15:06,880
کنیم که 2.5 درصد از دادهها را به
470
00:15:06,880 –> 00:15:07,839
سمت چپ قطع میکند،
471
00:15:07,839 –> 00:15:11,519
میتوانیم این کار را با استفاده از stats.norm.ppf انجام دهید
472
00:15:11,519 –> 00:15:15,040
و مقدار q یا کمیت خود را روی
473
00:15:15,040 –> 00:15:18,000
2.5 درصد قرار می دهیم و می توانیم همین
474
00:15:18,000 –> 00:15:18,399
کار
475
00:15:18,399 –> 00:15:20,560
را در سمت راست توزیع انجام دهیم، بنابراین
476
00:15:20,560 –> 00:15:22,680
477
00:15:22,680 –> 00:15:27,240
با تنظیم q برابر با مقدار برش صدک 97.5 را پیدا کنید.
478
00:15:27,240 –> 00:15:29,600
97.5 و وقتی اینها را اجرا می کنیم می بینیم
479
00:15:29,600 –> 00:15:32,000
که برش ها تقریباً
480
00:15:32,000 –> 00:15:35,040
منفی 2 و 2 هستند. زیرا این یک
481
00:15:35,040 –> 00:15:37,120
توزیع نرمال استاندارد است به
482
00:15:37,120 –> 00:15:40,160
این معنی که تقریباً 95 درصد
483
00:15:40,160 –> 00:15:41,040
از داده
484
00:15:41,040 –> 00:15:42,959
ها در دو انحراف استاندارد
485
00:15:42,959 –> 00:15:44,560
من قرار دارند. a زیرا در اینجا این تقریباً
486
00:15:44,560 –> 00:15:45,519
منفی دو است
487
00:15:45,519 –> 00:15:47,920
و این تقریباً دو است، به طوری که
488
00:15:47,920 –> 00:15:49,920
تقریباً با این ایده که
489
00:15:49,920 –> 00:15:52,880
حدود 95 از داده ها در دو
490
00:15:52,880 –> 00:15:54,639
انحراف استاندارد از میانگین
491
00:15:54,639 –> 00:15:56,720
برای یک توزیع نرمال قرار دارند، همسو است و اگر
492
00:15:56,720 –> 00:15:58,720
بخواهیم بررسی کنیم که چه مقدار از
493
00:15:58,720 –> 00:15:59,360
داده ها
494
00:15:59,360 –> 00:16:02,000
فراتر از یک مقدار قطع داده شده است، بنابراین ما در عوض مقدار قطع را می
495
00:16:02,000 –> 00:16:02,480
گیریم
496
00:16:02,480 –> 00:16:04,240
و می
497
00:16:04,240 –> 00:16:06,000
گوییم که
498
00:16:06,000 –> 00:16:08,079
درصد داده های فراتر از آن
499
00:16:08,079 –> 00:16:09,600
500
00:16:09,600 –> 00