فیلم آموزشی: پایتون برای تجزیه و تحلیل داده ها: توزیع های احتمال با زیرنویس فارسی

در این مطلب، ویدئو پایتون برای تجزیه و تحلیل داده ها: توزیع های احتمال با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:32:46

تصاویر این ویدئو:

قسمتی از زیرنویس این فیلم:

1
00:00:02,080 –> 00:00:03,360
سلام به همه

2
00:00:03,360 –> 00:00:05,040
در این درس، ما قصد داریم در

3
00:00:05,040 –> 00:00:07,440
مورد توزیع های احتمال

4
00:00:07,440 –> 00:00:09,200
و نحوه کار با

5
00:00:09,200 –> 00:00:12,080
توزیع های احتمال مختلف در پایتون بیاموزیم،

6
00:00:12,080 –> 00:00:14,080
اکنون بسیاری از ابزارها و

7
00:00:14,080 –> 00:00:16,800
تکنیک های آماری مورد استفاده در تجزیه و تحلیل داده

8
00:00:16,800 –> 00:00:19,920
ها بر اساس

9
00:00:19,920 –> 00:00:22,160
اندازه گیری های احتمال احتمالی هستند که چقدر احتمال وقوع یک رویداد

10
00:00:22,160 –> 00:00:23,039

11
00:00:23,039 –> 00:00:25,760
در آن وجود دارد. مقیاسی از صفر که به این معنی است که

12
00:00:25,760 –> 00:00:27,199
رویداد هرگز به یک رخ نمی دهد،

13
00:00:27,199 –> 00:00:29,519
به این معنی که رویداد همیشه

14
00:00:29,519 –> 00:00:30,400

15
00:00:30,400 –> 00:00:32,800
هنگام کار با متغیرهای داده در

16
00:00:32,800 –> 00:00:33,520
ستون ها رخ می دهد،

17
00:00:33,520 –> 00:00:36,079
می توان به عنوان متغیرهای تصادفی در نظر گرفت

18
00:00:36,079 –> 00:00:38,079
که متغیرهایی هستند که به دلیل

19
00:00:38,079 –> 00:00:38,960
شانس تغییر می کنند،

20
00:00:38,960 –> 00:00:42,079
یک توزیع احتمال توضیح می دهد که

21
00:00:42,079 –> 00:00:44,879
یک متغیر تصادفی چگونه است. به معنای توزیع شده

22
00:00:44,879 –> 00:00:45,680
به ما می گوید

23
00:00:45,680 –> 00:00:48,480
که یک متغیر تصادفی به

24
00:00:48,480 –> 00:00:49,840
احتمال زیاد

25
00:00:49,840 –> 00:00:52,399
کدام مقادیر را می گیرد و کدام مقادیر در آمار کمتر محتمل است

26
00:00:52,399 –> 00:00:54,399
، طیفی از

27
00:00:54,399 –> 00:00:55,840

28
00:00:55,840 –> 00:00:58,000
توزیع های احتمال دقیقاً تعریف شده وجود دارد که

29
00:00:58,000 –> 00:01:00,000
اشکال مختلفی دارند و می توان از آنها برای

30
00:01:00,000 –> 00:01:00,719
مدل سازی

31
00:01:00,719 –> 00:01:03,039
انواع مختلف رویدادهای تصادفی استفاده کرد. در

32
00:01:03,039 –> 00:01:04,640
این درس قصد داریم در مورد برخی

33
00:01:04,640 –> 00:01:05,280
از

34
00:01:05,280 –> 00:01:07,760
توزیع‌های احتمال رایج‌تر بحث کنیم یون ها

35
00:01:07,760 –> 00:01:09,840
و نحوه کار با آنها در پایتون

36
00:01:09,840 –> 00:01:11,520
برای شروع ما به توزیع یکنواخت نگاه می کنیم.

37
00:01:11,520 –> 00:01:13,040

38
00:01:13,040 –> 00:01:15,040
توزیع یکنواخت یک

39
00:01:15,040 –> 00:01:16,880
توزیع احتمال است که در آن

40
00:01:16,880 –> 00:01:19,280
هر مقدار در یک محدوده خاص به یک

41
00:01:19,280 –> 00:01:21,439
اندازه احتمال دارد رخ دهد

42
00:01:21,439 –> 00:01:23,920
و مقادیر خارج از محدوده هرگز

43
00:01:23,920 –> 00:01:24,960
رخ نمی دهد

44
00:01:24,960 –> 00:01:26,960
اگر ما یک نمودار چگالی از

45
00:01:26,960 –> 00:01:28,320
توزیع یکنواخت ایجاد

46
00:01:28,320 –> 00:01:30,960
می کنیم، به نظر می رسد مسطح است، زیرا هیچ مقداری

47
00:01:30,960 –> 00:01:32,560
محتمل تر از مقدار دیگری

48
00:01:32,560 –> 00:01:34,720
نیست، بنابراین چگالی در هر نقطه از

49
00:01:34,720 –> 00:01:36,640
توزیع یکسان است،

50
00:01:36,640 –> 00:01:38,560
اکنون بسیاری از توابع برای کار

51
00:01:38,560 –> 00:01:41,119
با توزیع های احتمال در پایتون

52
00:01:41,119 –> 00:01:45,119
در scipy موجود است. کتابخانه .stats

53
00:01:45,119 –> 00:01:46,960
بنابراین برای شروع، ما فقط

54
00:01:46,960 –> 00:01:49,360
در برخی از بسته‌های ضروری

55
00:01:49,360 –> 00:01:51,840
برای این درس بارگذاری می‌کنیم تا نشان

56
00:01:51,840 –> 00:01:53,920
دهیم توزیع یکنواخت چگونه به نظر می‌رسد،

57
00:01:53,920 –> 00:01:56,240
با تولید 10000

58
00:01:56,240 –> 00:01:57,040

59
00:01:57,040 –> 00:01:59,360
عدد از یک توزیع یکنواخت شروع می‌کنیم و

60
00:01:59,360 –> 00:02:00,560
سپس آنها را رسم می‌کنیم.

61
00:02:00,560 –> 00:02:02,880
بنابراین برای تولید برخی داده های تصادفی می توانیم

62
00:02:02,880 –> 00:02:06,000
از stats.uniform استفاده کنیم که می گوید از توزیع یکنواخت استفاده کنید

63
00:02:06,000 –> 00:02:07,520

64
00:02:07,520 –> 00:02:10,080
و rvs نقطه تابعی است که

65
00:02:10,080 –> 00:02:11,440
d تصادفی را تولید می کند. ata،

66
00:02:11,440 –> 00:02:13,520
بنابراین ما می گوییم تولید اعداد تصادفی

67
00:02:13,520 –> 00:02:15,280
از اندازه توزیع یکنواخت

68
00:02:15,280 –> 00:02:17,680
برابر با 10000 است، یعنی ما 10000 عدد

69
00:02:17,680 –> 00:02:18,400
از آنها را می خواهیم

70
00:02:18,400 –> 00:02:21,040
و سپس مقیاس محلی محدوده ای را نشان می دهد

71
00:02:21,040 –> 00:02:22,000
که می خواهیم از کجا

72
00:02:22,000 –> 00:02:23,680
تولید کنیم، بنابراین

73
00:02:23,680 –> 00:02:25,440
در واقع صد هزار عدد تولید می کنیم.

74
00:02:25,440 –> 00:02:28,080
بین صفر تا ده، پس با اجرا شروع کنید

75
00:02:28,080 –> 00:02:29,680
که برای تولید داده ها ممکن است

76
00:02:29,680 –> 00:02:30,720
یک ثانیه طول بکشد زیرا آنها صد

77
00:02:30,720 –> 00:02:31,440
هزار هستند

78
00:02:31,440 –> 00:02:33,440
و سپس ما فقط از نمودار روی آن استفاده می

79
00:02:33,440 –> 00:02:35,599
کنیم تا آن را به یک قاب داده تبدیل کنیم و نوع

80
00:02:35,599 –> 00:02:36,720
نمودار نقطه ای را اجرا

81
00:02:36,720 –> 00:02:38,560
کنیم. برای ایجاد نمودار چگالی برابر است با چگالی،

82
00:02:38,560 –> 00:02:41,040
بنابراین نمودار چگالی حاصل

83
00:02:41,040 –> 00:02:43,280
نشان می دهد که با توزیع یکنواخت

84
00:02:43,280 –> 00:02:45,360
ما اساساً یک توزیع مسطح

85
00:02:45,360 –> 00:02:45,920
در اینجا داریم

86
00:02:45,920 –> 00:02:47,840
که در آن هر مقدار در محدوده ای

87
00:02:47,840 –> 00:02:50,400
که از 0 تا 10 مشخص کرده ایم به همان اندازه

88
00:02:50,400 –> 00:02:51,200
احتمال دارد که

89
00:02:51,200 –> 00:02:54,080
اکنون بسته scipy.stats با آن همراه باشد.

90
00:02:54,080 –> 00:02:55,519
برخی از توابع مفید

91
00:02:55,519 –> 00:02:56,800
برای کار با توزیع‌های احتمال،

92
00:02:56,800 –> 00:02:58,959
ما قبلاً به یکی

93
00:02:58,959 –> 00:02:59,519
از آنها نگاه

94
00:02:59,519 –> 00:03:02,800
کردیم، تابع نقطه توزیع.rvs

95
00:03:02,800 –> 00:03:04,480
است که اعداد تصادفی را از

96
00:03:04,480 –> 00:03:05,920
توزیع مشخص شده تولید می‌کند

97
00:03:05,920 –> 00:03:07,840
تا از آن استفاده کنیم. قبلاً دیدیم که شما می گویید

98
00:03:07,840 –> 00:03:09,760
stats dot و سپس نام

99
00:03:09,760 –> 00:03:11,200
توزیعی که با

100
00:03:11,200 –> 00:03:13,440
آن کار می کنید، ما از یونیفرم استفاده می کردیم، بنابراین ما یکنواخت نقطه را در آنجا قرار دادیم

101
00:03:13,440 –> 00:03:14,560
، اما

102
00:03:14,560 –> 00:03:16,319
شما می توانید نام های توزیع دیگر را

103
00:03:16,319 –> 00:03:17,840
نیز در آنجا قرار دهید و سپس dot

104
00:03:17,840 –> 00:03:19,760
rvs و

105
00:03:19,760 –> 00:03:22,080
اعداد تصادفی از توزیع مشخص شده

106
00:03:22,080 –> 00:03:24,080
آرگومان های مربوط به آن به توزیعی که با آن کار می کنید بستگی دارد،

107
00:03:24,080 –> 00:03:25,680

108
00:03:25,680 –> 00:03:28,080
بنابراین برای لباس یک

109
00:03:28,080 –> 00:03:29,360
نقطه شروع و پایان را مشخص کردیم

110
00:03:29,360 –> 00:03:31,120
توزیع های دیگر آرگومان های متفاوتی خواهند داشت

111
00:03:31,120 –> 00:03:32,560
و بعداً به برخی از

112
00:03:32,560 –> 00:03:33,360
آنها خواهیم پرداخت،

113
00:03:33,360 –> 00:03:34,879
اما این چیزی است که شما می خواهید استفاده برای

114
00:03:34,879 –> 00:03:36,640
تولید اعداد تصادفی از

115
00:03:36,640 –> 00:03:40,280
یک توزیع داده شده، stats.distribution.cdf نیز وجود دارد،

116
00:03:40,280 –> 00:03:41,680

117
00:03:41,680 –> 00:03:44,560
تابع توزیع تجمعی یا cdf

118
00:03:44,560 –> 00:03:45,519

119
00:03:45,519 –> 00:03:48,640
برای یافتن احتمال اینکه یک

120
00:03:48,640 –> 00:03:49,760
مشاهدات

121
00:03:49,760 –> 00:03:52,319
گرفته شده از توزیع زیر

122
00:03:52,319 –> 00:03:54,000
یک مقدار مشخص قرار می گیرد، استفاده می شود،

123
00:03:54,000 –> 00:03:57,040
بنابراین اساساً cdf مساحت زیر را به شما می دهد.

124
00:03:57,040 –> 00:03:59,840
منحنی چگالی توزیع

125
00:03:59,840 –> 00:04:01,280
تا یک مقدار معین

126
00:04:01,280 –> 00:04:03,360
در محور x به عنوان مثال با

127
00:04:03,360 –> 00:04:05,519
توزیع یکنواختی که در بالا ایجاد کردیم، عدد

128
00:04:05,519 –> 00:04:08,000
2 خواهد بود. به احتمال 5 درصد

129
00:04:08,000 –> 00:04:09,760
که مشاهده ای بین

130
00:04:09,760 –> 00:04:10,640
محدوده 0

131
00:04:10,640 –> 00:04:14,159
تا 2.5 و احتمال 75

132
00:04:14,159 –> 00:04:16,238
بین دامنه 2.5 و 10 قرار می گیرد

133
00:04:16,238 –> 00:04:17,918
به دلیل نحوه ساخت

134
00:04:17,918 –> 00:04:20,560
توزیع در محدوده 0 تا 10 است

135
00:04:20,560 –> 00:04:22,720
و می توانیم تعیین کنیم که با استفاده از

136
00:04:22,720 –> 00:04:24,800
تابع cdf نقطه، بنابراین ما فقط یک

137
00:04:24,800 –> 00:04:26,080
مثال از استفاده را نشان می

138
00:04:26,080 –> 00:04:29,840
دهیم که می گوییم stats.uniform برای تابع توزیع تجمعی

139
00:04:29,840 –> 00:04:31,360

140
00:04:31,360 –> 00:04:32,800
، می گوییم می خواهیم

141
00:04:32,800 –> 00:04:35,199
چگالی تجمعی را تا مقدار

142
00:04:35,199 –> 00:04:37,840
x برابر با 2.5 بررسی کنیم و سپس ما از همان

143
00:04:37,840 –> 00:04:40,160
مقادیر برش 0 و 10 استفاده می کنیم که قبلاً استفاده می کردیم

144
00:04:40,160 –> 00:04:40,880

145
00:04:40,880 –> 00:04:42,479
و وقتی این را اجرا می کنیم می بینیم که

146
00:04:42,479 –> 00:04:43,919
25

147
00:04:43,919 –> 00:04:46,960
شانس وجود دارد که یک مقدار با این توزیع به زیر 2.5

148
00:04:46,960 –> 00:04:48,720

149
00:04:48,720 –> 00:04:52,400
بیفتد اکنون تابع stats.distribution.ppf

150
00:04:52,400 –> 00:04:55,199
اساساً معکوس است. تابع cdf

151
00:04:55,199 –> 00:04:56,080

152
00:04:56,080 –> 00:04:58,880
مقدار قطع محور x

153
00:04:58,880 –> 00:05:00,240
یا چندک

154
00:05:00,240 –> 00:05:02,960
مربوط به یک احتمال معین را برمی گرداند، برای

155
00:05:02,960 –> 00:05:04,639
مثال اگر بخواهیم

156
00:05:04,639 –> 00:05:07,680
مقدار برش را بدانیم، مقدار محور x را

157
00:05:07,680 –> 00:05:10,000
که برای آن 40 درصد شانس داریم

158
00:05:10,000 –> 00:05:12,400
که مشاهده ای زیر آن مقدار ترسیم کنیم.

159
00:05:12,400 –> 00:05:15,039
ما شرکت می کنیم دریابید که با استفاده از ppf، پس

160
00:05:15,039 –> 00:05:16,479
مثالی برای انجام

161
00:05:16,479 –> 00:05:18,960
دوباره آن می زنیم، این

162
00:05:18,960 –> 00:05:20,720
تابع time.ppf stats.uniform را انجام

163
00:05:20,720 –> 00:05:23,039
می دهیم، مقیاس locan یکسان خواهد بود و

164
00:05:23,039 –> 00:05:24,080
در اینجا

165
00:05:24,080 –> 00:05:27,120
یک کمیت 0.4

166
00:05:27,120 –> 00:05:29,280
را بررسی می کنیم، بنابراین ما. دوباره درخواست می کنیم، بنابراین در اینجا اساساً می

167
00:05:29,280 –> 00:05:31,759
پرسیم که چه مقدار محور x را

168
00:05:31,759 –> 00:05:32,960
باید تنظیم کنیم

169
00:05:32,960 –> 00:05:35,759
تا 40 درصد از

170
00:05:35,759 –> 00:05:36,639
توزیع

171
00:05:36,639 –> 00:05:38,960
را در سمت چپ آن برش دهیم، بنابراین وقتی این را اجرا می کنیم می

172
00:05:38,960 –> 00:05:41,199
بینیم که مقدار محور x در این

173
00:05:41,199 –> 00:05:42,639
مورد 4.0 است.

174
00:05:42,639 –> 00:05:44,880
زیرا ما یک یکنواخت در

175
00:05:44,880 –> 00:05:46,320
محدوده 0 تا 10 ایجاد کردیم.

176
00:05:46,320 –> 00:05:50,000
در نهایت تابع

177
00:05:50,000 –> 00:05:50,880

178
00:05:50,880 –> 00:05:53,840
stats.distribution.pdf چگالی احتمال واقعی را به شما می دهد

179
00:05:53,840 –> 00:05:56,080
که ارتفاع توزیع

180
00:05:56,080 –> 00:05:58,479
در هر مقدار x داده شده در حال حاضر است زیرا

181
00:05:58,479 –> 00:06:00,639
توزیع یکنواخت

182
00:06:00,639 –> 00:06:04,000
همه مقادیر x در داخل آن مسطح است. محدوده

183
00:06:04,000 –> 00:06:05,840
توزیع قرار است چگالی احتمال یکسانی داشته

184
00:06:05,840 –> 00:06:07,280
باشد

185
00:06:07,280 –> 00:06:09,440
اما مقادیر x خارج از آن محدوده

186
00:06:09,440 –> 00:06:11,600
چگالی احتمالی 0

187
00:06:11,600 –> 00:06:12,880
خواهند داشت زیرا هرگز اتفاق نمی‌افتند،

188
00:06:12,880 –> 00:06:14,560
بنابراین برای نشان دادن ما فقط

189
00:06:14,560 –> 00:06:15,919
یک حلقه برای در اینجا ایجاد می‌کنیم

190
00:06:15,919 –> 00:06:19,120
که از منفی 1 به بالا می‌رود. 11

191
00:06:19,120 –> 00:06:21,600
و چگالی را در هر یک از t چاپ کنید شیلنگ

192
00:06:21,600 –> 00:06:22,319

193
00:06:22,319 –> 00:06:24,960
مقادیر x متفاوت است و باید ببینیم که منفی

194
00:06:24,960 –> 00:06:25,440

195
00:06:25,440 –> 00:06:27,440
1 هیچ مقداری نخواهد داشت زیرا

196
00:06:27,440 –> 00:06:28,720
خارج از محدوده

197
00:06:28,720 –> 00:06:29,759
توزیع

198
00:06:29,759 –> 00:06:32,560
11 نیز نباید چگالی داشته باشد اما

199
00:06:32,560 –> 00:06:34,319
هر چیزی بین آن محدوده

200
00:06:34,319 –> 00:06:37,039
از 0 تا 10 باید چگالی

201
00:06:37,039 –> 00:06:38,240
0.1

202
00:06:38,240 –> 00:06:40,880
داشته باشد. ما این را اجرا می کنیم و می بینیم که مقادیر

203
00:06:40,880 –> 00:06:42,000
خارج از

204
00:06:42,000 –> 00:06:43,919
محدوده اصلاً چگالی ندارند،

205
00:06:43,919 –> 00:06:45,360

206
00:06:45,360 –> 00:06:47,360
وقتی روی توزیع یکنواختی هستیم

207
00:06:47,360 –> 00:06:48,880
که فقط از 0 تا 10 می رود، نمی توانیم مقدار منفی 1 را بدست آوریم.

208
00:06:48,880 –> 00:06:50,880
باز هم نمی توانیم ببینیم 11 اما هر چیزی

209
00:06:50,880 –> 00:06:51,919
در محدوده باشد،

210
00:06:51,919 –> 00:06:53,360
بنابراین برخی از این مقادیر مختلف

211
00:06:53,360 –> 00:06:56,160
همگی چگالی 0.1 یکسانی دارند،

212
00:06:56,160 –> 00:06:58,160
اکنون قبل از اینکه با این

213
00:06:58,160 –> 00:06:59,919
درس به یادگیری توزیع‌های احتمال مختلف

214
00:06:59,919 –> 00:07:00,880

215
00:07:00,880 –> 00:07:02,639
ادامه دهیم، یک ثانیه

216
00:07:02,639 –> 00:07:04,880
در مورد تولید اعداد تصادفی به

217
00:07:04,880 –> 00:07:05,440
طور کلی

218
00:07:05,440 –> 00:07:08,160
و تنظیم دانه تصادفی بنابراین زمانی که

219
00:07:08,160 –> 00:07:10,080
نیاز به تولید اعداد تصادفی در یک

220
00:07:10,080 –> 00:07:11,120
محدوده معین

221
00:07:11,120 –> 00:07:13,520
با احتمال زوج دارید، فقط می توانید

222
00:07:13,520 –> 00:07:15,680
اعداد را از توزیع یکنواخت

223
00:07:15,680 –> 00:07:18,639
با استفاده از تابع stats.distribution.rvs که قبلاً دیدیم، بکشید.

224
00:07:18,639 –> 00:07:20,400

225
00:07:20,400 –> 00:07:23,120
پایتون همچنین با کتابخانه ای

226
00:07:23,120 –> 00:07:24,160
به نام تصادفی ارائه می شود

227
00:07:24,160 –> 00:07:26,479
که به شما امکان می دهد عملیات مختلفی را انجام دهید

228
00:07:26,479 –> 00:07:28,160
که شامل تصادفی سازی می شوند،

229
00:07:28,160 –> 00:07:29,520
بنابراین

230
00:07:29,520 –> 00:07:32,880
اگر ماژول تصادفی را وارد

231
00:07:32,880 –> 00:07:35,360
کنیم به چند تابع دسترسی پیدا می کنیم که

232
00:07:35,360 –> 00:07:37,199

233
00:07:37,199 –> 00:07:40,960
اولاً می توانیم از تصادفی استفاده کنیم.

234
00:07:40,960 –> 00:07:43,039
تابع randint برای تولید یک عدد صحیح تصادفی

235
00:07:43,039 –> 00:07:44,720
از یک محدوده مشخص،

236
00:07:44,720 –> 00:07:46,800
بنابراین اگر می‌خواستیم یک عدد تصادفی

237
00:07:46,800 –> 00:07:48,080
از 0 تا 10 به دست

238
00:07:48,080 –> 00:07:51,039
آوریم، می‌توانیم از تصادفی برای انجام این کار استفاده کنیم، بنابراین در

239
00:07:51,039 –> 00:07:52,560
آنجا عدد 6 را تولید کردیم.

240
00:07:52,560 –> 00:07:56,319
همچنین می‌توانید از random.choice برای انتخاب

241
00:07:56,319 –> 00:07:58,879
یک عنصر تصادفی از بین استفاده کنید. یک دنباله برای

242
00:07:58,879 –> 00:08:00,400
مثال اگر ما لیستی

243
00:08:00,400 –> 00:08:02,400
از این چهار عدد داشتیم و می

244
00:08:02,400 –> 00:08:03,440
خواستیم یکی از آنها را به

245
00:08:03,440 –> 00:08:06,000
صورت تصادفی انتخاب کنیم، می توانیم از random.choice برای این کار استفاده

246
00:08:06,000 –> 00:08:06,560
کنیم،

247
00:08:06,560 –> 00:08:08,240
بنابراین اگر این را اجرا کنیم باید

248
00:08:08,240 –> 00:08:10,080
خروجی یکی از این چهار عدد را ببینیم.

249
00:08:10,080 –> 00:08:11,680
نمی‌دانم کدام یک، اما یکی از آنها را دریافت می‌کنیم

250
00:08:11,680 –> 00:08:12,319

251
00:08:12,319 –> 00:08:14,720
و اگر می‌خواهید اعداد واقعی تصادفی

252
00:08:14,720 –> 00:08:16,080
در محدوده

253
00:08:16,080 –> 00:08:19,160
صفر تا یک تولید کنید، می‌توانید این کار را با

254
00:08:19,160 –> 00:08:20,560

255
00:08:20,560 –> 00:08:22,960

256
00:08:22,960 –> 00:08:25,120
random.random انجام دهید. محدوده صفر

257
00:08:25,120 –> 00:08:25,759
تا یک

258
00:08:25,759 –> 00:08:28,160
را می‌توانید به جای آن از random.uniform استفاده کنید تا

259
00:08:28,160 –> 00:08:30,160
این کار اساساً یک عدد از توزیع یکنواخت رسم می‌کند،

260
00:08:30,160 –> 00:08:31,919

261
00:08:31,919 –> 00:08:34,240
بنابراین می‌توانید random.uniform را انجام دهید و سپس

262
00:08:34,240 –> 00:08:35,760
فقط محدوده خود را مشخص کنید،

263
00:08:35,760 –> 00:08:37,519
بنابراین در این مورد به جای ترسیم از

264
00:08:37,519 –> 00:08:39,519
صفر به یک، ما یک عدد

265
00:08:39,519 –> 00:08:40,958
از 0 تا 10 رسم می کنیم.

266
00:08:40,958 –> 00:08:42,519
اکنون توجه کنید که اگر این

267
00:08:42,519 –> 00:08:44,159
تابع تصادفی یکنواخت را

268
00:08:44,159 –> 00:08:46,000
دوباره اجرا کنیم،

269
00:08:46,000 –> 00:08:47,839
خروجی متفاوتی برای عددی

270
00:08:47,839 –> 00:08:50,160
که در اینجا اعداد تصادفی تولید می کنیم دریافت خواهیم کرد، بنابراین

271
00:08:50,160 –> 00:08:51,760
هر بار که آن را اجرا می کنیم، می بینیم چیز

272
00:08:51,760 –> 00:08:52,720
متفاوتی

273
00:08:52,720 –> 00:08:54,880
از یک طرف خوب است زیرا با

274
00:08:54,880 –> 00:08:56,560
یک عدد تصادفی ما باید

275
00:08:56,560 –> 00:08:57,920
هر بار اعداد مختلفی را ببینیم

276
00:08:57,920 –> 00:08:58,959
زیرا تصادفی است

277
00:08:58,959 –> 00:09:00,959
از طرف دیگر

278
00:09:00,959 –> 00:09:02,800

279
00:09:02,800 –> 00:09:05,279
اگر

280
00:09:05,279 –> 00:09:08,080
می‌خواهید نتایج شما قابل تکرار باشد، اگر می‌خواهید نتایج شما قابل تکرار باشد، داشتن نتایج از یک اجرا به دیگری متفاوت است.

281
00:09:08,080 –> 00:09:10,320
می توانید با انجام کاری که به عنوان تنظیم دانه تصادفی شناخته می شود،

282
00:09:10,320 –> 00:09:11,760
هر بار

283
00:09:11,760 –> 00:09:13,600
که تابعی را اجرا می کنید که شامل

284
00:09:13,600 –> 00:09:16,160
تصادفی می شود، نتایج شما یکسان است

285
00:09:16,160 –> 00:09:18,000

286
00:09:18,000 –> 00:09:19,839
تا اعداد تولید شده توسط

287
00:09:19,839 –> 00:09:21,920
مولدهای اعداد تصادفی در پایتون و سایر

288
00:09:21,920 –> 00:09:23,279
زبان‌های برنامه‌نویسی

289
00:09:23,279 –> 00:09:25,920
معمولاً واقعاً تصادفی نیستند، آنها

290
00:09:25,920 –> 00:09:27,600
چیزی هستند که به عنوان تصادفی شبه شناخته می‌شوند،

291
00:09:27,600 –> 00:09:29,279
بنابراین در واقع توسط یک

292
00:09:29,279 –> 00:09:30,800
فرآیند قطعی

293
00:09:30,800 –> 00:09:33,200
در زیر هود ایجاد می‌شوند که بر اساس یک

294
00:09:33,200 –> 00:09:33,839

295
00:09:33,839 –> 00:09:36,880
حالت شروع اولیه یا seed است و اگر

296
00:09:36,880 –> 00:09:37,600
از همان

297
00:09:37,600 –> 00:09:39,839
حالت اولیه برای اعداد تصادفی استفاده کنید.

298
00:09:39,839 –> 00:09:42,000
مولد دقیقاً همان اعداد را تولید خواهید کرد،

299
00:09:42,000 –> 00:09:43,440

300
00:09:43,440 –> 00:09:45,680
بنابراین با مقداردهی اولیه مولد اعداد تصادفی

301
00:09:45,680 –> 00:09:47,440

302
00:09:47,440 –> 00:09:49,519
به همان چیز قبل از اجرای

303
00:09:49,519 –> 00:09:51,120
تابعی که شامل تصادفی است

304
00:09:51,120 –> 00:09:53,279
، در واقع همان نتیجه

305
00:09:53,279 –> 00:09:54,959
را ایجاد خواهید کرد که اگر

306
00:09:54,959 –> 00:09:55,839
می‌خواهید توابع شما

307
00:09:55,839 –> 00:09:58,720
کاملاً قابل تکرار باشند، چیز خوبی است. بنابراین ما در اینجا

308
00:09:58,720 –> 00:10:00,959
مثالی از نحوه انجام این کار ارائه می دهیم

309
00:10:00,959 –> 00:10:02,800
تا با بسته تصادفی داخلی پایتون

310
00:10:02,800 –> 00:10:04,079
بتوانید

311
00:10:04,079 –> 00:10:07,360
با استفاده از random.seed، seed را تنظیم کنید، سپس فقط

312
00:10:07,360 –> 00:10:09,519
یک مقدار عددی دلخواه را به

313
00:10:09,519 –> 00:10:10,640
آن تابع ارسال کنید

314
00:10:10,640 –> 00:10:13,360
و اکنون مولد اعداد تصادفی را مقداردهی اولیه کنید.

315
00:10:13,360 –> 00:10:14,399
تا به شما نشان دهیم

316
00:10:14,399 –> 00:10:17,040
که این در واقع مولد اعداد تصادفی را مقداردهی اولیه می‌کند

317
00:10:17,040 –> 00:10:18,480
و

318
00:10:18,480 –> 00:10:19,519

319
00:10:19,519 –> 00:10:22,160
پس از تنظیم همان دانه‌ای که می‌خواهیم، همان نتایج را دریافت کن

320
00:10:22,160 –> 00:10:23,279
د. برای تنظیم دانه

321
00:10:23,279 –> 00:10:25,839
با 12. تعدادی اعداد تصادفی تولید می

322
00:10:25,839 –> 00:10:26,720

323
00:10:26,720 –> 00:10:29,360
کنیم، سپس دانه را دوباره به 12 بازنشانی می کنیم

324
00:10:29,360 –> 00:10:31,200
و اعداد را دقیقاً به همان

325
00:10:31,200 –> 00:10:33,040
روش تولید می کنیم و اینها همین نتایج را در اینجا ایجاد می کنند،

326
00:10:33,040 –> 00:10:34,160

327
00:10:34,160 –> 00:10:35,760
بنابراین این را اجرا می کنیم و می بینیم که ما

328
00:10:35,760 –> 00:10:37,360
همان

329
00:10:37,360 –> 00:10:40,160
اعداد تصادفی تصادفی را تولید کرد، حتی اگر

330
00:10:40,160 –> 00:10:42,000
تصادفی نبود، زیرا آنها بر اساس

331
00:10:42,000 –> 00:10:43,200
یک دانه اولیه بودند

332
00:10:43,200 –> 00:10:45,120
و سپس یک فرآیند قطعی

333
00:10:45,120 –> 00:10:46,880
در واقع آنها را ایجاد کرد،

334
00:10:46,880 –> 00:10:48,800
بنابراین به طور کلی این اعداد شبه تصادفی

335
00:10:48,800 –> 00:10:50,880
تولید شده توسط رایانه شما به

336
00:10:50,880 –> 00:10:51,839
اندازه کافی

337
00:10:51,839 –> 00:10:54,480
برای تصادفی بودن برای بیشتر اهداف خوب هستند.

338
00:10:54,480 –> 00:10:56,079
فقط بدانید که در واقعیت

339
00:10:56,079 –> 00:10:58,640
آنها کاملاً تصادفی نیستند زیرا

340
00:10:58,640 –> 00:10:59,360
رایانه

341
00:10:59,360 –> 00:11:02,399
ها در نهایت ماشین های قطعی

342
00:11:02,399 –> 00:11:05,200
هستند آنها قادر به تولید اعداد تصادفی واقعی نیستند،

343
00:11:05,200 –> 00:11:06,320

344
00:11:06,320 –> 00:11:07,920
بنابراین اگر می خواهید اعدادی را

345
00:11:07,920 –> 00:11:09,839
که واقعاً تصادفی هستند تولید

346
00:11:09,839 –> 00:11:12,160
کنید می توانید این کار را با نمونه برداری از

347
00:11:12,160 –> 00:11:14,560
منابع تصادفی واقعی انجام دهید.

348
00:11:14,560 –> 00:11:17,519
یا آنتروپی از محیط، به

349
00:11:17,519 –> 00:11:19,360
عنوان مثال اگر

350
00:11:19,360 –> 00:11:20,480

351
00:11:20,480 –> 00:11:23,519
سنسوری به رایانه خود متصل کرده بودید که نویز تصادفی جو را تشخیص

352
00:11:23,519 –> 00:11:24,240
می داد

353
00:11:24,240 –> 00:11:26,000
و سپس اندازه گیری می کردید. نتایج حاصل از آن

354
00:11:26,000 –> 00:11:27,279
حسگر در طول زمان

355
00:11:27,279 –> 00:11:29,040
که به طور بالقوه می تواند منبع

356
00:11:29,040 –> 00:11:30,800
تصادفی واقعی باشد،

357
00:11:30,800 –> 00:11:33,200
اما برای اکثر اهداف، مولدهای اعداد تصادفی

358
00:11:33,200 –> 00:11:35,040
ساخته شده در

359
00:11:35,040 –> 00:11:37,279
محیط محاسباتی یا زبان های شما

360
00:11:37,279 –> 00:11:38,320
خوب خواهند بود و

361
00:11:38,320 –> 00:11:40,240
ممکن است در واقع مطلوب باشند، زیرا

362
00:11:40,240 –> 00:11:41,760
ممکن است بخواهید

363
00:11:41,760 –> 00:11:43,839
دقیقاً اکنون بتوانید نتایج را بازتولید کنید.

364
00:11:43,839 –> 00:11:45,519
لازم به ذکر است که وقتی

365
00:11:45,519 –> 00:11:46,880
از numpy استفاده می کنید

366
00:11:46,880 –> 00:11:49,200
و بسته در بالای آن ساخته شده است، در

367
00:11:49,200 –> 00:11:51,279
واقع دارای یک مولد اعداد تصادفی متفاوت

368
00:11:51,279 –> 00:11:52,320

369
00:11:52,320 –> 00:11:54,639
از بسته تصادفی داخلی در

370
00:11:54,639 –> 00:11:55,519
پایتون است،

371
00:11:55,519 –> 00:11:58,079
بنابراین وقتی از numpy scipy و

372
00:11:58,079 –> 00:11:58,720
سایر

373
00:11:58,720 –> 00:12:00,399
موارد ساخته شده بر روی آن استفاده می کنید. بالای numpy برای

374
00:12:00,399 –> 00:12:02,399
تصادفی برای تنظیم دانه تصادفی،

375
00:12:02,399 –> 00:12:05,160
در واقع می خواهید از np.random.seed استفاده کنید

376
00:12:05,160 –> 00:12:06,480

377
00:12:06,480 –> 00:12:08,160
و سپس یک عدد را به آن

378
00:12:08,160 –> 00:12:09,680
تابع ارسال کنید تا

379
00:12:09,680 –> 00:12:11,200
وقتی از تصادفی استفاده می کنید که

380
00:12:11,200 –> 00:12:12,959
بر اساس numpy

381
00:12:12,959 –> 00:12:14,639
next ما است، دانه را تنظیم کنید. اکنون می‌خواهیم به توزیع

382
00:12:14,639 –> 00:12:16,240
نرمال

383
00:12:16,240 –> 00:12:19,120
که به نام توزیع گاوسی نیز معروف است نگاهی بیندازیم،

384
00:12:19,120 –> 00:12:20,639
اکنون توزیع نرمال

385
00:12:20,639 –> 00:12:23,120
یک توزیع احتمال پیوسته است،

386
00:12:23,120 –> 00:12:25,279
به این معنی که می‌تواند هر مقداری را

387
00:12:25,279 –> 00:12:27,040
در i بگیرد. ts حتی

388
00:12:27,040 –> 00:12:29,680
مقادیر کسری را در بر می گیرد و

389
00:12:29,680 –> 00:12:30,880
با یک

390
00:12:30,880 –> 00:12:33,760
منحنی زنگوله شکل متقارن مشخص می شود که در آن مقدار میانگین و

391
00:12:33,760 –> 00:12:34,800
میانه

392
00:12:34,800 –> 00:12:36,959
هر دو در مرکز دقیق

393
00:12:36,959 –> 00:12:38,240
توزیع قرار دارند

394
00:12:38,240 –> 00:12:40,240
، عمده مشاهدات با

395
00:12:40,240 –> 00:12:41,519
توزیع نرمال

396
00:12:41,519 –> 00:12:44,480
نزدیک به میانگین قرار می گیرند، بنابراین به عنوان یک

397
00:12:44,480 –> 00:12:45,519
قاعده کلی.

398
00:12:45,519 –> 00:12:48,240
حدود 68 درصد از داده‌ها با

399
00:12:48,240 –> 00:12:49,600
توزیع نرمال

400
00:12:49,600 –> 00:12:52,240
در یک انحراف استاندارد

401
00:12:52,240 –> 00:12:53,120
از میانگین قرار دارند

402
00:12:53,120 –> 00:12:56,240
در حالی که 95 از داده‌ها در دو

403
00:12:56,240 –> 00:12:57,680
انحراف استاندارد

404
00:12:57,680 –> 00:13:00,800
و 99.7 درصد در سه

405
00:13:00,800 –> 00:13:02,160
انحراف معیار قرار دارند،

406
00:13:02,160 –> 00:13:04,399
بنابراین اگر می‌شنوید که افراد درباره

407
00:13:04,399 –> 00:13:05,519
مواردی که

408
00:13:05,519 –> 00:13:07,920
دو یا سه انحراف معیار هستند صحبت می‌کنند. به دور

409
00:13:07,920 –> 00:13:08,720
از میانگینی

410
00:13:08,720 –> 00:13:10,240
که آنها در مورد رویدادهایی صحبت می کنند که

411
00:13:10,240 –> 00:13:12,959
نسبتاً نادر هستند، توزیع نرمال

412
00:13:12,959 –> 00:13:14,800
شاید مهم ترین

413
00:13:14,800 –> 00:13:17,360
توزیع در تمام آمار باشد،

414
00:13:17,360 –> 00:13:19,519
زیرا به نظر می رسد که بسیاری از

415
00:13:19,519 –> 00:13:21,040
پدیده های دنیای واقعی مانند

416
00:13:21,040 –> 00:13:24,000
آزمون iq دامنه قد انسان

417
00:13:24,000 –> 00:13:24,639

418
00:13:24,639 –> 00:13:27,040
و سایر موارد موجود در طبیعت از

419
00:13:27,040 –> 00:13:29,120
یک توزیع تقریباً نرمال پیروی می کند،

420
00:13:29,120 –> 00:13:31,519
بنابراین اغلب برای مدل سازی متغیرهای تصادفی

421
00:13:31,519 –> 00:13:32,480

422
00:13:32,480 –> 00:13:35,040
و بسیاری از آمارهای رایج استفاده می شود آزمایش‌ها و

423
00:13:35,040 –> 00:13:36,160
عملیات

424
00:13:36,160 –> 00:13:39,199

425
00:13:39,199 –> 00:13:40,560

426
00:13:40,560 –> 00:13:42,639
تیکال فرض می‌کنند که توزیع‌ها نرمال یا تقریباً نرمال هستند، نام مستعار برای توزیع نرمال

427
00:13:42,639 –> 00:13:44,320
هنجار است،

428
00:13:44,320 –> 00:13:47,199
بنابراین اجازه دهید مقداری داده نرمال تولید کنیم

429
00:13:47,199 –> 00:13:48,480
و شکل

430
00:13:48,480 –> 00:13:49,760
توزیع را بررسی کنیم،

431
00:13:49,760 –> 00:13:51,360
بنابراین در مرحله بعد، یک نمودار توزیع نرمال ایجاد می‌کنیم

432
00:13:51,360 –> 00:13:53,360
تا بتوانیم یک مفهوم را به دست آوریم. از آنچه

433
00:13:53,360 –> 00:13:54,560
که به نظر می رسد لازم نیست

434
00:13:54,560 –> 00:13:56,000
نگران این همه کد ترسیمی باشید، این فقط

435
00:13:56,000 –> 00:13:56,720

436
00:13:56,720 –> 00:13:58,560
یک نمودار از یک توزیع نرمال ایجاد می

437
00:13:58,560 –> 00:14:00,800
کند تا ما به آن نگاه کنیم، اما در اینجا می بینیم

438
00:14:00,800 –> 00:14:02,880
که یک توزیع نرمال به

439
00:14:02,880 –> 00:14:05,120
طور کلی چگونه به نظر می رسد ما یک نوع متقارن داریم.

440
00:14:05,120 –> 00:14:08,560
منحنی زنگ‌شکل با حدود 68

441
00:14:08,560 –> 00:14:10,000
درصد داده‌ها

442
00:14:10,000 –> 00:14:12,079
در یک انحراف استاندارد

443
00:14:12,079 –> 00:14:14,560
میانگین قرار دارد و حدود 16 درصد

444
00:14:14,560 –> 00:14:15,279
از داده‌ها

445
00:14:15,279 –> 00:14:17,839
در هر یک از دنباله‌ها وجود دارد که بیش از

446
00:14:17,839 –> 00:14:19,760
یک انحراف استاندارد با

447
00:14:19,760 –> 00:14:20,720
میانگین

448
00:14:20,720 –> 00:14:22,160
اکنون در کار با یک نرمال فاصله دارند.

449
00:14:22,160 –> 00:14:24,560
توزیع معمولاً

450
00:14:24,560 –> 00:14:27,519
سؤالاتی در مورد افراط یا

451
00:14:27,519 –> 00:14:28,800
انتهای توزیع وجود دارد

452
00:14:28,800 –> 00:14:31,040
و برای مثال می خواهید بدانید چه

453
00:14:31,040 –> 00:14:32,320
مقدار از داده ها

454
00:14:32,320 –> 00:14:35,680
زیر یک نقطه برش خاص قرار دارد. یا

455
00:14:35,680 –> 00:14:39,120
اینکه نقطه برش قطع کردن

456
00:14:39,120 –> 00:14:40,880
مقدار معینی از داده ها چیست

457
00:14:40,880 –> 00:14:42,480
تا بتوانیم

458
00:14:42,480 –> 00:14:44,560
با

459
00:14:44,560 –> 00:14:48,240
استفاده از توابع نقطه ای ppf و cdf نقطه ای

460
00:14:48,240 –> 00:14:49,120
که قبلاً در مورد آنها یاد گرفتیم به این نوع سؤالات با توزیع عادی پاسخ

461
00:14:49,120 –> 00:14:51,279
دهیم، فقط باید از آن برای

462
00:14:51,279 –> 00:14:52,959
توزیع عادی استفاده کنیم. زمان به

463
00:14:52,959 –> 00:14:53,680
جای یکنواخت،

464
00:14:53,680 –> 00:14:55,440
بنابراین چند مثال برای انجام این کار در

465
00:14:55,440 –> 00:14:57,760
زیر می‌آوریم، به عنوان مثال، اگر

466
00:14:57,760 –> 00:15:00,160
بخواهیم توزیع نرمال خود را در بالا بگیریم

467
00:15:00,160 –> 00:15:02,880
و مقدار قطع یا

468
00:15:02,880 –> 00:15:03,680
مقدار کمی را پیدا

469
00:15:03,680 –> 00:15:06,880
کنیم که 2.5 درصد از داده‌ها را به

470
00:15:06,880 –> 00:15:07,839
سمت چپ قطع می‌کند،

471
00:15:07,839 –> 00:15:11,519
می‌توانیم این کار را با استفاده از stats.norm.ppf انجام دهید

472
00:15:11,519 –> 00:15:15,040
و مقدار q یا کمیت خود را روی

473
00:15:15,040 –> 00:15:18,000
2.5 درصد قرار می دهیم و می توانیم همین

474
00:15:18,000 –> 00:15:18,399
کار

475
00:15:18,399 –> 00:15:20,560
را در سمت راست توزیع انجام دهیم، بنابراین

476
00:15:20,560 –> 00:15:22,680

477
00:15:22,680 –> 00:15:27,240
با تنظیم q برابر با مقدار برش صدک 97.5 را پیدا کنید.

478
00:15:27,240 –> 00:15:29,600
97.5 و وقتی اینها را اجرا می کنیم می بینیم

479
00:15:29,600 –> 00:15:32,000
که برش ها تقریباً

480
00:15:32,000 –> 00:15:35,040
منفی 2 و 2 هستند. زیرا این یک

481
00:15:35,040 –> 00:15:37,120
توزیع نرمال استاندارد است به

482
00:15:37,120 –> 00:15:40,160
این معنی که تقریباً 95 درصد

483
00:15:40,160 –> 00:15:41,040
از داده

484
00:15:41,040 –> 00:15:42,959
ها در دو انحراف استاندارد

485
00:15:42,959 –> 00:15:44,560
من قرار دارند. a زیرا در اینجا این تقریباً

486
00:15:44,560 –> 00:15:45,519
منفی دو است

487
00:15:45,519 –> 00:15:47,920
و این تقریباً دو است، به طوری که

488
00:15:47,920 –> 00:15:49,920
تقریباً با این ایده که

489
00:15:49,920 –> 00:15:52,880
حدود 95 از داده ها در دو

490
00:15:52,880 –> 00:15:54,639
انحراف استاندارد از میانگین

491
00:15:54,639 –> 00:15:56,720
برای یک توزیع نرمال قرار دارند، همسو است و اگر

492
00:15:56,720 –> 00:15:58,720
بخواهیم بررسی کنیم که چه مقدار از

493
00:15:58,720 –> 00:15:59,360
داده ها

494
00:15:59,360 –> 00:16:02,000
فراتر از یک مقدار قطع داده شده است، بنابراین ما در عوض مقدار قطع را می

495
00:16:02,000 –> 00:16:02,480
گیریم

496
00:16:02,480 –> 00:16:04,240
و می

497
00:16:04,240 –> 00:16:06,000
گوییم که

498
00:16:06,000 –> 00:16:08,079
درصد داده های فراتر از آن

499
00:16:08,079 –> 00:16:09,600

500
00:16:09,600 –> 00

پاسخ دهید لغو پاسخ

اکانت vip

دوره آموزش پایتون

مطالب تصادفی

فیلم آموزشی: چگونه خطای استاندارد برآورد را در پایتون محاسبه کنیم؟ با زیرنویس فارسی

فیلم آموزشی: نحوه دریافت و استفاده از داده های فرم های وب Html با Python Cgi بدون هیچ چارچوب وب

فیلم آموزشی: ماتریس در پایتون با استفاده از sympy

فیلم آموزشی: تجزیه و تحلیل روندهای گوگل را با پایتون به صورت خودکار انجام دهید با زیرنویس فارسی

فیلم آموزشی: نحوه استفاده از تابع divmod در پایتون با زیرنویس فارسی

فیلم آموزشی: پایتون به عنوان یک فایل دسته ای برنامه قابل اجرا با دستور داخلی یا خارجی شناخته نمی شود

فیلم آموزشی: تابع int() Python با زیرنویس فارسی

فیلم آموزشی: PythonTeX: دسترسی سریع به Python از داخل LaTeX

فیلم آموزشی: انیمیشن پایه در پایتون 3 قسمت 6: استفاده از کلاس ها با زیرنویس فارسی

فیلم آموزشی: آیا شبکه شما کار می کند؟ با تست پایتون دیگر حدس نمی زنید توسط pyATS با زیرنویس فارسی

فیلم آموزشی: آمار توصیفی پایتون و خلاصه پنج عدد با زیرنویس فارسی

فیلم آموزشی: پایتون با اکسل – بسته Openpyxl را با Pip نصب کنید

فیلم آموزشی: وب سرور پایه پایتون با زیرنویس فارسی

فیلم آموزشی: پایتون – طرحواره XML با زیرنویس فارسی

فیلم آموزشی: ایجاد یک Keylogger پیشرفته در Python – Crash Course با زیرنویس فارسی

فیلم آموزشی: آموزش پروژه پایتون متوسط - ساخت شبیه ساز حیوانات خانگی

پشتیبانی سایت

نماد اعتماد اینماد و زیبال

برای دانلود این فیلم ، عضو vip سایت شوید.

دانلود 17000 فیلم پایتون با پرداخت 15 هزار تومان (عضویت یک ماهه)

مطالب مرتبط: