در این مطلب، ویدئو رگرسیون خطی از ابتدا در پایتون (ریاضی) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:24:38
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:04,230 –> 00:00:09,280
[موسیقی]
2
00:00:09,280 –> 00:00:10,800
بچهها در
3
00:00:10,800 –> 00:00:12,400
ویدیوی امروزی که در حال انجام است، خوش آمدید، ما میخواهیم
4
00:00:12,400 –> 00:00:14,799
رگرسیون خطی را از ابتدا در پایتون پیادهسازی کنیم
5
00:00:14,799 –> 00:00:16,320
و هشداری که از قبل ریاضی خواهد بود،
6
00:00:16,320 –> 00:00:19,199
پس بیایید به درستی وارد آن شویم،
7
00:00:19,199 –> 00:00:20,720
بنابراین بیایید
8
00:00:20,720 –> 00:00:22,960
با اصول اولیه شروع کنیم. از رگرسیون خطی رگرسیون خطی چیست
9
00:00:22,960 –> 00:00:24,720
و برای چه مواردی می تواند
10
00:00:24,720 –> 00:00:26,400
مفید باشد و ما
11
00:00:26,400 –> 00:00:28,320
بلافاصله با یک مثال شروع می کنیم، فرض کنید ما
12
00:00:28,320 –> 00:00:30,080
یکسری دانش آموز داریم و این دانش آموزان
13
00:00:30,080 –> 00:00:31,519
امتحان دارند
14
00:00:31,519 –> 00:00:33,680
و هر کدام زمان مطالعه
15
00:00:33,680 –> 00:00:35,280
مشخصی دارند. زمان مطالعه مشخصی دارد که
16
00:00:35,280 –> 00:00:37,920
آنها برای این امتحان سرمایه گذاری کرده اند، بنابراین فرض کنید
17
00:00:37,920 –> 00:00:40,160
ما زمان مطالعه را در اینجا داریم، این زمان می تواند
18
00:00:40,160 –> 00:00:42,879
از صفر ساعت به بالا تا
19
00:00:42,879 –> 00:00:45,039
نه واقعا بی نهایت، بلکه تقریباً
20
00:00:45,039 –> 00:00:46,879
بی نهایت باشد، بسته به اینکه حداکثر
21
00:00:46,879 –> 00:00:48,239
تعداد دانش آموزان چقدر است، بنابراین شما می توانید
22
00:00:48,239 –> 00:00:49,200
23
00:00:49,200 –> 00:00:51,120
دو ساعت مطالعه کنید. هفته ها قبل از یک سال قبل
24
00:00:51,120 –> 00:00:53,840
می توانید یک دقیقه قبل
25
00:00:53,840 –> 00:00:55,920
از صفر به بالا مطالعه کنید تا فرض کنید بی حد
26
00:00:55,920 –> 00:00:58,480
و حصر و سپس ما یک نمره
27
00:00:58,480 –> 00:01:00,879
امتحان داریم و نمره امتحان نتیجه
28
00:01:00,879 –> 00:01:02,559
واقعی آزمون است و می تواند برود. از
29
00:01:02,559 –> 00:01:04,640
نقطه صفر تا صد نقطه یا از صفر
30
00:01:04,640 –> 00:01:06,720
درصد تا صد درصد،
31
00:01:06,720 –> 00:01:08,560
بنابراین کاری که اکنون میتوانیم انجام دهیم این است که فرض
32
00:01:08,560 –> 00:01:10,479
کنیم یک مجموعه داده با این نقاط داده
33
00:01:10,479 –> 00:01:12,320
داریم و میخواهیم این را در اینجا بر روی یک
34
00:01:12,320 –> 00:01:14,799
سیستم مختصات دوبعدی رسم کنیم که
35
00:01:14,799 –> 00:01:16,400
اینطور نیست. زیباترین سیستم مختصاتی
36
00:01:16,400 –> 00:01:17,520
که من می شناسم،
37
00:01:17,520 –> 00:01:19,360
اما فرض کنید محور x زمان مطالعه است
38
00:01:19,360 –> 00:01:20,560
39
00:01:20,560 –> 00:01:24,640
و محور y نمره امتحان است
40
00:01:24,640 –> 00:01:26,720
اکنون اگر بخواهیم همه این
41
00:01:26,720 –> 00:01:28,240
نکات را تجسم کنیم، احتمالاً چیزی
42
00:01:28,240 –> 00:01:29,759
شبیه به آن را با یک دسته از نقاط داده
43
00:01:29,759 –> 00:01:30,560
در اینجا خواهیم دید.
44
00:01:30,560 –> 00:01:32,479
کسانی که اصلا مطالعه نمی کنند و
45
00:01:32,479 –> 00:01:34,560
نمرات بسیار پایینی می گیرند افرادی که کمی مطالعه می
46
00:01:34,560 –> 00:01:36,400
کنند نمرات بهتری می گیرند
47
00:01:36,400 –> 00:01:38,000
اما هنوز هم برخی از آنها که نمرات بسیار بدی می گیرند
48
00:01:38,000 –> 00:01:40,640
و همه اینها را می گیرند و ما می توانیم
49
00:01:40,640 –> 00:01:42,240
همه این داده ها را ببینیم افرادی که زیاد مطالعه می کنند
50
00:01:42,240 –> 00:01:43,840
و زیاد می گیرند. از
51
00:01:43,840 –> 00:01:46,799
امتیازهای اوه یا نمره خیلی بالا، سپس برخی از
52
00:01:46,799 –> 00:01:48,320
افرادی که زیاد مطالعه می کنند و اصلاً نمرات خیلی خوبی کسب نمی کنند
53
00:01:48,320 –> 00:01:50,159
، برخی از افرادی که
54
00:01:50,159 –> 00:01:52,079
اصلاً مطالعه نمی کنند و
55
00:01:52,079 –> 00:01:53,759
نمرات بسیار خوبی کسب می کنند، این موارد پرت هستند، اما
56
00:01:53,759 –> 00:01:55,040
بیشتر امتیازها عبارتند از قرار است
57
00:01:55,040 –> 00:01:56,799
جایی در این وسط باشم
58
00:01:56,799 –> 00:01:58,719
اکنون آنچه رگرسیون خطی میکوشد انجام دهد این
59
00:01:58,719 –> 00:02:01,920
است که سعی میکند خطی را پیدا کند که
60
00:02:01,920 –> 00:02:04,560
با این نقاط مطابقت داشته باشد، اکنون بهترین
61
00:02:04,560 –> 00:02:06,000
کمی
62
00:02:06,000 –> 00:02:08,399
ذهنی است زیرا
63
00:02:08,399 –> 00:02:10,959
انواع رگرسیون خاص یا الگوریتمهای خاصی
64
00:02:10,959 –> 00:02:12,400
از رویکردهای UH مختلف استفاده میکنند،
65
00:02:12,400 –> 00:02:14,160
زیرا برخی میگویند خوب است،
66
00:02:14,160 –> 00:02:16,319
من اهمیتی به آن ندارم. نقاط پرت من به مقادیر پرت اهمیت زیادی می دهم
67
00:02:16,319 –> 00:02:17,280
68
00:02:17,280 –> 00:02:19,599
و به همین ترتیب بسته به اینکه چه می
69
00:02:19,599 –> 00:02:21,280
خواهید، باید رویه متفاوتی را انتخاب کنید،
70
00:02:21,280 –> 00:02:23,200
اما برای رگرسیون خطی چیزی که
71
00:02:23,200 –> 00:02:25,680
ما به آن علاقه مندیم به حداقل رساندن
72
00:02:25,680 –> 00:02:28,000
خطا است و خطا اساساً این است
73
00:02:28,000 –> 00:02:31,120
که فرض کنید من در اینجا یک تابع خطی دارم.
74
00:02:31,120 –> 00:02:33,280
خط آبی مانند آن و این
75
00:02:33,280 –> 00:02:34,800
بدیهی است که بهترین تابعی نیست که
76
00:02:34,800 –> 00:02:37,280
بتوانیم برای این نقاط داده پیدا کنیم،
77
00:02:37,280 –> 00:02:39,840
اما خطای آن تابع
78
00:02:39,840 –> 00:02:42,239
این است که اساساً برای هر نقطه برویم
79
00:02:42,239 –> 00:02:43,280
و ببینیم
80
00:02:43,280 –> 00:02:45,200
آیا این تابع درست است یا خیر، ما پیش بینی می کنیم
81
00:02:45,200 –> 00:02:47,840
که برای این x مقدار در اینجا
82
00:02:47,840 –> 00:02:49,840
مقدار y خواهد بود و سپس کاری که
83
00:02:49,840 –> 00:02:51,680
ما انجام می دهیم این است که فقط به پایین می رویم و می بینیم خوب
84
00:02:51,680 –> 00:02:53,920
این خطا است و این
85
00:02:53,920 –> 00:02:55,680
خطا است و این خطا
86
00:02:55,680 –> 00:02:57,040
اینجاست این فقط یک تفاوت است از
87
00:02:57,040 –> 00:02:59,519
پیشبینی تا واقعیت واقعی
88
00:02:59,519 –> 00:03:00,560
که خطا
89
00:03:00,560 –> 00:03:01,440
درست است
90
00:03:01,440 –> 00:03:02,800
و کاری که میخواهیم انجام دهیم این است که میخواهیم
91
00:03:02,800 –> 00:03:05,840
تابعی پیدا کنیم که این
92
00:03:05,840 –> 00:03:07,440
خطا را به حداقل برساند و این همان چیزی است که رگرسیون
93
00:03:07,440 –> 00:03:08,800
خطی در مورد
94
00:03:08,800 –> 00:03:09,840
آن است
95
00:03:09,840 –> 00:03:12,959
، بنابراین ساختار یک تابع
96
00:03:12,959 –> 00:03:16,239
اساساً یک تابع خطی است. اساسا
97
00:03:16,239 –> 00:03:20,720
y برابر است با m ضربدر x بعلاوه b، بنابراین m
98
00:03:20,720 –> 00:03:22,640
اساساً شیب است و b
99
00:03:22,640 –> 00:03:24,560
فاصله در اینجا است، بنابراین
100
00:03:24,560 –> 00:03:26,480
ما انتظار داریم که خط خط نهایی
101
00:03:26,480 –> 00:03:28,720
چیزی شبیه به آن باشد که تقریباً
102
00:03:28,720 –> 00:03:30,799
متناسب با نقاط باشد، شاید
103
00:03:30,799 –> 00:03:32,799
کمی تحت تأثیر نقاط پرت و غیره،
104
00:03:32,799 –> 00:03:35,360
اما در مجموع میخواهیم آنها با اکثر نقاط مطابقت داشته باشند،
105
00:03:35,360 –> 00:03:36,959
ما میخواهیم
106
00:03:36,959 –> 00:03:39,120
خطا را در مجموع به حداقل برسانیم
107
00:03:39,120 –> 00:03:40,560
و البته برای این کار باید
108
00:03:40,560 –> 00:03:42,959
انجام دهیم این است که باید تابع خطا را به حداقل برسانیم،
109
00:03:42,959 –> 00:03:45,360
این فرآیند کوچکسازی
110
00:03:45,360 –> 00:03:47,440
واقعی کمی است. پیچیده تر است،
111
00:03:47,440 –> 00:03:49,280
اما تابع خطا به خودی خود
112
00:03:49,280 –> 00:03:51,360
باید ابتدا تعریف شود تا بتوانیم
113
00:03:51,360 –> 00:03:53,519
آن را به حداقل برسانیم، زیرا برای به حداقل رساندن
114
00:03:53,519 –> 00:03:55,200
چیزی با الگوریتم گرادیان نزول
115
00:03:55,200 –> 00:03:56,640
که در یک bu دوم در مورد آن صحبت خواهیم کرد.
116
00:03:56,640 –> 00:03:58,799
t برای به حداقل رساندن
117
00:03:58,799 –> 00:04:00,879
چیزی، باید چیزی باشد که
118
00:04:00,879 –> 00:04:02,560
مقداری تولید کند، زیرا میخواهیم
119
00:04:02,560 –> 00:04:04,480
با تغییر دادن
120
00:04:04,480 –> 00:04:06,720
چیزهای کوچکی که نمیتوانیم آنها را ضعیف کنیم، خروجی را به حداقل
121
00:04:06,720 –> 00:04:08,080
122
00:04:08,080 –> 00:04:11,200
برسانیم، اگر به m ضربدر x بعلاوه b نگاه کنیم، میخواهیم خودمان
123
00:04:11,200 –> 00:04:14,319
را دستکاری کنیم. می خواهید m و b
124
00:04:14,319 –> 00:04:17,680
را به گونه ای تنظیم کنید که برای x i بهترین y ممکن را
125
00:04:17,680 –> 00:04:19,759
با کمترین خطا بدست بیاورم
126
00:04:19,759 –> 00:04:21,120
و تابع خطا باید
127
00:04:21,120 –> 00:04:22,639
تعریف شود تا آن را به حداقل برسانیم، بنابراین
128
00:04:22,639 –> 00:04:25,840
تابع خطا
129
00:04:25,840 –> 00:04:28,800
e سرمایه e خواهد شد
130
00:04:28,800 –> 00:04:32,080
1 تقسیم بر n که قرار است
131
00:04:32,080 –> 00:04:33,840
در عرض یک دقیقه به شما بگویم زیرا در یک ثانیه
132
00:04:33,840 –> 00:04:36,240
چرا 1 تقسیم بر n
133
00:04:36,240 –> 00:04:38,800
برابر
134
00:04:38,800 –> 00:04:42,479
مجموع i برابر با 0 تا n است و اکنون
135
00:04:42,479 –> 00:04:43,600
136
00:04:43,600 –> 00:04:46,240
y i می گیریم که مقدار واقعی است که
137
00:04:46,240 –> 00:04:49,199
در اینجا به دست می آوریم. نقطه y i است و
138
00:04:49,199 –> 00:04:51,440
این نقطه y است مقدار مقدار y
139
00:04:51,440 –> 00:04:54,320
این نقطه مقدار واقعی y i است و
140
00:04:54,320 –> 00:04:57,040
از آن
141
00:04:57,040 –> 00:04:58,240
142
00:04:58,240 –> 00:04:59,600
143
00:04:59,600 –> 00:05:02,080
برای مثال y i uh کلاه را کم می کنیم بنابراین این فقط
144
00:05:02,080 –> 00:05:04,000
مقدار پیش بینی شده است این مقدار
145
00:05:04,000 –> 00:05:04,800
در اینجا است
146
00:05:04,800 –> 00:05:06,720
و ما در واقع می توانیم حذف کنیم
147
00:05:06,720 –> 00:05:08,479
آن را با
148
00:05:08,479 –> 00:05:12,479
m ضربدر x به اضافه b جایگزین کنید
149
00:05:12,479 –> 00:05:14,479
تا خطا و ما باشد می توان آن را مربع
150
00:05:14,479 –> 00:05:17,440
کرد و آن میانگین مربعات
151
00:05:17,440 –> 00:05:19,199
خطا خواهد بود و ما می توانیم یک i را در اینجا اضافه کنیم
152
00:05:19,199 –> 00:05:21,840
تا کمی دقیق تر شود، بنابراین
153
00:05:21,840 –> 00:05:23,360
اگر قبلاً این را ندیده اید، این
154
00:05:23,360 –> 00:05:24,800
تابع خطای میانگین مربع نامیده می
155
00:05:24,800 –> 00:05:25,840
156
00:05:25,840 –> 00:05:27,440
شود، اشتباه نگیرید، واقعاً اینطور نیست.
157
00:05:27,440 –> 00:05:29,120
پیچیده است ممکن است پیچیده
158
00:05:29,120 –> 00:05:30,400
به نظر برسد زیرا ریاضی است و برای بسیاری از
159
00:05:30,400 –> 00:05:32,639
افراد ریاضیات فقط پیچیده به نظر می رسد، اما
160
00:05:32,639 –> 00:05:34,720
تمام کاری که ما در اینجا انجام می دهیم این است که این یک
161
00:05:34,720 –> 00:05:37,280
روش ریاضی برای نوشتن است که برای
162
00:05:37,280 –> 00:05:38,400
هر نقطه
163
00:05:38,400 –> 00:05:40,400
و n مقدار امتیاز برای هر
164
00:05:40,400 –> 00:05:43,039
نقطه از صفر است. نقطه صفر
165
00:05:43,039 –> 00:05:45,759
از اولین نقطه تا آخرین نقطه
166
00:05:45,759 –> 00:05:48,000
کاری که ما انجام می دهیم این است که مقدار y
167
00:05:48,000 –> 00:05:50,320
نقطه واقعی را به دست می آوریم بنابراین این مقدار y در اینجا یا
168
00:05:50,320 –> 00:05:52,800
این مقدار y اینجا یا این مقدار y در اینجا
169
00:05:52,800 –> 00:05:54,800
مقدار واقعی
170
00:05:54,800 –> 00:05:57,199
و از
171
00:05:57,199 –> 00:06:00,160
um موقعیت نقطه کم می کنیم. مقدار تابع y
172
00:06:00,160 –> 00:06:02,240
بنابراین اگر تابعی مانند این
173
00:06:02,240 –> 00:06:05,199
داشته باشیم، مقدار واقعی y را در اینجا و
174
00:06:05,199 –> 00:06:07,199
این مقدار y را در اینجا و این
175
00:06:07,199 –> 00:06:08,639
تفاوت است، بنابراین این چیزی است که ما
176
00:06:08,639 –> 00:06:10,880
به دست می آوریم و سپس آن
177
00:06:10,880 –> 00:06:13,280
اختلاف را مربع می کنیم و در پایان می توانیم این همه فاصله را بگیر
178
00:06:13,280 –> 00:06:15,919
تمام این فلش هایی که
179
00:06:15,919 –> 00:06:17,680
داریم و آنها را بر n تقسیم می کنیم
180
00:06:17,680 –> 00:06:20,080
که مقدار امتیاز است، بنابراین میانگین
181
00:06:20,080 –> 00:06:23,360
مربعات خطای میانگین
182
00:06:23,360 –> 00:06:25,280
مربع
183
00:06:25,280 –> 00:06:27,360
خطا را
184
00:06:27,360 –> 00:06:28,880
به دست می آوریم، بنابراین این کاری است که این تابع
185
00:06:28,880 –> 00:06:30,720
186
00:06:30,720 –> 00:06:32,479
انجام می دهد.
187
00:06:32,479 –> 00:06:35,280
نقاط و آنچه که تابع
188
00:06:35,280 –> 00:06:38,160
مقدار y مناسب را پیشبینی میکند،
189
00:06:38,160 –> 00:06:40,720
مربع آن اختلاف خواهد بود و آن را
190
00:06:40,720 –> 00:06:42,160
بر تعداد نقاطی که باید تقسیم کنیم تا
191
00:06:42,160 –> 00:06:44,080
میانگین مجذور خطا را بدست آوریم، این همان تابع خطایی
192
00:06:44,080 –> 00:06:45,600
است که ما سعی میکنیم در
193
00:06:45,600 –> 00:06:48,160
خطی بودن آن را به حداقل برسانیم. رگرسیون
194
00:06:48,160 –> 00:06:49,759
بسیار خوب است، بنابراین بخش بعدی در
195
00:06:49,759 –> 00:06:51,599
اینجا بسیار فنی و ریاضی خواهد بود،
196
00:06:51,599 –> 00:06:52,639
زیرا ما در مورد
197
00:06:52,639 –> 00:06:55,360
مشتقات جزئی در مورد حساب دیفرانسیل و انتگرال صحبت می کنیم، بنابراین
198
00:06:55,360 –> 00:06:57,039
اگر به آن علاقه ندارید
199
00:06:57,039 –> 00:06:59,120
یا اصلاً حساب دیفرانسیل و انتگرال را نمی فهمید، می
200
00:06:59,120 –> 00:07:01,919
توانید از آن صرف نظر کنید. به بخش کد نویسی
201
00:07:01,919 –> 00:07:03,680
مستقیماً آن را توصیه نمی کنم، زیرا حتی اگر
202
00:07:03,680 –> 00:07:05,120
همه چیز را درک نکنید،
203
00:07:05,120 –> 00:07:07,599
خوب است فقط
204
00:07:07,599 –> 00:07:09,280
آنچه را که در پشت صحنه اتفاق می افتد درک کنید یا گوش دهید، حتی
205
00:07:09,280 –> 00:07:11,360
اگر همه چیزها را درک نکنید. ریاضی
206
00:07:11,360 –> 00:07:13,280
اوم پس توصیه می کنم
207
00:07:13,280 –> 00:07:15,199
آن قسمت را نیز تماشا کنید اما ممکن است
208
00:07:15,199 –> 00:07:17,039
کمی خسته کننده باشد زیرا بسیار فنی
209
00:07:17,039 –> 00:07:18,880
و ریاضی است من شخصا فکر می کنم
210
00:07:18,880 –> 00:07:20,400
یکی از هیجان انگیزترین چیزها برای
211
00:07:20,400 –> 00:07:22,319
درک اینکه دقیقاً چه اتفاقی می افتد
212
00:07:22,319 –> 00:07:24,560
چگونه این بهینه سازی کار می کند است. میتوانم
213
00:07:24,560 –> 00:07:26,000
بفهمم اگر برخی از شما
214
00:07:26,000 –> 00:07:27,120
میگویند من نمیخواهم به آن گوش کنم، میخواهم
215
00:07:27,120 –> 00:07:29,039
به کدنویسی برسم، فقط به خاطر داشته باشید که
216
00:07:29,039 –> 00:07:30,560
به طور کامل متوجه نمیشوید که پشت صحنه چه اتفاقی میافتد،
217
00:07:30,560 –> 00:07:32,560
218
00:07:32,560 –> 00:07:35,280
پس بیایید وارد آن شویم.
219
00:07:35,280 –> 00:07:37,199
آن تابع خطایی را که
220
00:07:37,199 –> 00:07:39,919
میخواهیم کمترین e ممکن را
221
00:07:39,919 –> 00:07:41,759
برای خط خود به حداقل برسانیم، میخواهیم خطی را پیدا
222
00:07:41,759 –> 00:07:44,160
کنیم که کمترین e ممکن را به ما میدهد،
223
00:07:44,160 –> 00:07:45,840
بنابراین تنها چیزی که میتوانیم روی آن تأثیر بگذاریم
224
00:07:45,840 –> 00:07:46,879
m
225
00:07:46,879 –> 00:07:48,319
و b است
226
00:07:48,319 –> 00:07:50,160
، x فقط ورودی و y
227
00:07:50,160 –> 00:07:53,440
فقط خروجی است که میخواهیم m و b را پیدا
228
00:07:53,440 –> 00:07:56,319
کنیم تا بتوانیم e را که هدف ماست به حداقل برسانیم
229
00:07:56,319 –> 00:07:57,520
230
00:07:57,520 –> 00:07:59,919
و چگونه میتوانیم این کار را
231
00:07:59,919 –> 00:08:02,000
با گرفتن مشتق جزئی
232
00:08:02,000 –> 00:08:04,960
نسبت به m و با توجه به b انجام دهیم
233
00:08:04,960 –> 00:08:07,039
زیرا این کار به ما میدهد.
234
00:08:07,039 –> 00:08:09,199
جهت شیب دار صعودی است با توجه به m
235
00:08:09,199 –> 00:08:12,240
و b پس چگونه می توانیم m را به
236
00:08:12,240 –> 00:08:15,120
حداکثر e افزایش دهیم
237
00:08:15,120 –> 00:08:17,440
و چگونه می توانیم b را به حداکثر
238
00:08:17,440 –> 00:08:20,639
افزایش e تغییر دهیم اکنون ممکن است بگویید خوب
239
00:08:20,639 –> 00:08:23,199
آیا ما نمی خواستیم e را کاهش دهیم بله می
240
00:08:23,199 –> 00:08:25,280
خواستیم e را کاهش دهیم اما اگر شما فقط
241
00:08:25,280 –> 00:08:26,960
جهت مخالف را بگیرید، اگر
242
00:08:26,960 –> 00:08:29,280
جهت شیب دارترین صعود را دارید، می
243
00:08:29,280 –> 00:08:31,120
توانید در جهت مخالف بروید
244
00:08:31,120 –> 00:08:32,719
و جهت تندترین
245
00:08:32,719 –> 00:08:33,760
فرود را دارید،
246
00:08:33,760 –> 00:08:35,200
بنابراین این کاری است که ما می خواهیم انجام دهیم،
247
00:08:35,200 –> 00:08:37,039
مشتق جزئی را می گیریم.
248
00:08:37,039 –> 00:08:39,279
با توجه به m و b و سپس ما
249
00:08:39,279 –> 00:08:40,719
فقط به سمت مخالف
250
00:08:40,719 –> 00:08:42,640
این گرادیان
251
00:08:42,640 –> 00:08:43,839
می رویم، بنابراین می خواهیم بگوییم مشتق جزئی
252
00:08:43,839 –> 00:08:45,839
253
00:08:45,839 –> 00:08:48,399
e نسبت به
254
00:08:48,399 –> 00:08:51,839
m خواهد بود یا در واقع
255
00:08:51,839 –> 00:08:54,800
1 تقسیم بر n برابر است.
256
00:08:54,800 –> 00:08:57,519
i برابر است با 0
257
00:08:57,519 –> 00:08:59,600
به n و اکنون ما این مربع را در اینجا
258
00:08:59,600 –> 00:09:01,839
داریم، بنابراین می گوییم 2 برابر
259
00:09:01,839 –> 00:09:03,600
اینها فقط قانون اساسی حساب است،
260
00:09:03,600 –> 00:09:05,200
بنابراین اگر حساب دیفرانسیل و انتگرال را نمی
261
00:09:05,200 –> 00:09:06,560
دانید گیج نشوید، لازم نیست
262
00:09:06,560 –> 00:09:09,040
همه چیز را
263
00:09:09,040 –> 00:09:13,200
منهای m ضربدر x i به علاوه درک کنید. b و اکنون باید
264
00:09:13,200 –> 00:09:14,399
265
00:09:14,399 –> 00:09:16,240
با مشتق داخلی نیز ضرب کنیم
266
00:09:16,240 –> 00:09:19,279
که اساساً فقط این یک
267
00:09:19,279 –> 00:09:21,839
مجموع است، بنابراین ما فقط آن را نادیده می گیریم و این
268
00:09:21,839 –> 00:09:24,320
عاملی است که نتیجه آن
269
00:09:24,320 –> 00:09:25,360
منفی
270
00:09:25,360 –> 00:09:28,000
x i
271
00:09:28,240 –> 00:09:29,360
um است
272
00:09:29,360 –> 00:09:31,200
و اکنون می توانیم آن را با
273
00:09:31,200 –> 00:09:32,959
استخراج این دو و منفی ساده
274
00:09:32,959 –> 00:09:35,440
کنیم تا بتوانیم بگوییم خوب این چیزی نیست.
275
00:09:35,440 –> 00:09:36,640
اما فقط
276
00:09:36,640 –> 00:09:40,240
منهای 2 تقسیم بر n برابر
277
00:09:40,240 –> 00:09:42,480
مجموع i برابر است با 0
278
00:09:42,480 –> 00:09:43,760
تا n
279
00:09:43,760 –> 00:09:46,160
و سپس x i ضربدر
280
00:09:46,160 –> 00:09:47,360
281
00:09:47,360 –> 00:09:50,399
y i منهای m
282
00:09:50,399 –> 00:09:53,519
ضربدر x i
283
00:09:53,920 –> 00:09:56,560
به اضافه b به طوری که مشتق جزئی
284
00:09:56,560 –> 00:09:58,000
نسبت به m است
285
00:09:58,000 –> 00:10:00,399
حالا بیایید همین کار را برای b انجام دهیم،
286
00:10:00,399 –> 00:10:02,640
اساساً یکسان است، اما تفاوت این است
287
00:10:02,640 –> 00:10:05,040
که ما x i را نداریم زیرا
288
00:10:05,040 –> 00:10:07,120
در اینجا ما ضریب نداریم، بنابراین
289
00:10:07,120 –> 00:10:09,440
این در واقع همان چیزی است که
290
00:10:09,440 –> 00:10:10,880
291
00:10:10,880 –> 00:10:13,279
ما اساساً منفی
292
00:10:13,279 –> 00:10:15,279
2 تقسیم بر n
293
00:10:15,279 –> 00:10:18,279
برابر
294
00:10:18,560 –> 00:10:21,040
مجموع i به n داریم
295
00:10:21,040 –> 00:10:22,399
و سپس فقط
296
00:10:22,399 –> 00:10:24,320
y i منهای
297
00:10:24,320 –> 00:10:25,920
m
298
00:10:25,920 –> 00:10:28,560
ضربدر x i بعلاوه b
299
00:10:28,560 –> 00:10:30,640
همین است و این دو
300
00:10:30,640 –> 00:10:32,560
چیز جهت تندترین
301
00:10:32,560 –> 00:10:35,360
صعود را با توجه به m و b به
302
00:10:35,360 –> 00:10:38,320
ما می دهند و تنها کاری که اکنون باید انجام دهیم این است که باید به
303
00:10:38,320 –> 00:10:40,000
سمت مخالف برویم و این تنها کاری است که
304
00:10:40,000 –> 00:10:43,200
باید انجام دهیم. اگر بخواهیم m
305
00:10:43,200 –> 00:10:45,440
و b را بهبود ببخشیم تنها کاری که باید انجام دهیم این است که e در هر
306
00:10:45,440 –> 00:10:46,959
تکرار می
307
00:10:46,959 –> 00:10:49,760
گوییم m فعلی را بگیرید و کاری که شما انجام می دهید این است
308
00:10:49,760 –> 00:10:51,760
309
00:10:51,760 –> 00:10:54,320
که جریان فعلی را به آن اختصاص می دهید یا m جدید
310
00:10:54,320 –> 00:10:57,120
را انتخاب می کنید.
311
00:10:57,120 –> 00:10:58,560
312
00:10:58,560 –> 00:11:00,079
313
00:11:00,079 –> 00:11:01,600
314
00:11:01,600 –> 00:11:02,720
315
00:11:02,720 –> 00:11:06,800
برابر جهت تندترین صعود،
316
00:11:06,800 –> 00:11:08,640
بنابراین
317
00:11:08,640 –> 00:11:09,920
اساساً
318
00:11:09,920 –> 00:11:11,360
e
319
00:11:11,360 –> 00:11:14,800
و m و همان b b برابر با b
320
00:11:14,800 –> 00:11:16,880
منهای l است.
321
00:11:16,880 –> 00:11:18,640
322
00:11:18,640 –> 00:11:20,560
323
00:11:20,560 –> 00:11:22,160
324
00:11:22,160 –> 00:11:23,680
325
00:11:23,680 –> 00:11:25,680
326
00:11:25,680 –> 00:11:27,040
327
00:11:27,040 –> 00:11:29,839
بیشترین خطا، بنابراین
328
00:11:29,839 –> 00:11:31,360
کاری که ما انجام می دهیم این است که ما فقط
329
00:11:31,360 –> 00:11:33,600
جهت مخالف را می رویم و با هر
330
00:11:33,600 –> 00:11:35,760
تکرار این کار را انجام می دهیم زیرا به درستی تغییر می کند، بنابراین
331
00:11:35,760 –> 00:11:37,760
گاهی اوقات در این
332
00:11:37,760 –> 00:11:39,440
جهت شیب دارترین نزول خواهد بود،
333
00:11:39,440 –> 00:11:41,279
سپس در جهت دیگر و دوباره
334
00:11:41,279 –> 00:11:42,720
در جهت دیگر، به خصوص اگر
335
00:11:42,720 –> 00:11:44,640
ما فقط با دو متغیر سر و کار نداریم، بلکه
336
00:11:44,640 –> 00:11:46,800
با بسیاری از متغیرهای مختلف
337
00:11:46,800 –> 00:11:51,120
این کار را فقط با نمره uh انجام نمی دهیم و با
338
00:11:51,120 –> 00