در این مطلب، ویدئو آموزش یادگیری ماشین پایتون – 17: منظم سازی L1 و L2 | کمند، رگرسیون ریج با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:19:21
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,320 –> 00:00:02,240
overfitting یک مسئله بسیار رایج
2
00:00:02,240 –> 00:00:04,000
در زمینه یادگیری ماشینی است
3
00:00:04,000 –> 00:00:07,839
و منظمسازی l1 و l2
4
00:00:07,839 –> 00:00:09,760
برخی از تکنیکهایی هستند که میتوان
5
00:00:09,760 –> 00:00:12,160
برای رفع مشکل اضافه برازش استفاده کرد،
6
00:00:12,160 –> 00:00:14,320
در این ویدیو به بررسی برخی تئوریها
7
00:00:14,320 –> 00:00:17,440
در مورد اینکه دقیقاً منظمسازی l1 l2 چیست خواهیم پرداخت
8
00:00:17,440 –> 00:00:20,480
و سپس ما یک کد پایتون
9
00:00:20,480 –> 00:00:22,960
مینویسیم و خواهیم دید که چگونه میتوان به مدلی که
10
00:00:22,960 –> 00:00:24,240
بیش از حد
11
00:00:24,240 –> 00:00:26,880
تناسب دارد رسیدگی کرد و دقت را
12
00:00:26,880 –> 00:00:27,680
بهبود بخشید
13
00:00:27,680 –> 00:00:30,320
وقتی از تنظیم l1 و l2
14
00:00:30,320 –> 00:00:31,599
استفاده میکنید، ما
15
00:00:31,599 –> 00:00:33,600
از مجموعه داده قیمت مسکن از شهر استفاده خواهیم کرد
16
00:00:33,600 –> 00:00:35,520
. ملبورن و
17
00:00:35,520 –> 00:00:37,200
ابتدا یک مدل با استفاده از یک
18
00:00:37,200 –> 00:00:38,960
رگرسیون خطی ساده میسازیم و خواهیم دید
19
00:00:38,960 –> 00:00:40,480
که مدل بیش از حد برازش میکند
20
00:00:40,480 –> 00:00:42,559
و سپس از منظمسازی l1 و l2 استفاده
21
00:00:42,559 –> 00:00:44,559
میکنیم و خواهیم دید
22
00:00:44,559 –> 00:00:46,239
که چگونه آن مشکل بیشبرازش را برطرف میکنیم
23
00:00:46,239 –> 00:00:48,559
و چگونه آن را بهبود میبخشد.
24
00:00:48,559 –> 00:00:51,440
در مجموعه آزمایشی ما امتیاز بگیرید، بنابراین بیایید
25
00:00:51,440 –> 00:00:52,879
شروع
26
00:00:52,879 –> 00:00:54,480
کنیم، فرض کنید میخواهید
27
00:00:54,480 –> 00:00:56,320
تعداد مسابقاتی را
28
00:00:56,320 –> 00:00:59,440
که بر اساس سن انجام میشوند پیشبینی کنید، معمولاً
29
00:00:59,440 –> 00:01:02,719
وقتی بازیکن پیر میشود،
30
00:01:02,719 –> 00:01:04,400
هر ورزشکار یا ورزشکاری
31
00:01:04,400 –> 00:01:08,000
که پیر میشود، مسابقات یک نوع کاهش میدهد تا
32
00:01:08,000 –> 00:01:10,400
بتوانید آن را انجام دهید. نوع توزیعی
33
00:01:10,400 –> 00:01:11,280
که در آن
34
00:01:11,280 –> 00:01:15,280
می توان یک مدل ساخت، می توانید یک
35
00:01:15,280 –> 00:01:17,439
مدل رگرسیون خطی ساده ایجاد کنید و معادله
36
00:01:17,439 –> 00:01:18,960
ممکن است به این شکل باشد،
37
00:01:18,960 –> 00:01:21,280
بنابراین مطابقت های 1 تتا 0 به اضافه تتا
38
00:01:21,280 –> 00:01:22,560
1 و به h خواهد بود،
39
00:01:22,560 –> 00:01:24,400
بنابراین تتا 0 و تتا 1 فقط یک
40
00:01:24,400 –> 00:01:26,400
ثابت هستند، این یک عدد است. معمولی
41
00:01:26,400 –> 00:01:30,159
اوه خطی مانند معادله خطی ساده
42
00:01:30,159 –> 00:01:33,520
اما می بینید که این خط
43
00:01:33,520 –> 00:01:35,520
واقعاً تمام
44
00:01:35,520 –> 00:01:37,600
نقاط داده را به دقت توصیف نمی کند و سعی می کند بهترین
45
00:01:37,600 –> 00:01:38,320
تناسب
46
00:01:38,320 –> 00:01:40,720
را از نظر یک خط مستقیم پیدا کند اما می بینید که
47
00:01:40,720 –> 00:01:42,159
همه این نقاط داده به نوعی از
48
00:01:42,159 –> 00:01:43,759
بین می روند و سپس اگر نقاط داده آزمایشی دارید
49
00:01:43,759 –> 00:01:45,759
که در جایی در اینجا قرار دارند،
50
00:01:45,759 –> 00:01:47,520
این یک نمایش خیلی
51
00:01:47,520 –> 00:01:49,280
دقیق از توزیع داده ما نیست،
52
00:01:49,280 –> 00:01:52,880
می توانید
53
00:01:52,880 –> 00:01:54,640
توزیعی بسازید که ممکن است
54
00:01:54,640 –> 00:01:56,000
شبیه این باشد،
55
00:01:56,000 –> 00:01:58,159
بنابراین در اینجا ما سعی می کنیم خطی را ترسیم کنیم
56
00:01:58,159 –> 00:02:00,479
که دقیقاً از آن عبور می کند.
57
00:02:00,479 –> 00:02:03,280
تمام نقاط داده ما و در این صورت
58
00:02:03,280 –> 00:02:04,320
معادله شما
59
00:02:04,320 –> 00:02:07,520
ممکن است به این شکل باشد، بنابراین یک
60
00:02:07,520 –> 00:02:08,639
61
00:02:08,639 –> 00:02:12,239
معادله چند جمله ای مرتبه بالاتر است که در آن
62
00:02:12,239 –> 00:02:14,319
شما سعی می کنید بفهمید که
63
00:02:14,319 –> 00:02:15,599
مطابقت بر اساس
64
00:02:15,599 –> 00:02:19,200
سن یک سال است. یک نفر، اما
65
00:02:19,200 –> 00:02:22,879
مشکل اینجاست که این معادله
66
00:02:22,879 –> 00:02:26,160
واقعاً پیچیده است، خط یک
67
00:02:26,160 –> 00:02:27,599
خط از نوع زیگزاگی است که فقط
68
00:02:27,599 –> 00:02:28,480
از
69
00:02:28,480 –> 00:02:31,280
تمام نقاط داده می گذرد و حالا اگر
70
00:02:31,280 –> 00:02:33,920
چند نقطه داده کلی در بالای صفحه داشته باشید،
71
00:02:33,920 –> 00:02:37,040
دوباره اینجا این به معنای تعمیم نیست.
72
00:02:37,040 –> 00:02:39,200
توزیع واقعاً خوب چه
73
00:02:39,200 –> 00:02:41,360
بهتر این است که اگر خطی شبیه به این داشته باشید،
74
00:02:41,360 –> 00:02:45,280
پس این تعادل بین
75
00:02:45,280 –> 00:02:47,360
این دو موردی است که قبلاً دیدیم،
76
00:02:47,360 –> 00:02:50,319
بنابراین می توانید بدانید که فقط تتا 2
77
00:02:50,319 –> 00:02:50,959
در یک
78
00:02:50,959 –> 00:02:54,080
مربع است که خط مانند یک منحنی خواهد بود
79
00:02:54,080 –> 00:02:57,680
و می تواند داده های شما را به
80
00:02:57,680 –> 00:02:59,519
خوبی تعمیم دهد تا فردا اگر نقطه داده جدیدی
81
00:02:59,519 –> 00:03:00,800
در
82
00:03:00,800 –> 00:03:03,120
این معادله بیاید بتواند
83
00:03:03,120 –> 00:03:04,720
پیش بینی بهتری برای شما انجام
84
00:03:04,720 –> 00:03:06,480
دهد بنابراین حالت اول تحت
85
00:03:06,480 –> 00:03:08,319
برازش نامیده می شود حالت دوم بیش
86
00:03:08,319 –> 00:03:09,840
برازش و حالت سوم
87
00:03:09,840 –> 00:03:10,720
تعادل فیت نامیده می
88
00:03:10,720 –> 00:03:12,319
شود. شما در اینجا به نوعی ایده ای در مورد تطبیق بیش از حد پیدا می
89
00:03:12,319 –> 00:03:15,120
کنید، جایی که
90
00:03:15,120 –> 00:03:18,239
اگر سعی کنید
91
00:03:18,239 –> 00:03:20,319
تمرین را بیش از حد اجرا کنید و سعی کنید بیش از
92
00:03:20,319 –> 00:03:22,239
حد به مجموعه داده های تمرینی خود تناسب داشته
93
00:03:22,239 –> 00:03:24,480
باشید، در آن صورت با
94
00:03:24,480 –> 00:03:26,799
مجموعه داده های تست آزمایشی مشکل خواهید داشت.
95
00:03:26,799 –> 00:03:30,319
نقاط داده جدید خود را مشخص کنید، اوه ممکن است
96
00:03:30,319 –> 00:03:32,239
پیش بینی بهتری انجام ندهد، بنابراین اکنون اگر از همه این معادلات و همه چیز نمی دانید، همیشه
97
00:03:32,239 –> 00:03:33,840
باید تعادل را بین
98
00:03:33,840 –> 00:03:37,920
این دو حالت شدید حفظ کنید،
99
00:03:37,920 –> 00:03:40,239
100
00:03:40,239 –> 00:03:41,599
101
00:03:41,599 –> 00:03:44,959
لطفاً به آموزش های رگرسیون خطی من مراجعه کنید.
102
00:03:44,959 –> 00:03:46,480
103
00:03:46,480 –> 00:03:48,720
همان لیست پخشی که من داشتم چند
104
00:03:48,720 –> 00:03:50,640
ویدیو در مورد رگرسیون خطی پست کرده بودم،
105
00:03:50,640 –> 00:03:52,720
بنابراین باید تماشا کنید که این
106
00:03:52,720 –> 00:03:54,159
یک پیش نیاز است
107
00:03:54,159 –> 00:03:57,120
حالا چگونه میتوانید بیشبرازش را کاهش دهید، بنابراین
108
00:03:57,120 –> 00:03:59,040
در اینجا خط اضافه من به همراه
109
00:03:59,040 –> 00:04:00,239
معادله وجود دارد
110
00:04:00,239 –> 00:04:03,599
و اگر در این معادله به نحوی
111
00:04:03,599 –> 00:04:06,080
مطمئن شوم که تتا 0 من است. و تتا 4
112
00:04:06,080 –> 00:04:08,080
تقریباً نزدیک به 0 است،
113
00:04:08,080 –> 00:04:10,799
پس من معادله ای مانند این را دریافت خواهم کرد، بنابراین
114
00:04:10,799 –> 00:04:11,840
فقط در مورد آن فکر کنید
115
00:04:11,840 –> 00:04:15,519
اگر تتا 3 و تتا 4 تقریباً نزدیک
116
00:04:15,519 –> 00:04:16,320
به 0
117
00:04:16,320 –> 00:04:17,918
باشد، شما به نوعی کل این
118
00:04:17,918 –> 00:04:19,918
عامل را رد می کنید و سپس
119
00:04:19,918 –> 00:04:22,800
می توانید این نوع را ایجاد کنید.
120
00:04:22,800 –> 00:04:23,680
بنابراین ایده در اینجا
121
00:04:23,680 –> 00:04:26,240
این است که پارامترهای خود را کوچک کنید پارامترهای خود را
122
00:04:26,240 –> 00:04:28,160
که تتا 0
123
00:04:28,160 –> 00:04:31,199
تتا 3 تتا 4 است حتی تتا 2 تتا 1 اگر
124
00:04:31,199 –> 00:04:32,000
بتوانید
125
00:04:32,000 –> 00:04:34,400
این پارامتر را کاهش دهید اگر بتوانید
126
00:04:34,400 –> 00:04:36,000
این پارامترها را
127
00:04:36,000 –> 00:04:39,199
کوچکتر نگه دارید، می توانید بهتر به دست آورید.
128
00:04:39,199 –> 00:04:41,919
معادله برای تابع پیش بینی شما
129
00:04:41,919 –> 00:04:42,720
130
00:04:42,720 –> 00:04:45,759
اکنون چگونه انجام دهیم که
131
00:04:45,759 –> 00:04:47,759
قبلاً در ویدیوی رگرسیون خطی خود دیدیم
132
00:04:47,759 –> 00:04:49,120
که
133
00:04:49,120 –> 00:04:52,080
اوم میانگین مربعات خطا را محاسبه می کنیم بنابراین
134
00:04:52,080 –> 00:04:53,680
وقتی تمرین را اجرا می
135
00:04:53,680 –> 00:04:56,400
کنیم ابتدا نمونه را پاس می کنیم و سپس
136
00:04:56,400 –> 00:04:57,199
y
137
00:04:57,199 –> 00:04:59,759
پیش بینی شده را بر روی برخی
138
00:04:59,759 –> 00:05:00,720
وزن های اولیه تصادفی محاسبه می
139
00:05:00,720 –> 00:05:02,720
کنیم سپس آن را با هم مقایسه می کنیم. با مقدار صدق
140
00:05:02,720 –> 00:05:04,479
و سپس به این صورت است که ما آن را
141
00:05:04,479 –> 00:05:08,560
محاسبه میانگین مربع خطا می نامیم یا m s e
142
00:05:08,560 –> 00:05:11,680
در اینجا y پیش بینی کننده در واقع
143
00:05:11,680 –> 00:05:14,880
h تتا x i است که در آن تتا x i می تواند
144
00:05:14,880 –> 00:05:17,520
معادله چند جمله ای مرتبه بالاتر باشد مانند
145
00:05:17,520 –> 00:05:18,240
این
146
00:05:18,240 –> 00:05:22,160
خوب و x 1 x 2 چیزی نیست جز
147
00:05:22,160 –> 00:05:24,880
این ویژگی شماست. بنابراین در مورد ما
148
00:05:24,880 –> 00:05:25,680
149
00:05:25,680 –> 00:05:27,840
سن یک فرد خواهد بود اگر به
150
00:05:27,840 –> 00:05:29,600
پیش بینی قیمت مسکن فکر می کنید
151
00:05:29,600 –> 00:05:30,240
152
00:05:30,240 –> 00:05:34,080
، اندازه خانه خواهد بود، اکنون
153
00:05:34,080 –> 00:05:38,639
فقط فکر کنید که در
154
00:05:38,639 –> 00:05:40,560
تابع خطای میانگین مربع خود، بنابراین در طول آموزش از
155
00:05:40,560 –> 00:05:42,479
این تابع خطای میانگین مربع
156
00:05:42,479 –> 00:05:45,039
استفاده می کنیم. و ما می خواهیم
157
00:05:45,039 –> 00:05:47,360
مقدار
158
00:05:47,360 –> 00:05:50,400
این خطا را که می دانید در هر تکرار به حداقل برسانیم، بنابراین
159
00:05:50,400 –> 00:05:53,440
در این معادله چه می شود
160
00:05:53,440 –> 00:05:56,080
اگر این پارامتر خاص را اضافه کنم، پس این چیست
161
00:05:56,080 –> 00:05:56,880
،
162
00:05:56,880 –> 00:05:58,639
بنابراین این لامبدا وجود دارد که یک پارامتر رایگان است
163
00:05:58,639 –> 00:06:00,720
که می توانید آن را کنترل کنید، مانند یک
164
00:06:00,720 –> 00:06:04,240
دکمه تنظیم است و
165
00:06:04,240 –> 00:06:07,039
شما در حال ساخت یک مربع از هر یک از این
166
00:06:07,039 –> 00:06:08,960
پارامترهای تتا هستید،
167
00:06:08,960 –> 00:06:13,120
بنابراین اگر تتا شما بزرگتر شود
168
00:06:13,120 –> 00:06:15,360
این مقدار بزرگتر
169
00:06:15,360 –> 00:06:16,639
می شود،
170
00:06:16,639 –> 00:06:20,080
می دانید که خطا بزرگ می شود و
171
00:06:20,080 –> 00:06:22,720
مدل شما همگرا نمی شود. بنابراین، اساساً
172
00:06:22,720 –> 00:06:24,080
کاری که شما انجام می دهید این است
173
00:06:24,080 –> 00:06:26,479
که مقادیر بالاتر
174
00:06:26,479 –> 00:06:27,759
تتا را در اینجا جریمه می کنید،
175
00:06:27,759 –> 00:06:29,680
بنابراین هر زمان که مدل سعی می کند
176
00:06:29,680 –> 00:06:31,039
مقدار تتا را بالاتر
177
00:06:31,039 –> 00:06:33,039
ببرد، در اینجا یک پنالتی اضافه می کنید، بنابراین با
178
00:06:33,039 –> 00:06:34,319
اضافه کردن این
179
00:06:34,319 –> 00:06:37,440
پنالتی مطمئن می شوید که مقدار تتا شما
180
00:06:37,440 –> 00:06:38,560
نیز بالا نمی رود.
181
00:06:38,560 –> 00:06:42,479
بالا، بنابراین آنها بسیار کوچک خواهند ماند،
182
00:06:42,479 –> 00:06:45,120
شما می توانید این مورد را با استفاده از
183
00:06:45,120 –> 00:06:47,360
این پارامتر لامبدا در اینجا تنظیم کنید
184
00:06:47,360 –> 00:06:49,280
و اگر این را بزرگتر کنید،
185
00:06:49,280 –> 00:06:50,479
مقدار تتا حتی
186
00:06:50,479 –> 00:06:52,800
کوچکتر و کوچکتر می شود، می دانید و
187
00:06:52,800 –> 00:06:54,880
اگر این مقدار را کوچکتر از تتا دریافت کنید، می تواند
188
00:06:54,880 –> 00:06:56,000
بزرگتر
189
00:06:56,000 –> 00:06:58,560
شود. تنظیم l2 نامیده می
190
00:06:58,560 –> 00:06:59,440
شود
191
00:06:59,440 –> 00:07:01,759
زیرا ما از مربع استفاده می کنیم و در
192
00:07:01,759 –> 00:07:03,360
منظم سازی l1 شما از
193
00:07:03,360 –> 00:07:05,039
مقدار مطلق استفاده می کنید بنابراین این تنها
194
00:07:05,039 –> 00:07:07,039
تفاوت بین l1 و l2 است
195
00:07:07,039 –> 00:07:09,759
که در l1 شما از v مطلق استفاده می کنید.
196
00:07:09,759 –> 00:07:11,280
197
00:07:11,280 –> 00:07:14,880
اگر تتا بزرگتر باشد مجدداً اگر تتا بزرگتر باشد
198
00:07:14,880 –> 00:07:18,160
خطای کلی بزرگ است و
199
00:07:18,160 –> 00:07:21,520
به نوعی به عنوان جریمه عمل می کند به طوری که
200
00:07:21,520 –> 00:07:24,160
در طول تمرین شما مقدار
201
00:07:24,160 –> 00:07:25,280
کلی تتا
202
00:07:25,280 –> 00:07:27,199
کوچکتر می ماند و دوباره به این معادله باز می گردیم
203
00:07:27,199 –> 00:07:29,680
204
00:07:29,680 –> 00:07:32,080
که این مقادیر کوچکتر می شوند.
205
00:07:32,080 –> 00:07:33,280
شما با یک
206
00:07:33,280 –> 00:07:35,360
معادله سادهتر میدانید که
207
00:07:35,360 –> 00:07:36,720
آن را واقعاً پیچیده نمیکنید
208
00:07:36,720 –> 00:07:39,440
و معادلات سادهتر بهترین گزینه برای
209
00:07:39,440 –> 00:07:41,039
نشان دادن
210
00:07:41,039 –> 00:07:43,440
حالت عمومی پیشبینی شما هستند،
211
00:07:43,440 –> 00:07:45,360
بنابراین بیایید اکنون برای کدنویسی وارد شویم
212
00:07:45,360 –> 00:07:48,400
که من از دادههای قیمت مسکن استفاده میکنم.
213
00:07:48,400 –> 00:07:51,520
مجموعه ای برای شهر ملبورن من این
214
00:07:51,520 –> 00:07:52,319
مجموعه داده را از
215
00:07:52,319 –> 00:07:55,199
kegel گرفتم و می خواهیم یک
216
00:07:55,199 –> 00:07:57,120
مدل رگرسیون خطی بسازیم تا بتوانید ببینید
217
00:07:57,120 –> 00:07:58,560
که ویژگی های مختلفی مانند
218
00:07:58,560 –> 00:07:59,759
اتاق
219
00:07:59,759 –> 00:08:03,199
و فاصله کد پستی ماشین حمام
220
00:08:03,199 –> 00:08:06,800
و غیره وجود دارد و در دفترچه یادداشت من می روم
221
00:08:06,800 –> 00:08:07,680
222
00:08:07,680 –> 00:08:11,120
طبق معمول، ابتدا
223
00:08:11,120 –> 00:08:14,240
این مجموعه داده را وارد کنید
224
00:08:14,240 –> 00:08:17,840
و فقط آن را مجموعه داده بنامید،
225
00:08:17,840 –> 00:08:22,319
می دانید، بنابراین من اکنون این
226
00:08:22,319 –> 00:08:25,680
را به قاب داده خود وارد کردم و قاب داده
227
00:08:25,680 –> 00:08:26,160
228
00:08:26,160 –> 00:08:29,199
خوب به نظر می رسد، من قصد دارم مقداری
229
00:08:29,199 –> 00:08:32,479
کاوش در فریم داده خود انجام دهم e now و به نوعی
230
00:08:32,479 –> 00:08:32,880
231
00:08:32,880 –> 00:08:36,799
val مقادیر منحصربهفرد um را در مجموعه دادهها چاپ کنید، بنابراین
232
00:08:36,799 –> 00:08:39,279
میبینید که 351 حومه
233
00:08:39,279 –> 00:08:41,839
این تعداد آدرس و غیره وجود دارد، همچنین اگر
234
00:08:41,839 –> 00:08:42,640
235
00:08:42,640 –> 00:08:47,360
به شکل مجموعه داده نگاه کنید،
236
00:08:48,399 –> 00:08:51,360
سه چهار هشت مبارزه و پنج
237
00:08:51,360 –> 00:08:52,720
هفت
238
00:08:52,720 –> 00:08:57,040
رکورد Uh وجود دارد. در مجموع 21 ستون
239
00:08:57,040 –> 00:09:00,320
اکنون می خواهم برخی از ستون ها را کنار بگذارم،
240
00:09:00,320 –> 00:09:03,839
من فقط مشاهده بصری انجام دادم و
241
00:09:03,839 –> 00:09:06,880
ستون های خاصی را که فکر نمی
242
00:09:06,880 –> 00:09:11,120
کنم خیلی مفید باشند حذف کردم،
243
00:09:11,120 –> 00:09:14,800
به عنوان مثال تاریخ درست است، بنابراین تاریخ