در این مطلب، ویدئو آموزش یادگیری ماشین پایتون شماره 6 – KNN p.2 – چگونه K Nearest Neighbors کار می کند؟ با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:38
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:01,650
سلام و به یک آموزش یادگیری ماشینی دیگر خوش آمدید،
2
00:00:01,650 –> 00:00:03,899
بنابراین در
3
00:00:03,899 –> 00:00:05,330
ویدیوی امروز ما
4
00:00:05,330 –> 00:00:07,770
پیاده سازی الگوریتم k-nearest now همسایه ها
5
00:00:07,770 –> 00:00:09,780
را انجام خواهیم داد، اما قبل از انجام این کار،
6
00:00:09,780 –> 00:00:11,610
دقیقاً در مورد نحوه عملکرد آن
7
00:00:11,610 –> 00:00:15,240
در ریاضیات صحبت خواهم کرد و بله، پس اگر شما
8
00:00:15,240 –> 00:00:16,379
بچه ها علاقه مند به یادگیری در مورد
9
00:00:16,379 –> 00:00:18,060
نحوه کار این هستید، لطفاً کل
10
00:00:18,060 –> 00:00:19,560
ویدیو را تماشا کنید و سپس نزدیک به انتهای آن جایی است که من آن
11
00:00:19,560 –> 00:00:20,730
را پیاده سازی می کنم زیرا پیاده سازی آن زمان زیادی نمی برد
12
00:00:20,730 –> 00:00:22,199
، اما اگر شما
13
00:00:22,199 –> 00:00:23,220
بچه ها بیشتر به کد علاقه مند هستید،
14
00:00:23,220 –> 00:00:24,779
میتوانید به نسخه مبتنی بر
15
00:00:24,779 –> 00:00:26,730
متن در Tech with Tim net نگاه کنید، جایی
16
00:00:26,730 –> 00:00:28,410
که من همچنین میخواهم توضیحاتی درباره
17
00:00:28,410 –> 00:00:29,580
آنچه در حال وقوع است و تمام کدهایی که
18
00:00:29,580 –> 00:00:31,800
مینویسم داشته باشم یا فقط میتوانید به جلو به
19
00:00:31,800 –> 00:00:32,910
داخل ویدیو بروید تا زمانی که ببینید که من
20
00:00:32,910 –> 00:00:34,380
من نقاشی را تمام کردم، نمی دانم چقدر طول
21
00:00:34,380 –> 00:00:36,360
می کشد تا توضیح دهم، زیرا
22
00:00:36,360 –> 00:00:37,680
کمی پیچیده تر از رگرسیون خطی است،
23
00:00:37,680 –> 00:00:39,660
اما دوباره آنقدرها هم
24
00:00:39,660 –> 00:00:43,200
سخت نیست، بنابراین بیایید در مورد الگوریتم K
25
00:00:43,200 –> 00:00:45,090
نزدیکترین همسایه ها صحبت کنیم و این کار چگونه انجام می شود.
26
00:00:45,090 –> 00:00:45,719
rk
27
00:00:45,719 –> 00:00:47,910
خوب همانطور که ما قبلاً می دانیم K نزدیکترین
28
00:00:47,910 –> 00:00:50,250
همسایه یک الگوریتم طبقه بندی است
29
00:00:50,250 –> 00:00:52,260
و به روشی که کار می کند یک
30
00:00:52,260 –> 00:00:53,760
نقطه داده داده می شود بنابراین لایک ها ممکن است چیزی
31
00:00:53,760 –> 00:00:55,590
شبیه به این باشد. سعی می کند این
32
00:00:55,590 –> 00:00:58,410
نقطه داده را با یکی از کلاس هایی
33
00:00:58,410 –> 00:01:00,690
که می داند طبقه بندی کند. سه
34
00:01:00,690 –> 00:01:04,379
کلاس ما به خوبی قرمز هستند، ما سبز
35
00:01:04,379 –> 00:01:07,170
داریم و آبی داریم، حالا بدیهی است که
36
00:01:07,170 –> 00:01:09,240
اینها به احتمال زیاد
37
00:01:09,240 –> 00:01:11,520
چیزی را نشان می دهند، اما برای موارد ما فقط
38
00:01:11,520 –> 00:01:12,540
از رنگ ها استفاده می کنیم زیرا به نوعی
39
00:01:12,540 –> 00:01:14,520
به راحتی قابل مشاهده است و این مشکی به
40
00:01:14,520 –> 00:01:16,080
خوبی سوال ما خواهد بود. علامت گذاری کنید زیرا ما نمی
41
00:01:16,080 –> 00:01:18,570
دانیم چه کلاسیکی را می خواهیم
42
00:01:18,570 –> 00:01:21,600
پیش بینی کنیم، بنابراین روشی که ما
43
00:01:21,600 –> 00:01:23,790
این نقطه را پیش بینی می کنیم اساساً به دنبال
44
00:01:23,790 –> 00:01:26,970
گروه بندی نقاط داده می گردیم تا
45
00:01:26,970 –> 00:01:28,619
بتوانید ببینید و من فقط این چیزی نیست
46
00:01:28,619 –> 00:01:29,850
که الگوریتم انجام می دهد. این کاری است که
47
00:01:29,850 –> 00:01:33,119
ما بهعنوان انسان انجام میدهیم، خب،
48
00:01:33,119 –> 00:01:35,070
ما گروههایی را درست میبینیم، بنابراین این گروه
49
00:01:35,070 –> 00:01:37,110
قرمز را میبینیم، این گروه آبی را میبینیم،
50
00:01:37,110 –> 00:01:38,640
این گروه سبز را میبینیم و اگر از شما
51
00:01:38,640 –> 00:01:40,530
خوب بپرسم این نقطه سیاه بیشتر به کجا تعلق دارد.
52
00:01:40,530 –> 00:01:43,560
به احتمال زیاد شما دوست دارید احتمالاً درست میگویم قرمز
53
00:01:43,560 –> 00:01:46,079
یا آبی چون نزدیکترین
54
00:01:46,079 –> 00:01:48,119
رنگ به آبی یا قرمز است، من میتوانم بگویم به قرمز نزدیکتر است
55
00:01:48,119 –> 00:01:51,030
و اینجاست که ممکن است بگویید که
56
00:01:51,030 –> 00:01:53,040
این متعلق به شماست ممکن است بگویید متعلق به
57
00:01:53,040 –> 00:01:55,140
قرمز است، زیرا نزدیکترین رنگ به آن است، بنابراین
58
00:01:55,140 –> 00:01:56,939
منطقی است اگر این دقیقاً یک رنگ قرمز
59
00:01:56,939 –> 00:01:59,549
است و این دقیقاً همان کاری است که
60
00:01:59,549 –> 00:02:02,820
الگوریتم ما اکنون انجام می دهد. او کمی
61
00:02:02,820 –> 00:02:04,770
پیشرفته تر از این کار می کند اما اساساً
62
00:02:04,770 –> 00:02:06,270
به دنبال نوعی گروه بندی از
63
00:02:06,270 –> 00:02:07,829
نقاط داده است و من به شما نشان خواهم داد که
64
00:02:07,829 –> 00:02:10,080
چگونه کار می کند اما و سپس
65
00:02:10,080 –> 00:02:13,770
نزدیکترین نقطه به این مشکی را
66
00:02:13,770 –> 00:02:15,990
دقیقاً در اینجا انتخاب میکند و میگوید خوب است، بنابراین
67
00:02:15,990 –> 00:02:19,710
اکنون به آن کلاس تبدیل میشود.
68
00:02:19,710 –> 00:02:21,480
69
00:02:21,480 –> 00:02:24,060
70
00:02:24,060 –> 00:02:26,340
71
00:02:26,340 –> 00:02:28,830
از همسایگانی که میخواهیم به دنبال آنها بگردیم،
72
00:02:28,830 –> 00:02:30,390
بنابراین من فقط یک مثال با
73
00:02:30,390 –> 00:02:32,910
K برابر با سه انجام میدهم و
74
00:02:32,910 –> 00:02:36,120
دقیقاً آنچه را که اتفاق میافتد بررسی میکنم، بنابراین با توجه به نقطه داده سیاه ما
75
00:02:36,120 –> 00:02:38,370
در اینجا خوب است و میدانید
76
00:02:38,370 –> 00:02:39,510
که در واقع اجازه دهید آن را برای
77
00:02:39,510 –> 00:02:42,240
مثال اول منتقل کنیم. نوعی بودن درک راحت تر است
78
00:02:42,240 –> 00:02:43,380
خوب، من فقط آن را به اینجا منتقل می
79
00:02:43,380 –> 00:02:46,290
کنم اگر این پارامتر را به عنوان
80
00:02:46,290 –> 00:02:47,550
K برابر سه داشته
81
00:02:47,550 –> 00:02:49,230
باشیم، به این معنی است که ما در واقع به دنبال
82
00:02:49,230 –> 00:02:52,590
سه همسایه به این نقطه سیاه
83
00:02:52,590 –> 00:02:54,330
خواهیم بود، بنابراین سه
84
00:02:54,330 –> 00:02:57,150
نقطه نزدیک از همه را پیدا می کنیم. این داده ها را به این
85
00:02:57,150 –> 00:03:00,120
نقطه سیاه نشان می دهد، بنابراین من استدلال می کنم که
86
00:03:00,120 –> 00:03:02,220
آن نقاط احتمالاً همین
87
00:03:02,220 –> 00:03:03,930
سه نقطه هستند، درست مانند مواردی که من
88
00:03:03,930 –> 00:03:05,640
فقط نقاط سیاه را روی این سه نقطه قرمز قرار دادم خوب،
89
00:03:05,640 –> 00:03:09,330
حالا وقتی این سه نقطه را پیدا کرد، این
90
00:03:09,330 –> 00:03:11,760
نقاط
91
00:03:11,760 –> 00:03:14,010
رای خواهند داشت. و اساساً برنامه ما این است
92
00:03:14,010 –> 00:03:15,810
که این نقاط چه کلاسی
93
00:03:15,810 –> 00:03:17,070
هستند، بنابراین می توانید ببینید که قرمز رنگ این نقطه است،
94
00:03:17,070 –> 00:03:19,770
همه آنها قرمز هستند و آنها اکنون رای می دهند،
95
00:03:19,770 –> 00:03:22,260
زیرا این نقاط قرمز هستند، آنها به
96
00:03:22,260 –> 00:03:24,420
قرمز رای می دهند، بنابراین ما می خواهیم رای دهیم. دریافت
97
00:03:24,420 –> 00:03:28,050
رای قرمز سه سبز صفر است و
98
00:03:28,050 –> 00:03:32,100
آبی اکنون صفر است، زیرا قرمز
99
00:03:32,100 –> 00:03:34,410
بالاترین هاینتز است که در حال حاضر
100
00:03:34,410 –> 00:03:36,660
این رای است، ما این
101
00:03:36,660 –> 00:03:39,840
نقطه را به عنوان قرمز طبقه بندی
102
00:03:39,840 –> 00:03:42,270
می کنیم و اگر من K را انتخاب کنم اساساً این روش کار می کند
103
00:03:42,270 –> 00:03:44,220
. برابر با پنج چیزی است که ما اکنون به
104
00:03:44,220 –> 00:03:46,890
دنبال پنج نزدیکترین نقطه داده می
105
00:03:46,890 –> 00:03:49,110
گردم، بگذارید فقط بدانم این ممکن است
106
00:03:49,110 –> 00:03:50,310
نزدیکترین نقطه نباشد، اما من فقط می خواهم این کار را انجام دهم،
107
00:03:50,310 –> 00:03:51,630
مثلاً فرض کنید آن نقطه قرمز دیگر را داریم
108
00:03:51,630 –> 00:03:53,340
و فرض کنید این نقطه آبی
109
00:03:53,340 –> 00:03:55,020
نزدیک به این سگ سیاه است، شاید این به
110
00:03:55,020 –> 00:03:57,750
اینجا منتقل شد بسیار خوب آنچه اکنون اتفاق می افتد
111
00:03:57,750 –> 00:04:00,090
دقیقاً همان چیزی است که ما به
112
00:04:00,090 –> 00:04:01,620
این پنج نقطه داده نگاه می کنیم
113
00:04:01,620 –> 00:04:04,350
که نزدیکترین نقطه به این نقطه سیاه هستند و ما می
114
00:04:04,350 –> 00:04:06,030
خواهیم بگوییم بسیار خوب ما چهار رنگ قرمز داریم بنابراین
115
00:04:06,030 –> 00:04:07,790
این چهار نقطه است که باید احتمالاً به تازگی
116
00:04:07,790 –> 00:04:09,720
آن را پاک کردهام و بنابراین من سعی میکنم
117
00:04:09,720 –> 00:04:13,140
روی آن بنویسم و ما آبی داریم که یکی خو
118
00:04:13,140 –> 00:04:15,480
است بنابراین قرمز چهار و یکی آبی است و چ
119
00:04:15,480 –> 00:04:18,089
ن قرمز بزرگتر از یک است و ب
120
00:04:18,089 –> 00:04:19,649
لاترین رخداد است، ما ای
121
00:04:19,649 –> 00:04:21,988
نقطه را به عنوان طبقهبندی میکنیم. قرمز و
122
00:04:21,988 –> 00:04:23,550
بدیهی است که فکر میکنم همه ما میگوییم
123
00:04:23,550 –> 00:04:24,419
که احتمالاً طبقهبندی مناسبی است،
124
00:04:24,419 –> 00:04:26,970
125
00:04:26,970 –> 00:04:29,970
بنابراین اساساً چگونه کار میکند،
126
00:04:29,970 –> 00:04:32,340
حالا بیایید به ریاضیات دقیقتر برویم،
127
00:04:32,340 –> 00:04:35,370
بنابراین فرض
128
00:04:35,370 –> 00:04:37,920
کنید نقطه دادهام را در اینجا رسم کردم،
129
00:04:37,920 –> 00:04:41,310
بین دو دسته از دادهها بنابراین یک
130
00:04:41,310 –> 00:04:45,030
نحوه درست کار کردن را به دست آورید، بنابراین در واقع
131
00:04:45,030 –> 00:04:47,910
اجازه دهید در مورد اینکه چرا
132
00:04:47,910 –> 00:04:50,820
یک مقدار زوج برای K یا متأسفیم یک مقدار فرد
133
00:04:50,820 –> 00:04:52,620
برای K انتخاب می کنیم، بنابراین فرض کنید k برابر است با پنج،
134
00:04:52,620 –> 00:04:54,210
بیایید این مثال را با K برابر با پنج انجام
135
00:04:54,210 –> 00:04:55,920
دهیم، سپس بیشتر صحبت خواهیم کرد. در مورد ریاضی، بنابراین میتوانم
136
00:04:55,920 –> 00:04:57,180
بگویم نزدیکترین نقطه دادهها
137
00:04:57,180 –> 00:04:59,670
احتمالاً این یکی این یکی این یکی این
138
00:04:59,670 –> 00:05:03,120
یکی است و میدانید چه میخواهم بگویم
139
00:05:03,120 –> 00:05:04,830
این یکی نیز خوب است، بنابراین ما دو
140
00:05:04,830 –> 00:05:07,350
نقطه داده آبی و سه نقطه داده سبز
141
00:05:07,350 –> 00:05:09,990
داریم. از آنجایی که ما
142
00:05:09,990 –> 00:05:11,550
سه سبز و دو آبی داریم،
143
00:05:11,550 –> 00:05:13,710
این را به عنوان سبز طبقهبندی میکنیم، اما اگر
144
00:05:13,710 –> 00:05:16,530
بگویم K برابر است با چهار و به جای پنج،
145
00:05:16,530 –> 00:05:18,750
آنقدر خط بزنیم که k برابر است با چهار خوب حالا
146
00:05:18,750 –> 00:05:20,850
این نقطه داده، من آن را
147
00:05:20,850 –> 00:05:22,680
حذف میکنم. فرض کنید که اکنون وجود ندارد، ما
148
00:05:22,680 –> 00:05:24,840
دو نقطه سبز و دو نقطه آبی داریم،
149
00:05:24,840 –> 00:05:28,200
پس چگونه میتوانیم کدام نقطه داده را انتخاب
150
00:05:28,200 –> 00:05:29,670
کنیم که قرار است این
151
00:05:29,670 –> 00:05:32,850
را نیز طبقهبندی کنیم، بدیهی است که چرا باید
152
00:05:32,850 –> 00:05:35,520
K را انتخاب کنیم تا یک عدد فرد باشد تا یک عدد باشد.
153
00:05:35,520 –> 00:05:37,980
سه پنج هفت نه درست به طوری که
154
00:05:37,980 –> 00:05:40,350
مهم نیست که ما همیشه یک برنده داشته باشیم r و
155
00:05:40,350 –> 00:05:42,930
ما می توانیم در مورد یک کلاس تصمیم بگیریم زیرا
156
00:05:42,930 –> 00:05:45,360
در حال حاضر نمی دانیم این کلاس کدام است
157
00:05:45,360 –> 00:05:47,400
زیرا ما از نظر رای گیری تساوی خواهیم داشت،
158
00:05:47,400 –> 00:05:49,770
بنابراین به همین دلیل است که K را
159
00:05:49,770 –> 00:05:53,400
به عنوان یک عدد فرد انتخاب می کنیم، بنابراین حالا
160
00:05:53,400 –> 00:05:55,980
بیایید به ریاضیات بروید، بنابراین واقعاً چگونه این کار را
161
00:05:55,980 –> 00:05:57,419
انجام می دهد،
162
00:05:57,419 –> 00:06:00,060
روش های ریاضی چیست، خوب می دانید
163
00:06:00,060 –> 00:06:02,130
چه چیزی را حذف کنیم یا من
164
00:06:02,130 –> 00:06:04,169
نمی دانم
165
00:06:04,169 –> 00:06:07,470
166
00:06:07,470 –> 00:06:09,090
چه کاری را انجام دادم. شما این خروجی تمام صفحه
167
00:06:09,090 –> 00:06:11,820
را از آن خارج می کنید، ما می رویم خوب متأسفم
168
00:06:11,820 –> 00:06:13,380
من نمی دانم آنجا چه کار کردم، پس
169
00:06:13,380 –> 00:06:15,360
بیایید همه اینها را کنار بگذاریم و در واقع
170
00:06:15,360 –> 00:06:18,330
فقط در مورد نحوه فاصله گرفتن صحبت کنیم، بنابراین
171
00:06:18,330 –> 00:06:20,160
به یاد داشته باشید که ما اینجا می گفتیم مثلاً اگر
172
00:06:20,160 –> 00:06:21,750
این است من مسدود شده ام در یک نقطه و ما
173
00:06:21,750 –> 00:06:24,720
یک نقطه داده شاید سبز رنگ در اینجا داشتیم و
174
00:06:24,720 –> 00:06:26,100
مانند یک نقطه داده سبز دیگر در اینجا
175
00:06:26,100 –> 00:06:27,780
و یک نقطه داده سبز دیگر در اینجا
176
00:06:27,780 –> 00:06:29,190
داشتیم، احتمالاً می توانیم بگوییم که این
177
00:06:29,190 –> 00:06:30,960
نزدیکترین است، اما کامپیوتر باید
178
00:06:30,960 –> 00:06:33,330
مقداری ریاضی انجام دهد تا درست را تعیین کند. بنابراین
179
00:06:33,330 –> 00:06:35,010
چگونه می داند که چگونه
180
00:06:35,010 –> 00:06:37,830
نقطه clo است خوب تا کدام نقطه
181
00:06:37,830 –> 00:06:39,570
خطی را از یک نقطه به نقطه دیگر رسم می کند و مقداری
182
00: