در این مطلب، ویدئو K-Nearest Neighbors (KNN) به عنوان پایتون تک خطی [آموزش آسان] با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:15:55
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,810 –> 00:00:06,930
امروز خوش آمدید من می خواهم به شما نشان دهم که چگونه
2
00:00:06,930 –> 00:00:08,460
الگوریتم K نزدیکترین همسایه
3
00:00:08,460 –> 00:00:11,339
را به عنوان یک خط یک خطی پایتون پیاده سازی کنید و
4
00:00:11,339 –> 00:00:13,980
همچنین توضیحاتی در مورد اینکه
5
00:00:13,980 –> 00:00:15,749
دقیقاً الگوریتم آنها می توانند نزدیکترین همسایه ها
6
00:00:15,749 –> 00:00:18,360
چیست و چه کاری می تواند انجام دهد ارائه می دهم،
7
00:00:18,360 –> 00:00:21,599
بنابراین معمولاً K & N که می تواند انجام دهد. است هوانوردی
8
00:00:21,599 –> 00:00:24,210
برای K نزدیکترین همسایگان یک
9
00:00:24,210 –> 00:00:25,920
الگوریتم بسیار محبوب است که در
10
00:00:25,920 –> 00:00:27,840
یادگیری ماشین و علم داده برای
11
00:00:27,840 –> 00:00:30,230
وظایف رگرسیون و طبقهبندی استفاده میشود و
12
00:00:30,230 –> 00:00:32,880
میتوانید آن را در
13
00:00:32,880 –> 00:00:35,670
طبقهبندیهای تصویری سیستمهای توصیهگر، پیشبینی دادههای مالی
14
00:00:35,670 –> 00:00:39,120
یا بسیاری از برنامههای کاربردی دیگر
15
00:00:39,120 –> 00:00:40,710
مانند پردازش تصویر و پردازش ویدیو پیدا
16
00:00:40,710 –> 00:00:43,290
کنید. اساس بسیاری از
17
00:00:43,290 –> 00:00:45,960
تکنیکهای پیشرفتهتر یادگیری ماشینی برای
18
00:00:45,960 –> 00:00:48,210
مثال در بازیابی اطلاعات، بنابراین
19
00:00:48,210 –> 00:00:49,590
درک این
20
00:00:49,590 –> 00:00:52,950
الگوریتم اساسی همچنین برای آموزش ماهرانه شما
21
00:00:52,950 –> 00:00:54,560
در موضوعات علوم کامپیوتر بسیار مهم است.
22
00:00:54,560 –> 00:00:58,890
23
00:00:58,890 –> 00:01:03,510
24
00:01:03,510 –> 00:01:06,750
یک نمایش گرافیکی از
25
00:01:06,750 –> 00:01:10,590
عصا و الگوریتم و ایده کلی
26
00:01:10,590 –> 00:01:13,530
اساساً بنابراین اجازه دهید باز کنیم برای شما
27
00:01:13,530 –> 00:01:17,490
خوب است اینجا می توانید ببینید می توانید ببینید من
28
00:01:17,490 –> 00:01:21,119
این نمودار دو بعدی را رسم کرده ام
29
00:01:21,119 –> 00:01:24,420
بنابراین در محور x ما اندازه خانه
30
00:01:24,420 –> 00:01:27,149
و متر مربع را داریم و در محور y
31
00:01:27,149 –> 00:01:29,340
قیمت خانه را داریم پس
32
00:01:29,340 –> 00:01:34,579
واضح است داده هایی که نشان دهنده
33
00:01:34,579 –> 00:01:37,759
همبستگی بین اندازه
34
00:01:37,759 –> 00:01:41,069
مسکن در ایالات متحده به عنوان مثال و
35
00:01:41,069 –> 00:01:44,969
قیمت است و البته با اندازه بزرگتر
36
00:01:44,969 –> 00:01:48,119
خانه شما قیمت با آن نیز افزایش می یابد
37
00:01:48,119 –> 00:01:50,789
و می توانید در اینجا ببینید که ما در اینجا چند
38
00:01:50,789 –> 00:01:53,340
نقطه داده داریم که مازاد بر سیاهی یا
39
00:01:53,340 –> 00:01:56,069
برخی از نقاط داده و حالا فرض کنید
40
00:01:56,069 –> 00:01:59,249
میخواهیم پیدا کنیم، پس این یکی از
41
00:01:59,249 –> 00:02:01,889
مدلهای ماست و نکته جالب در K&N
42
00:02:01,889 –> 00:02:05,310
این ایده ساده است که کل
43
00:02:05,310 –> 00:02:07,740
مجموعه دادهها اساساً مدل شماست
44
00:02:07,740 –> 00:02:09,899
، بنابراین معمولاً در یادگیری ماشینی شما چنین چیزی ندارید.
45
00:02:09,899 –> 00:02:12,870
مجموعه داده های آموزشی را داشته باشید و از این مجموعه داده نوعی مدل را استنباط می کنید
46
00:02:12,870 –> 00:02:13,960
47
00:02:13,960 –> 00:02:15,880
48
00:02:15,880 –> 00:02:17,590
که نشان دهنده
49
00:02:17,590 –> 00:02:19,870
دکمه مجموعه داده های شما است اما بسیار مختصرتر است
50
00:02:19,870 –> 00:02:22,090
و همچنین شامل
51
00:02:22,090 –> 00:02:25,120
دانش سطح بالایی است و شما سعی می کنید
52
00:02:25,120 –> 00:02:27,310
روندها و الگوها را شناسایی کنید. من
53
00:02:27,310 –> 00:02:31,060
مجموعه دادههای شما در دادههای آموزشی شما و
54
00:02:31,060 –> 00:02:34,000
مدل این دادهها و عصا را تعمیم میدهد
55
00:02:34,000 –> 00:02:37,210
و همچنین میتواند دانش را
56
00:02:37,210 –> 00:02:40,360
از دادههای آموزشی تعمیم دهد، اما اساساً
57
00:02:40,360 –> 00:02:42,940
خود مدل به سادگی مجموعهای
58
00:02:42,940 –> 00:02:45,370
از کل مجموعه دادههای شما است و بنابراین اکنون میتوانید ببینید
59
00:02:45,370 –> 00:02:47,830
که آیا این دادههای آموزشی ما این
60
00:02:47,830 –> 00:02:50,170
نیز مدل ما است و اکنون فرض کنید ما یک
61
00:02:50,170 –> 00:02:52,870
پرس و جو داریم، بنابراین میخواهیم آن را انجام دهیم، میخواهیم
62
00:02:52,870 –> 00:02:56,680
کارهای پیشبینی انجام دهیم و بنابراین ما
63
00:02:56,680 –> 00:02:59,320
پیشبینی چهارگانه را داریم، بنابراین فرض کنید شما در کجا
64
00:02:59,320 –> 00:03:03,970
در بخش املاک خردهفروشی
65
00:03:03,970 –> 00:03:06,880
کار میکنید و مشتری شما می آید و
66
00:03:06,880 –> 00:03:09,910
می خواهد بداند من یک خانه با
67
00:03:09,910 –> 00:03:13,450
خانه کوچک 52 متر مربعی دارم و
68
00:03:13,450 –> 00:03:15,730
قیمت خانه بر اساس داده های
69
00:03:15,730 –> 00:03:17,560
شما چقدر است و اکنون شما همه این اطلاعات مشتری را دارید
70
00:03:17,560 –> 00:03:21,910
همه این نکات را دارید و حالا اگر می دانید می
71
00:03:21,910 –> 00:03:24,390
توانید به سادگی اجرا کنید. الگوریتم K&N خود را
72
00:03:24,390 –> 00:03:27,820
انتخاب کنید و به عنوان مثال K را برابر با سه انتخاب کنید، بنابراین ما
73
00:03:27,820 –> 00:03:30,850
همچنین می توانیم آن را به عنوان 3 نشان دهیم و M شما سه روز فرصت دارید،
74
00:03:30,850 –> 00:03:33,310
به این معنی که شما
75
00:03:33,310 –> 00:03:36,400
نزدیکترین همسایگان را تعیین می کنید، بنابراین شما رسم می کنید تا به
76
00:03:36,400 –> 00:03:40,390
نوعی درخواست خود را در
77
00:03:40,390 –> 00:03:42,990
فضای موجود خود نشان دهید. مجموعه داده های ting و
78
00:03:42,990 –> 00:03:46,390
که این d50 دو متر مربع است و
79
00:03:46,390 –> 00:03:49,480
اکنون تمام سه
80
00:03:49,480 –> 00:03:51,700
نزدیکترین همسایه را از تمام داده های خود پیدا می کنید
81
00:03:51,700 –> 00:03:54,340
و در این مورد ما سه
82
00:03:54,340 –> 00:03:57,640
نقطه داده نقطه داده یا آیتم داده ABC داریم
83
00:03:57,640 –> 00:04:00,910
که نزدیکترین آنها به پرس و جو ما هستند و در اینجا
84
00:04:00,910 –> 00:04:03,820
ما داده هایی را داریم که 50
85
00:04:03,820 –> 00:04:08,980
متر مربع هزینه دارد 34000 دلار و به همین ترتیب قبل از میلاد مسیح و
86
00:04:08,980 –> 00:04:13,600
اکنون ما T را به خوبی پیش بینی شده خود محاسبه می کنیم.
87
00:04:13,600 –> 00:04:17,548
88
00:04:17,548 –> 00:04:19,899
89
00:04:19,899 –> 00:04:21,399
90
00:04:21,399 –> 00:04:24,640
یک خواننده
91
00:04:24,640 –> 00:04:26,650
مقدار پیشبینی وب را پیشبینی کرده است، اما یک
92
00:04:26,650 –> 00:04:28,360
93
00:04:28,360 –> 00:04:30,340
تکنیک بسیار قوی و اثبات شده این است که فقط از
94
00:04:30,340 –> 00:04:35,410
میانگین همه مقادیر موجود در
95
00:04:35,410 –> 00:04:38,490
خود در محیط K نزدیکترین
96
00:04:38,490 –> 00:04:40,419
همسایهها استفاده کنید
97
00:04:40,419 –> 00:04:44,050
98
00:04:44,050 –> 00:04:46,270
.
99
00:04:46,270 –> 00:04:47,919
جایی در
100
00:04:47,919 –> 00:04:51,910
این منطقه خواهد بود، بنابراین اساساً در وسط و
101
00:04:51,910 –> 00:04:54,880
یک مرکز از همه این نقاط
102
00:04:54,880 –> 00:04:58,000
در فضا است، بنابراین پیش بینی منطقی است، خوب
103
00:04:58,000 –> 00:04:59,970
حالا چگونه می توانیم این را در پایتون پیاده سازی
104
00:04:59,970 –> 00:05:06,039
کنیم، بیایید Pytho را باز کنیم. n پوسته ای که به شما می دهم
105
00:05:06,039 –> 00:05:08,710
به تک لاینر قول می دهم اکنون چیزی را آماده کرده ام،
106
00:05:08,710 –> 00:05:12,460
بنابراین اکنون
107
00:05:12,460 –> 00:05:15,759
ابتدا باید کتابخانه یادگیری s sky kid
108
00:05:15,759 –> 00:05:19,830
به خصوص
109
00:05:19,830 –> 00:05:22,930
ماژول همسایگان و بسته
110
00:05:22,930 –> 00:05:28,479
واردات را وارد کنیم و ماژول K همسایگان را رگرسیور وارد کنیم
111
00:05:28,479 –> 00:05:31,389
خوب است، بنابراین اگر شما میخواهید طبقهبندی را انجام دهید،
112
00:05:31,389 –> 00:05:35,699
سپس ما یک طبقهبندی کننده وارد میکنیم،
113
00:05:35,699 –> 00:05:38,979
بله، طبقهبندی کننده همسایگان K، اما
114
00:05:38,979 –> 00:05:40,810
ما نمیخواهیم این کار را انجام دهیم، میخواهیم رگرسیور انجام دهیم
115
00:05:40,810 –> 00:05:43,180
و البته
116
00:05:43,180 –> 00:05:46,539
برای این نوع دادهها معمولاً به زمان شماره نیاز داریم،
117
00:05:46,539 –> 00:05:50,530
بنابراین ابتدا اجازه دهید ایجاد کنیم. برخی از دادهها
118
00:05:50,530 –> 00:05:55,330
را داریم فقط کپی پیست کنید و یک جفت
119
00:05:55,330 –> 00:05:58,330
شما یک منطقه کامل به نام X ایجاد میکنید، ما
120
00:05:58,330 –> 00:06:01,030
مقداری داده داریم برای مثال اندازه خانه بر حسب
121
00:06:01,030 –> 00:06:05,409
متر مربع و قیمت خانه، بنابراین برای
122
00:06:05,409 –> 00:06:10,719
مثال 30000 دلار و 45000 دلار برای خانهای
123
00:06:10,719 –> 00:06:16,030
با 45 متر مربع خوب است.
124
00:06:16,030 –> 00:06:18,569
تک خط یک خط
125
00:06:18,569 –> 00:06:24,009
خوب است که یک لاینر اساساً در اینجا است که
126
00:06:24,009 –> 00:06:28,659
ما مدل خود را ایجاد می کنیم و از
127
00:06:28,659 –> 00:06:30,969
رگرسیون همسایگان K خود استفاده می کنیم که وارد کردیم
128
00:06:30,969 –> 00:06:36,240
و در این ابتدا باید اساساً
129
00:06:36,240 –> 00:06:39,789
این کلاسی است که ما داریم که باید آن را انجام
130
00:06:39,789 –> 00:06:42,210
دهیم. ابتدا یک شی بسازید
131
00:06:42,210 –> 00:06:45,060
و شیء را مشخص کنیم ویژگی N
132
00:06:45,060 –> 00:06:50,729
همسایه ها و این اساساً
133
00:06:50,729 –> 00:06:54,289
یک شی از رگرسیون همسایگان K ما ایجاد می کند
134
00:06:54,289 –> 00:06:57,479
که تعداد
135
00:06:57,479 –> 00:07:00,000
همسایگان یا K را تنظیم می کند که در آن شما دو سه نفر
136
00:07:00,000 –> 00:07:02,160
را نمی دانم چرا چرا آنها استفاده نکرده
137
00:07:02,160 –> 00:07:06,330
اند. به سادگی K زیرا در n ما
138
00:07:06,330 –> 00:07:08,940
K را انتخاب می کنیم اما بله همین است که همین است بنابراین
139
00:07:08,940 –> 00:07:12,090
ابتدا این رگرسیور را ایجاد می
140
00:07:12,090 –> 00:07:14,729
کنید و پارامتر K را مشخص می کنید و اکنون
141
00:07:14,729 –> 00:07:16,680
ما رگرسیون را داریم که می توانیم تابع
142
00:07:16,680 –> 00:07:21,780
fit را صدا کنیم و اکنون از بنابراین اساساً
143
00:07:21,780 –> 00:07:24,810
باید استفاده کنیم. فیت و بنابراین ما مقداری
144
00:07:24,810 –> 00:07:27,419
داده X داریم و مقداری گسترده تر، من
145
00:07:27,419 –> 00:07:30,270
آنها را در یک لحظه جایگزین خواهم کرد، بنابراین ما اساساً
146
00:07:30,270 –> 00:07:32,940
این چیزی است که ما انجام می دهیم، ما فیت می کنیم.
147
00:07:32,940 –> 00:07:36,449
148
00:07:36,449 –> 00:07:40,770
149
00:07:40,770 –> 00:07:42,449
ورودی و خروجی آموزشی ما
150
00:07:42,449 –> 00:07:44,099
اگر بررسی کنید که آیا
151
00:07:44,099 –> 00:07:46,260
دوباره گرافیک را بررسی کنید، ورودی آموزش
152
00:07:46,260 –> 00:07:49,320
اندازه ما است و خروجی آموزش
153
00:07:49,320 –> 00:07:52,110
قیمت خانه ما است و بنابراین ما
154
00:07:52,110 –> 00:07:54,510
نگاشت از ورودی به خروجی را به
155
00:07:54,510 –> 00:07:57,510
آرایه های numpy یک بع