در این مطلب، ویدئو اولین پروژه یادگیری ماشینی شما در پایتون گام به گام – یادگیری ماشینی را در پایتون شروع کنید؟ با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:02:40
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,510 –> 00:00:04,890
سلام و خوش آمدید به آموزش یادگیری ماشینی
2
00:00:04,890 –> 00:00:07,710
قسمت 1 این قسمت 1 از
3
00:00:07,710 –> 00:00:09,780
مجموعه یادگیری ماشینی است که با
4
00:00:09,780 –> 00:00:12,360
یادگیری نام من ریچارد کرچنر است. من
5
00:00:12,360 –> 00:00:14,549
با تیم ساده آموخته شده
6
00:00:14,549 –> 00:00:17,880
7
00:00:17,880 –> 00:00:20,670
WW هستم. امروز خوب
8
00:00:20,670 –> 00:00:22,289
ما با توضیح مختصری در
9
00:00:22,289 –> 00:00:24,539
مورد چرایی یادگیری ماشین و
10
00:00:24,539 –> 00:00:26,400
یادگیری ماشینی شروع می کنیم و سپس
11
00:00:26,400 –> 00:00:27,810
به تعدادی از انواع
12
00:00:27,810 –> 00:00:30,300
الگوریتم های یادگیری ماشینی یادگیری ماشینی می پردازیم که
13
00:00:30,300 –> 00:00:33,090
درختان تصمیم گیری رگرسیون خطی از ماشین برداری پشتیبانی می کنند
14
00:00:33,090 –> 00:00:35,399
و در نهایت ما یک مورد استفاده را انجام دهید
15
00:00:35,399 –> 00:00:37,050
که در آن طبقهبندی میکنیم که آیا
16
00:00:37,050 –> 00:00:39,600
دستور پخت آنها کیک کوچک است یا کلوچه با استفاده
17
00:00:39,600 –> 00:00:41,730
از SVM یا دستگاه بردار پشتیبان
18
00:00:41,730 –> 00:00:43,890
روشی خوشمزه برای کشف
19
00:00:43,890 –> 00:00:46,649
یادگیری ماشینی به نظر میرسد، پس چرا یادگیری ماشینی
20
00:00:46,649 –> 00:00:48,420
چرا ما حتی به داشتن این رایانهها اهمیت میدهیم.
21
00:00:48,420 –> 00:00:50,309
بیایید و بتوانید همه
22
00:00:50,309 –> 00:00:52,800
این کارهای جدید را به خوبی برای ما انجام دهید زیرا
23
00:00:52,800 –> 00:00:55,199
ماشینها اکنون میتوانند ماشین شما را برای شما برانند که
24
00:00:55,199 –> 00:00:57,300
هنوز در مرحله بینهایت است، اما
25
00:00:57,300 –> 00:00:59,070
همانطور که در گوگل میبینیم فقط در حال انفجار است.
26
00:00:59,070 –> 00:01:02,219
e’s way MO و سپس uber head
27
00:01:02,219 –> 00:01:04,650
برنامه خود را که متأسفانه خراب شد آنها
28
00:01:04,650 –> 00:01:06,210
می دانند که این بسیار بزرگ است این
29
00:01:06,210 –> 00:01:08,159
صنعت بزرگی است که کل زیرساخت های حمل و نقل ما را تغییر می دهد
30
00:01:08,159 –> 00:01:10,950
31
00:01:10,950 –> 00:01:12,810
یادگیری ماشینی در حال حاضر استفاده از شناسایی بیش از 50
32
00:01:12,810 –> 00:01:15,090
بیماری چشمی است آیا می دانید چقدر شگفت انگیز است
33
00:01:15,090 –> 00:01:17,009
که داشتن رایانهای که
34
00:01:17,009 –> 00:01:18,540
پزشک را برای چیزهایی که ممکن است از
35
00:01:18,540 –> 00:01:20,670
دست بدهند بررسی میکند
36
00:01:20,670 –> 00:01:22,590
و به زودی در صنعت سلامت بسیار بزرگ است، آنها در واقع
37
00:01:22,590 –> 00:01:24,119
در برخی مناطق
38
00:01:24,119 –> 00:01:26,100
که شاید نه برای چشمها، بلکه برای
39
00:01:26,100 –> 00:01:27,900
بیماریهای دیگر که از دوربین روی شما استفاده میکنند، آن
40
00:01:27,900 –> 00:01:30,030
را دارند.
41
00:01:30,030 –> 00:01:31,920
قبل از مراجعه به پزشک و مراجعه به پزشک، از قبل تشخیص داده شده و از
42
00:01:31,920 –> 00:01:34,140
آنجایی که دستگاه اکنون میتواند قفل گوشی شما
43
00:01:34,140 –> 00:01:36,840
را با صورت شما باز کند، به این معنی است که این کار جالبی
44
00:01:36,840 –> 00:01:38,640
است که بتواند چهره
45
00:01:38,640 –> 00:01:41,250
یا صدای شما را شناسایی کند و موارد را روشن
46
00:01:41,250 –> 00:01:42,570
و خاموش کند. شما بسته به اینکه در کجا
47
00:01:42,570 –> 00:01:44,340
هستید و به چه چیزی نیاز دارید در
48
00:01:44,340 –> 00:01:46,590
مورد اتوماسیون نهایی جهانی
49
00:01:46,590 –> 00:01:48,869
که در آن زندگی می کنیم صحبت کنید و همانطور که عمیق تر می
50
00:01:48,869 –> 00:01:51,750
کنیم نمونه خوبی از فیس بوک داریم همانطور که
51
00:01:51,750 –> 00:01:53,369
می توانید اینجا ببینید. سلام پست فیس بوک را
52
00:01:53,369 –> 00:01:55,799
با کامنت هالووین داشته باشید بله اگر می خواهید
53
00:01:55,799 –> 00:01:58,950
اینجا را سفارش دهید هیچ کس پست اسپم در
54
00:01:58,950 –> 00:02:00,750
فیس بوک را دوست ندارد که آنها را برای
55
00:02:00,750 –> 00:02:03,240
تعامل با لایک ها آزار می دهد نظرات
56
00:02:03,240 –> 00:02:04,530
و سایر اقدامات
57
00:02:04,530 –> 00:02:06,420
را به اشتراک بگذارید.
58
00:02:06,420 –> 00:02:08,758
59
00:02:08,758 –> 00:02:11,370
بدشانسی یا نوعی عامل ترس داشته باشید،
60
00:02:11,370 –> 00:02:13,560
این یک چیز بزرگ در شبکه های اجتماعی است
61
00:02:13,560 –> 00:02:15,420
که افراد اسپم دریافت می کنند، بنابراین
62
00:02:15,420 –> 00:02:18,390
این تاکتیک معروف به طعمه تعامل
63
00:02:18,390 –> 00:02:20,880
از الگوریتم فید خبری فیس بوک
64
00:02:20,880 –> 00:02:23,069
با انتخاب تعامل
65
00:02:23,069 –> 00:02:25,080
برای دستیابی به دسترسی بیشتر برای
66
00:02:25,080 –> 00:02:27,569
حذف استفاده می کند. این شرکت
67
00:02:27,569 –> 00:02:29,580
صدها هزار پست را بررسی و دستهبندی کرد
68
00:02:29,580 –> 00:02:31,230
تا یک
69
00:02:31,230 –> 00:02:32,819
مدل یادگیری ماشینی را آموزش دهد که
70
00:02:32,819 –> 00:02:34,650
انواع مختلف طعمههای تعامل را تشخیص میدهد، بنابراین در این
71
00:02:34,650 –> 00:02:36,330
مورد ما از فیسبوک استفاده میکنیم، اما
72
00:02:36,330 –> 00:02:37,590
این البته در تمام رسانههای اجتماعی مختلف است
73
00:02:37,590 –> 00:02:39,360
که آنها متفاوت هستند. ابزارها
74
00:02:39,360 –> 00:02:41,760
یا ساختمان و جیف اسکرول فیس بوک
75
00:02:41,760 –> 00:02:43,140
به
76
00:02:43,140 –> 00:02:45,510
نوعی مانند ویروسی که وارد آنجا می شود جایگزین می شود و
77
00:02:45,510 –> 00:02:47,430
متوجه می شود که مجموعه خاصی وجود دارد
78
00:02:47,430 –> 00:02:48,989
با فیسبوک و میتواند آن را جایگزین
79
00:02:48,989 –> 00:02:52,260
کند و آنها مانند طعمهگذاری رای واکنش نشان میدهند
80
00:02:52,260 –> 00:02:54,600
طعمهگذاری اشتراکگذاری طعمهگذاری را دارند.
81
00:02:54,600 –> 00:02:55,650
82
00:02:55,650 –> 00:02:57,750
83
00:02:57,750 –> 00:02:59,310
84
00:02:59,310 –> 00:03:01,380
آنها همه اینها را تغذیه کردند
85
00:03:01,380 –> 00:03:03,209
این داده ها به دستگاه وارد شد
86
00:03:03,209 –> 00:03:05,190
و سپس آنها پست جدید را دارند پست جدید
87
00:03:05,190 –> 00:03:07,380
می آید که بخشی از
88
00:03:07,380 –> 00:03:08,940
راه اندازی فیس بوک را در بر می گیرد و این همان چیزی است که
89
00:03:08,940 –> 00:03:10,049
شما به آن نگاه می کنید و به این
90
00:03:10,049 –> 00:03:12,180
پست جدید نگاه می کنید. مانند یک ویروس
91
00:03:12,180 –> 00:03:14,400
جایگزین شده است، بنابراین در فیس بوک برای از بین بردن
92
00:03:14,400 –> 00:03:16,140
این مورد، آنها شروع به اسکن برای
93
00:03:16,140 –> 00:03:18,630
کلمات و عبارات کلیدی مانند این می کنند و
94
00:03:18,630 –> 00:03:20,609
نرخ کلیک را بررسی می کنند، بنابراین شروع به
95
00:03:20,609 –> 00:03:21,989
جستجوی افرادی می کنند که روی آن کلیک می کنند
96
00:03:21,989 –> 00:03:24,480
بدون اینکه حتی به آن نگاه کنند یا روی
97
00:03:24,480 –> 00:03:25,739
آن کلیک کنند. این چیزی نیست که
98
00:03:25,739 –> 00:03:27,390
معمولاً وقتی
99
00:03:27,390 –> 00:03:29,250
فیسبوک این کلمات کلیدی و عبارات را اسکن کرد، روی
100
00:03:29,250 –> 00:03:32,130
آن کلیک کنید، اکنون میتواند
101
00:03:32,130 –> 00:03:34,739
هرزنامههایی را که وارد میشود شناسایی کند و این
102
00:03:34,739 –> 00:03:36,180
زندگی شما را آسانتر میکند تا دریافت نکنید.
103
00:03:36,180 –> 00:03:38,040
هرزنامه مانند راه رفتن در
104
00:03:38,040 –> 00:03:40,170
فرودگاه نیست و بسیاری از کشورهایی که دارید،
105
00:03:40,170 –> 00:03:41,400
مانند صدها نفر که سعی دارند به
106
00:03:41,400 –> 00:03:43,739
شما سهم زمانی بفروشند، بیایید ثبت نام
107
00:03:43,739 –> 00:03:45,510
کنید تا مزاحم ما را از بین ببرد یا اکنون
108
00:03:45,510 –> 00:03:47,040
می توانید از عکس های فیس بوک و گربه خود لذت ببرید
109
00:03:47,040 –> 00:03:49,319
یا شاید این
110
00:03:49,319 –> 00:03:50,040
عکس های خانوادگی شما
111
00:03:50,040 –> 00:03:52,079
نام من خانواده است مطمئناً مردم
112
00:03:52,079 –> 00:03:54,299
عکس های گربه های خود را نیز دوست دارند نمونه خوب دیگر
113
00:03:54,299 –> 00:03:56,639
پروژه
114
00:03:56,639 –> 00:03:59,220
عمیق ذهنی گوگل alphago یک برنامه کامپیوتری است که یک بازی رومیزی
115
00:03:59,220 –> 00:04:01,440
بازی می کند بازیکن شماره یک go جهان را شکست داده
116
00:04:01,440 –> 00:04:03,840
است و امیدوارم
117
00:04:03,840 –> 00:04:06,540
نام او را درست بگویم qiji نهایی
118
00:04:06,540 –> 00:04:08,819
بازی go چالش سه از سه در
119
00:04:08,819 –> 00:04:12,239
27 می 2017 بود، بنابراین همین سال گذشته بود
120
00:04:12,239 –> 00:04:14,310
که این اتفاق افتاد و چیزی که این موضوع را
121
00:04:14,310 –> 00:04:17,519
بسیار مهم میکند این است که میدانید go فقط
122
00:04:17,519 –> 00:04:19,139
به عنوان یک بازی است، بنابراین اینطور نیست که در حال
123
00:04:19,139 –> 00:04:20,940
رانندگی با ماشین یا چیزی در ما هستید. دنیای واقعی
124
00:04:20,940 –> 00:04:24,240
اما آنها از بازی ها استفاده می کنند تا یاد بگیرند
125
00:04:24,240 –> 00:04:27,180
که چگونه برنامه یادگیری ماشینی
126
00:04:27,180 –> 00:04:27,480
را
127
00:04:27,480 –> 00:04:29,100
یاد بگیرند که می خواستند یاد بگیرند که چگونه یاد بگیرند
128
00:04:29,100 –> 00:04:31,740
و این گام بزرگی است که بسیاری از این
129
00:04:31,740 –> 00:04:33,450
هنوز در مرحله نوزادی خود هستند.
130
00:04:33,450 –> 00:04:35,970
تا آنجایی که ما دیدیم چه اتفاقی افتاد
131
00:04:35,970 –> 00:04:38,550
با ماشینهای uber که قبلاً به آنها اشاره کردند،
132
00:04:38,550 –> 00:04:40,500
آنها کل بخش خود را از دست
133
00:04:40,500 –> 00:04:43,110
دادند زیرا خیلی سریع جلوتر میپریدند، بنابراین
134
00:04:43,110 –> 00:04:44,790
هنوز یک مرحله نوزادی است، اما پسر این
135
00:04:44,790 –> 00:04:47,490
مانند شروع یک
136
00:04:47,490 –> 00:04:49,680
دنیای شگفتانگیز است که در آن خودکار شده است. روشهایی که حتی نمیتوانیم
137
00:04:49,680 –> 00:04:51,630
تصور کنیم فردا چگونه خواهد بود،
138
00:04:51,630 –> 00:04:53,640
نمونههای زیادی
139
00:04:53,640 –> 00:04:55,680
از یادگیری ماشین را بررسی کردهایم، بنابراین بیایید ببینیم آیا
140
00:04:55,680 –> 00:04:57,510
میتوانیم تعریف دقیقتری
141
00:04:57,510 –> 00:05:00,180
ارائه دهیم که
142
00:05:00,180 –> 00:05:02,490
یادگیری ماشینی چیست، علم یادگیری است.
143
00:05:02,490 –> 00:05:05,010
با تغذیه داده ها و اطلاعات بدون برنامه ریزی صریح، رایانه ها را یاد بگیرند و مانند انسان ها عمل کنند،
144
00:05:05,010 –> 00:05:06,810
145
00:05:06,810 –> 00:05:09,750
در اینجا می
146
00:05:09,750 –> 00:05:11,250
بینیم که یک نمودار کوچک زیبا داریم که در آن
147
00:05:11,250 –> 00:05:14,250
سیستم معمولی خود را داریم رایانه
148
00:05:14,250 –> 00:05:15,960
شما امروزه حتی می توانید موارد زیادی را
149
00:05:15,960 –> 00:05:17,850
روی تلفن همراه اجرا کنید زیرا تلفن های همراه
150
00:05:17,850 –> 00:05:20,160
تقاضای زیادی دارد و سپس با
151
00:05:20,160 –> 00:05:22,470
هوش مصنوعی و یادگیری ماشینی، اکنون
152
00:05:22,470 –> 00:05:24,900
دادهها را میگیرد و آنچه را
153
00:05:24,900 –> 00:05:26,940
که قبلاً اتفاق افتاده است، میآموزد و سپس پیشبینی
154
00:05:26,940 –> 00:05:28,950
میکند که آینده چه خواهد شد. پس
155
00:05:28,950 –> 00:05:31,140
واقعاً بزرگترین بخش در حال حاضر در
156
00:05:31,140 –> 00:05:32,700
یادگیری ماشینی که در حال انجام است این است
157
00:05:32,700 –> 00:05:35,250
که نحوه یافتن راه حل جدید را بهبود می بخشد،
158
00:05:35,250 –> 00:05:38,400
بنابراین از کلمات توصیفی که
159
00:05:38,400 –> 00:05:40,140
در مورد چیزها یاد می گیریم و درک
160
00:05:40,140 –> 00:05:41,940
چگونگی تطابق آنها با یکدیگر به پیش بینی کارهایی
161
00:05:41,940 –> 00:05:44,190
که قرار است برای پست های مرموز انجام شود، می پردازیم.
162
00:05:44,190 –> 00:05:46,620
راهحل جدیدی ارائه میکنیم و زمانی که
163
00:05:46,620 –> 00:05:49,020
ما روی یادگیری ماشین کار میکنیم،
164
00:05:49,020 –> 00:05:51,180
تعدادی نمودار مختلف وجود دارد که افراد
165
00:05:51,180 –> 00:05:52,800
برای انجام
166
00:05:52,800 –> 00:05:54,780
مراحل زیادی پست کردهاند، ممکن است بسیار
167
00:05:54,780 –> 00:05:57,290
مختص دامنه باشد، بنابراین اگر روی شناسایی عکس کار میکنید.
168
00:05:57,290 –> 00:06:00,510
در مقابل زبان
169
00:06:00,510 –> 00:06:03,660
در مقابل پزشکی یا فیزیک، برخی از اینها
170
00:06:03,660 –> 00:06:05,280
کمی تغییر میکنند یا
171
00:06:05,280 –> 00:06:06,570
چیزهای جدیدی در آن قرار میگیرند، آنها بسیار مختص
172
00:06:06,570 –> 00:06:08,490
به حوزه هستند، این یک
173
00:06:08,490 –> 00:06:10,950
نمودار بسیار کلی است، ابتدا میخواهید
174
00:06:10,950 –> 00:06:12,900
هدف خود را تعریف کنید، بسیار مهم است که بدانید
175
00:06:12,900 –> 00:06:14,370
آن چیست. آیا میخواهید پیشبینی کنید،
176
00:06:14,370 –> 00:06:15,990
سپس دادهها را جمعآوری میکنید،
177
00:06:15,990 –> 00:06:18,150
بنابراین وقتی هدفی را تعریف
178
00:06:18,150 –> 00:06:19,200
کردید، باید دادههایی را جمعآوری کنید که
179
00:06:19,200 –> 00:06:22,200
با زمان و علم دادههای شما مطابقت دارد.
180
00:06:22,200 –> 00:06:24,240
جمعآوری دادهها و مرحله بعدی
181
00:06:24,240 –> 00:06:26,400
آمادهسازی دادههایی که به دست آوردهاید تا
182
00:06:26,400 –> 00:06:28,260
مطمئن شوید که دادههای شما تمیز هستند
183
00:06:28,260 –> 00:06:31,620
، به قول قدیمی دادههای بد در
184
00:06:31,620 –> 00:06:35,250
جواب بد یا دادههای بد خارج میشوند، و بعد
185
00:06:35,250 –> 00:06:36,990
از اینکه تمام این موارد را انجام دادید و ما همه
186
00:06:36,990 –> 00:06:38,820
این موارد را پاک کردیم. با ورود به سیستم، شما
187
00:06:38,820 –> 00:06:39,719
188
00:06:39,719 –> 00:06:41,849
به الگوریتمی که قرار است از کدام الگوریتم
189
00:06:41,849 –> 00:06:43,349
استفاده کنید، آن الگوریتم را آموزش خواهید داد،
190
00:06:43,349 –> 00:06:45,059
در این مورد فکر می کنم ما
191
00:06:45,059 –> 00:06:47,159
با SVM ماشین بردار پشتیبانی کار خواهیم کرد،
192
00:06:47,159 –> 00:06:49,229
سپس باید مدل را آزمایش کنید.
193
00:06:49,229 –> 00:06:51,389
این کار مدل، این یک
194
00:06:51,389 –> 00:06:53,189
مدل معتبر برای کاری است که ما انجام میدهیم و
195
00:06:53,189 –> 00:06:55,110
بعد از اینکه آن را آزمایش کردید،
196
00:06:55,110 –> 00:06:56,879
میخواهید پیشبینی خود را اجرا کنید، میخواهید
197
00:06:56,879 –> 00:06:59,009
پیشبینی یا انتخاب خود یا هر
198
00:06:59,009 –> 00:07:00,509
خروجی دیگری را که قرار است به دست بیاید، اجرا کنید و
199
00:07:00,509 –> 00:07:02,969
سپس یک بار همه چیز تنظیم شده است و شما
200
00:07:02,969 –> 00:07:05,189
تست های زیادی انجام داده اید، سپس می خواهید ادامه دهید
201
00:07:05,189 –> 00:07:06,809
و مدل را پیاده سازی کنید،
202
00:07:06,809 –> 00:07:08,759
به یاد داشته باشید که من گفتم مختص دامنه
203
00:07:08,759 –> 00:07:10,799
204
00:07:10,799 –> 00:07:13,019
205
00:07:13,019 –> 00:07:14,579
206
00:07:14,579 –> 00:07:16,709
داده ها از دست رفته است ething و شما
207
00:07:16,709 –> 00:07:18,629
باید بروید داده های جدید را جمع آوری کنید زیرا
208
00:07:18,629 –> 00:07:20,159
در اینجا یک آزمایش در طول
209
00:07:20,159 –> 00:07:21,449
خط انجام داده اید که می گویید هی من
210
00:07:21,449 –> 00:07:23,069
واقعاً پاسخ هایی را که لازم دارم دریافت نمی کنم بنابراین
211
00:07:23,069 –> 00:07:24,139
چیزهای زیادی وجود دارد که مربوط به دامنه هستند.
212
00:07:24,139 –> 00:07:26,939
بخشی از این مدل، این یک
213
00:07:26,939 –> 00:07:28,589
مدل بسیار کلی است که
214
00:07:28,589 –> 00:07:30,659
برای شروع یک مدل بسیار خوب است، ما
215
00:07:30,659 –> 00:07:33,059
تقسیمبندیهای اساسی از یادگیری ماشینی
216
00:07:33,059 –> 00:07:35,729
داریم، مهم است بدانید که
217
00:07:35,729 –> 00:07:37,679
آیا میخواهید یک دسته را به خوبی پیشبینی کنید
218
00:07:37,679 –> 00:07:39,379
اگر در حال دستهبندی چیزهایی هستید که
219
00:07:39,379 –> 00:07:41,729
طبقه بندی برای مثال اینکه آیا
220
00:07:41,729 –> 00:07:43,529
قیمت سهام افزایش می یابد یا کاهش می یابد،
221
00:07:43,529 –> 00:07:45,449
به عبارت دیگر من به دنبال یک
222
00:07:45,449 –> 00:07:47,610
پاسخ بله / خیر هستم که آیا افزایش می یابد یا کاهش
223
00:07:47,610 –> 00:07:49,409
می یابد و در آن صورت ما
224
00:07:49,409 –> 00:07:51,959
در واقع می گوییم که آیا افزایش می یابد اگر درست باشد.
225
00:07:51,959 –> 00:07:53,610
بالا نمی رود اشتباه است یعنی
226
00:07:53,610 –> 00:07:56,969
به این ترتیب پایین می آید بله/خیر 0 1 آیا
227
00:07:56,969 –> 00:07:59,089
می خواهید کمیتی را پیش بینی کنید که
228
00:07:59,089 –> 00:08:01,169
رگرسیون است، بنابراین به یاد داشته باشید که ما
229
00:08:01,169 –> 00:08:02,729
طبقه بندی را انجام دادیم اکنون ما به
230
00:08:02,729 –> 00:08:04,559
رگرسیون نگاه می کنیم این دو بخش اصلی هستند
231
00:08:04,559 –> 00:08:06,659
و داده چیست انجام برای
232
00:08:06,659 –> 00:08:08,249
inst پیشبینی سن یک فرد
233
00:08:08,249 –> 00:08:10,949
بر اساس سلامت وزن قد و
234
00:08:10,949 –> 00:08:12,779
سایر عوامل، بنابراین بر اساس این
235
00:08:12,779 –> 00:08:14,069
عوامل مختلف میتوانید حدس بزنید
236
00:08:14,069 –> 00:08:16,349
که یک فرد چند سال دارد و سپس
237
00:08:16,349 –> 00:08:19,529
موارد خاص دامنه زیادی وجود دارد، مانند اینکه آیا
238
00:08:19,529 –> 00:08:21,989
میخواهید یک ناهنجاری را تشخیص دهید.
239
00:08:21,989 –> 00:08:23,909
تشخیص ناهنجاری در واقع در حال حاضر بسیار محبوب است،
240
00:08:23,909 –> 00:08:25,649
به عنوان مثال
241
00:08:25,649 –> 00:08:27,179
میخواهید ناهنجاریهای برداشت پول را شناسایی کنید،
242
00:08:27,179 –> 00:08:28,559
میخواهید بدانید زمانی که شخصی آن را
243
00:08:28,559 –> 00:08:29,819
برداشت میکند که ممکن است حساب خود او نباشد،
244
00:08:29,819 –> 00:08:31,679
ما در واقع این موضوع را مطرح کردهایم
245
00:08:31,679 –> 00:08:33,779
زیرا در حال حاضر واقعاً بزرگ است.
246
00:08:33,779 –> 00:08:35,519
اگر سهام را پیشبینی میکنید که آیا
247
00:08:35,519 –> 00:08:37,529
سهام بخرید یا نه، میخواهید بتوانید
248
00:08:37,529 –> 00:08:39,299
بدانید که آیا آنچه در بازار سهام
249
00:08:39,299 –> 00:08:41,370
میگذرد یک ناهنجاری است یا خیر، از یک مدل پیشبینی متفاوت استفاده کنید،
250
00:08:41,370 –> 00:08:42,839
زیرا
251
00:08:42,839 –> 00:08:44,399
چیز دیگری در حال وقوع است، شما باید
252
00:08:44,399 –> 00:08:47,009
اطلاعات جدید را در وجود دارد یا این فقط یک
253
00:08:47,009 –> 00:08:49,259
هنجار است که من میخواهم بازدهی عادی خود را از پول سرمایهگذاری شدهام دریافت کنم،
254
00:08:49,259 –> 00:08:51,449
بنابراین تشخیص
255
00:08:51,449 –> 00:08:53,440
ناهنجاریها بسیار بزرگ است، در واقع
256
00:08:53,440 –> 00:08:55,720
علم این روزها سؤال دیگری است
257
00:08:55,720 –> 00:08:58,630
که مطرح میشود و آن اینکه فراخوانی
258
00:08:58,630 –> 00:09:00,820
داده های آموزش ندیده این است که آیا می خواهید
259
00:09:00,820 –> 00:09:03,700
ساختار داده های ناشناخته را کشف کنید و به
260
00:09:03,700 –> 00:09:06,190
آن خوشه بندی می گویند برای مثال یافتن
261
00:09:06,190 –> 00:09:07,870
گروه هایی از مشتریان با رفتار مشابه با
262
00:09:07,870 –> 00:09:10,090
توجه به پایگاه داده بزرگی از داده های
263
00:09:10,090 –> 00:09:11,740
مشتریان حاوی
264
00:09:11,740 –> 00:09:14,650
اطلاعات جمعیتی و سوابق خرید قبلی آنها و
265
00:09:14,650 –> 00:09:16,630
در این مورد ممکن است متوجه شویم که
266
00:09:16,630 –> 00:09:18,970
هر کسی کسانی که ست خاصی از
267
00:09:18,970 –> 00:09:21,760
کفش می پوشند به خرید از فروشگاه های خاص می روند یا
268
00:09:21,760 –> 00:09:22,780
هر چیز دیگری که هست،
269
00:09:22,780 –> 00:09:25,510
با داشتن آن اطلاعات خرید خاصی انجام می دهد، این
270
00:09:25,510 –> 00:09:27,250
به ما کمک می کند تا افراد را با هم بازاریابی کنیم یا گروه
271
00:09:27,250 –> 00:09:29,200
کنیم تا اکنون بتوانیم آن
272
00:09:29,200 –> 00:09:31,210
گروه را کشف کنیم و بفهمیم که می خواهیم چه چیزی را انجام دهیم.
273
00:09:31,210 –> 00:09:32,350
اگر در دنیای بازاریابی هستید، برای آنها
274
00:09:32,350 –> 00:09:34,330
بازاریابی کنید و این ممکن است
275
00:09:34,330 –> 00:09:36,460
تقریباً در هر زمینه ای کار کند که ممکن است بخواهید
276
00:09:36,460 –> 00:09:38,770
افراد را با هم گروه کنید، خواه آنها
277
00:09:38,770 –> 00:09:41,520
بر اساس حوزه های مختلف و
278
00:09:41,520 –> 00:09:44,740
سرمایه گذاری و پیشینه مالی
279
00:09:44,740 –> 00:09:46,150
آنها باشند. وام یا
280
00:09:46,150 –> 00:09:47,740
نه قبل از اینکه حتی شروع به بررسی
281
00:09:47,740 –> 00:09:49,750
اینکه آیا آنها مشتری معتبری برای
282
00:09:49,750 –> 00:09:51,310
بانک هستند یا نه، ممکن است بخواهید به همه این
283
00:09:51,310 –> 00:09:52,660
حوزه های مختلف نگاه کنید و آنها را بر اساس دادههای ناشناخته با هم گروهبندی کنید،
284
00:09:52,660 –> 00:09:55,390
بنابراین نمیدانید دادهها به شما چه
285
00:09:55,390 –> 00:09:56,320
286
00:09:56,320 –> 00:09:57,700
میگویند، اما میخواهید افراد را
287
00:09:57,700 –> 00:09:59,980
با هم دستهبندی کنید که با هم جمع میشوند.
288
00:09:59,980 –> 00:10:03,370
289
00:10:03,370 –> 00:10:05,350
چند
290
00:10:05,350 –> 00:10:08,830
سوال در اینجا یا یک زمان مسابقه دارید و ما
291
00:10:08,830 –> 00:10:11,650
پاسخ ها را در این قسمت
292
00:10:11,650 –> 00:10:14,260
دوم این آموزش ارسال خواهیم کرد، پس بیایید جلوتر برویم و
293
00:10:14,260 –> 00:10:15,340
به این سوالات زمان های مسابقه نگاهی بیندازیم،
294
00:10:15,340 –> 00:10:17,080
امیدوارم همه آنها
295
00:10:17,080 –> 00:10:18,940
را درست دریافت کنید. با فکر کردن در مورد نحوه
296
00:10:18,940 –> 00:10:21,580
پردازش داده ها و آنچه
297
00:10:21,580 –> 00:10:23,350
اتفاق می افتد، می توانید بگویید در موارد زیر چه اتفاقی می افتد،
298
00:10:23,350 –> 00:10:25,300
البته
299
00:10:25,300 –> 00:10:26,950
شما با فنجان قهوه خود در آنجا نشسته اید و
300
00:10:26,950 –> 00:10:28,510
در پین خود کادر تأیید را داشتید و سعی می کردید
301
00:10:28,510 –> 00:10:29,590
بفهمید که قدم بعدی
302
00:10:29,590 –> 00:10:32,380
شما در علم داده چیست. تجزیه و تحلیل بنابراین
303
00:10:32,380 –> 00:10:34,990
اولین مورد گروه بندی اسناد به
304
00:10:34,990 –> 00:10:37,930
دسته های مختلف بر اساس موضوع
305
00:10:37,930 –> 00:10:41,290
و محتوای هر سند است
306
00:10:41,290 –> 00:10:45,250
که این روزها اسناد
307
00:10:45,250 –> 00:10:47,290
308
00:10:47,290 –> 00:10:50,680
حقوقی بسیار بزرگ
309
00:10:50,680 –> 00:10:52,480
است. کلاه خودکار یک چیز بزرگ در
310
00:10:52,480 –> 00:10:55,720
دنیای امروز است که
311
00:10:55,720 –> 00:10:58,660
ارقام و تصاویر دستنویس را به درستی شناسایی کنیم، بنابراین میخواهیم
312
00:10:58,660 –> 00:11:00,250
313
00:11:00,250 –> 00:11:03,400
بدانیم آیا آنها ABC مینویسند یا ABC بزرگ.
314
00:11:03,400 –> 00:11:03,939
315
00:11:03,939 –> 00:11:07,389
316
00:11:07,389 –> 00:11:10,239
کار کردن
317
00:11:10,239 –> 00:11:13,599
طبق طراحی d پیش بینی حقوق و دستمزد یک
318
00:11:13,599 –> 00:11:16,689
فرد بر اساس سال ها
319
00:11:16,689 –> 00:11:20,829
تجربه یا استخدام منابع انسانی او را تنظیم کنید، بنابراین
320
00:11:20,829 –> 00:11:22,869
در قسمت دوم با ما همراه باشید، ما ادامه خواهیم داد
321
00:11:22,869 –> 00:11:24,159
و وقتی
322
00:11:24,159 –> 00:11:26,259
به قسمت دوم با این آموزش یا شما رسیدید به این سوالات پاسخ
323
00:11:26,259 –> 00:11:28,119
خواهیم داد. می توانید به سادگی در پایین بنویسید
324
00:11:28,119 –> 00:11:29,649
و یک یادداشت بفرستید تا به سادگی یاد بگیرید و
325
00:11:29,649 –> 00:11:32,559
آنها با شما در مورد آن به
326
00:11:32,559 –> 00:11:35,079
محتوای معمولی ما پیگیر خواهند شد، حداقل چند مورد آخر
327
00:11:35,079 –> 00:11:37,149
ما را وارد مبحث بعدی می کنند که
328
00:11:37,149 –> 00:11:38,919
روش دیگری برای تقسیم انواع
329
00:11:38,919 –> 00:11:40,749
یادگیری ماشینی ما است. و آن هم با
330
00:11:40,749 –> 00:11:44,459
نظارت بدون نظارت و
331
00:11:44,459 –> 00:11:46,629
یادگیری تقویتی یادگیری نظارت
332
00:11:46,629 –> 00:11:48,939
شده روشی است که برای توانمندسازی
333
00:11:48,939 –> 00:11:51,519
ماشینها برای طبقهبندی
334
00:11:51,519 –> 00:11:53,739
مسائل یا موقعیتهای پیشبینی اشیاء بر اساس
335
00:11:53,739 –> 00:11:56,439
دادههای برچسبی که به ماشین داده میشود استفاده میشود. e و در اینجا می
336
00:11:56,439 –> 00:11:58,449
بینید که ما مجموعه ای از داده ها با
337
00:11:58,449 –> 00:12:00,909
دایره های مثلث و مربع داریم که وقتی
338
00:12:00,909 –> 00:12:02,349
آنها را برچسب گذاری می کنیم، دایره
339
00:12:02,349 –> 00:12:04,239
چیست، مثلث، مربع است و
340
00:12:04,239 –> 00:12:06,309
ما آموزش مدل خود را داریم و آن را آموزش می دهد،
341
00:12:06,309 –> 00:12:08,109
بنابراین ما پاسخ را بسیار مهم می دانیم
342
00:12:08,109 –> 00:12:09,099
زمانی که شما در حال یادگیری با نظارت
343
00:12:09,099 –> 00:12:11,979
هستید که از قبل پاسخ بسیاری
344
00:12:11,979 –> 00:12:13,989
از اطلاعات دریافتی خود را میدانید، بنابراین
345
00:12:13,989 –> 00:12:16,389
گروه عظیمی از دادهها وارد میشوند و
346
00:12:16,389 –> 00:12:18,609
سپس دادههای جدیدی وارد میشوند، بنابراین
347
00:12:18,609 –> 00:12:20,649
ما مدل خود را آموزش دادهایم، مدل اکنون
348
00:12:20,649 –> 00:12:22,329
میداند تفاوت بین یک دایره یک مربع
349
00:12:22,329 –> 00:12:24,699
یک مثلث و حالا که آن را آموزش داده
350
00:12:24,699 –> 00:12:26,679
ایم، می توانیم در این مورد s مربع بفرستیم و
351
00:12:26,679 –> 00:12:28,689
یک دایره وارد می شود و پیش بینی می کند
352
00:12:28,689 –> 00:12:30,489
که بالا یک مربع و بعدی
353
00:12:30,489 –> 00:12:32,349
یک دایره است و می توانید ببینید که
354
00:12:32,349 –> 00:12:34,299
این میتواند پیشبینی کند که آیا
355
00:12:34,299 –> 00:12:35,829
کسی به تنهایی پیشبینی میکند،
356
00:12:35,829 –> 00:12:37,269
زیرا صحبت کردن در مورد Banx که قبلاً
357
00:12:37,269 –> 00:12:39,729
بر یادگیری در بازار سهام نظارت میکرد
358
00:12:39,729 –> 00:12:41,499
که آیا میخواهید درآمد کسب کنید یا نه
359
00:12:41,499 –> 00:12:44,019
، همیشه مهم است و اگر
360
00:12:44,019 –> 00:12:45,129
به دنبال ثروتمند شدن در سهام هستید.
361
00:12:45,129 –> 00:12:47,709
بازار به خاطر داشته
362
00:12:47,709 –> 00:12:49,689
باشید دریافت درست همه دادهها در بازار سهام
363
00:12:49,689 –> 00:12:52,509
بسیار دشوار است، اما نوسانات آن
364
00:12:52,509 –> 00:12:55,149
به گونهای است که پیشبینی آن واقعاً سخت است،
365
00:12:55,149 –> 00:12:57,279
بنابراین اگر در حال اجرای
366
00:12:57,279 –> 00:12:58,809
یادگیری ماشینی در بازار سهام هستید،
367
00:12:58,809 –> 00:13:00,339
متوجه میشوید شما واقعاً باید به
368
00:13:00,339 –> 00:13:02,409
دنبال داده های جدید باشید، بنابراین ما بر یادگیری نظارت کرده ایم
369
00:13:02,409 –> 00:13:04,479
و اگر شما نظارت کرده اید،
370
00:13:04,479 –> 00:13:07,199
باید به یادگیری بدون نظارت در یادگیری ماشینی بدون نظارت نیاز داشته باشیم،
371
00:13:07,199 –> 00:13:09,519
372
00:13:09,519 –> 00:13:11,679
مدل یادگیری ماشینی الگوی پنهان را در یک داده بدون برچسب پیدا می کند،
373
00:13:11,679 –> 00:13:14,109
بنابراین در این مورد
374
00:13:14,109 –> 00:13:16,000
به آن می گوید که
375
00:13:16,000 –> 00:13:17,980
دایره یک مثلث است و چه مربعی
376
00:13:17,980 –> 00:13:19,990
است می رود آنجا به او نگاه می کند و
377
00:13:19,990 –> 00:13:21,730
می گوید به هر دلیلی آنها را
378
00:13:21,730 –> 00:13:22,149
با هم جمع می کند
379
00:13:22,149 –> 00:13:23,410
شاید آن را بر اساس تعداد گوشه ها گروه بندی کنم
380
00:13:23,410 –> 00:13:26,199
و متوجه شود که تعدادی از
381
00:13:26,199 –> 00:13:27,910
آنها سه گوشه دارند و
382
00:13:27,910 –> 00:13:29,949
همه آنها را شماره می کنند. دارای چهار گوشه است و تعدادی
383
00:13:29,949 –> 00:13:31,810
از آنها هیچ گوشه ای ندارند و می
384
00:13:31,810 –> 00:13:33,550
تواند آن ها را فیلتر کرده و آنها را با هم گروه بندی
385
00:13:33,550 –> 00:13:35,110
کند که
386
00:13:35,110 –> 00:13:37,000
قبلاً با نگاهی به گروهی از
387
00:13:37,000 –> 00:13:38,680
افرادی که در مورد آن صحبت کردیم هنگام خرید ما می خواهیم
388
00:13:38,680 –> 00:13:40,240
آنها را با هم گروه کنیم تا بفهمیم چه
389
00:13:40,240 –> 00:13:42,459
چیزهایی با هم مشترک هستند و البته زمانی
390
00:13:42,459 –> 00:13:43,959
که متوجه شدی افراد چه چیزهای
391
00:13:43,959 –> 00:13:46,060
مشترکی دارند، شاید یکی از آنها را داشته باشید که
392
00:13:46,060 –> 00:13:48,189
در فروشگاه شما مشتری است یا 500
393
00:13:48,189 –> 00:13:50,139
مشتری دیگر فروشگاه خود داشته باشید و آنها
394
00:13:50,139 –> 00:13:51,910
با پنج نفر دیگر
395
00:13:51,910 –> 00:13:54,129
که مشتری فروشگاه شما نیستند وجوه مشترک زیادی دارید چگونه
396
00:13:54,129 –> 00:13:55,660
به آن پنج نفر که مشتری فروشگاه شما هستند بازاریابی می
397
00:13:55,660 –> 00:13:57,009
کنید، اما آنها با
398
00:13:57,009 –> 00:13:58,660
جمعیتی که قرار است از آنجا خرید کنند مطابقت دارند
399
00:13:58,660 –> 00:13:59,980
و شما دوست دارید آنها از فروشگاه شما
400
00:13:59,980 –> 00:14:02,050
خرید کنند. البته
401
00:14:02,050 –> 00:14:03,579
این یک نسخه ساده شده است که می توانید
402
00:14:03,579 –> 00:14:05,290
به راحتی تفاوت بین یک
403
00:14:05,290 –> 00:14:06,639
مثلث در دایره را ببینید که ممکن است
404
00:14:06,639 –> 00:14:08,310
در بازاریابی چندان آسان نباشد.
405
00:14:08,310 –> 00:14:10,029
406
00:14:10,029 –> 00:14:12,220
407
00:14:12,220 –> 00:14:14,889
یک
408
00:14:14,889 –> 00:14:16,899
محیط با انجام اقدامات و
409
00:14:16,899 –> 00:14:19,329
دیدن نتیجه ما در اینجا داریم که
410
00:14:19,329 –> 00:14:21,459
در این مورد یک نوزاد واقعا عالی است
411
00:14:21,459 –> 00:14:23,230
که آنها از یک نوزاد برای این اسلاید استفاده کردند
412
00:14:23,230 –> 00:14:25,480
زیرا یادگیری تقویتی
413
00:14:25,480 –> 00:14:27,970
بسیار در مراحل اولیه خود است، اما
414
00:14:27,970 –> 00:14:29,860
همچنین احتمالاً بزرگترین
415
00:14:29,860 –> 00:14:32,319
تقاضای یادگیری ماشینی است که در حال حاضر وجود دارد یا
416
00:14:32,319 –> 00:14:33,879
در
417
00:14:33,879 –> 00:14:36,129
آینده در چند سال آینده مطرح خواهد شد،
418
00:14:36,129 –> 00:14:37,779
یادگیری تقویتی و نحوه انجام آن برای
419
00:14:37,779 –> 00:14:40,180
ما و می توانید اینجا ببینید جایی که
420
00:14:40,180 –> 00:14:42,610
ما عمل خود را در عمل داریم و این یکی
421
00:14:42,610 –> 00:14:44,410
به آتش میرود، امیدوارم کودک
422
00:14:44,410 –> 00:14:46,389
فقط یک شمع کوچک نداشته باشد نه یک
423
00:14:46,389 –> 00:14:48,129
آتشدان غولپیکر مثل اینجا به نظر میرسد
424
00:14:48,129 –> 00:14:49,809
وقتی بچه بیرون میآید و حالت جدید
425
00:14:49,809 –> 00:14:52,209
بچه غمگین است. و گریه کردن چون
426
00:14:52,209 –> 00:14:53,889
روی آتش سوخته اند و بعد
427
00:14:53,889 –> 00:14:55,959
شاید اقدام دیگری انجام دهند عزیزم
428
00:14:55,959 –> 00:14:57,610
عامل نامیده می شود زیرا این کسی است
429
00:14:57,610 –> 00:14:59,829
که اقدامات را انجام می دهد و در این مورد آنها
430
00:14:59,829 –> 00:15:00,910
به داخل آتش نمی روند به سمت دیگری رفته اند
431
00:15:00,910 –> 00:15:02,769
و اکنون کودک خوشحال است. و
432
00:15:02,769 –> 00:15:04,870
خندیدن و بازی کردن
433
00:15:04,870 –> 00:15:06,339
یادگیری تقویتی بسیار آسان قابل درک است
434
00:15:06,339 –> 00:15:08,470
زیرا به عنوان یک انسان این یکی
435
00:15:08,470 –> 00:15:10,449
از روش هایی است که ما یاد می گیریم یاد گرفتیم که
436
00:15:10,449 –> 00:15:12,430
آیا شما خود را روی اجاق گاز می سوزانید، دیگر این کار را نکنید و به اجاق گاز دست
437
00:15:12,430 –> 00:15:14,290
نزنید.
438
00:15:14,290 –> 00:15:16,509
در تصویر بزرگ،
439
00:15:16,509 –> 00:15:18,459
داشتن برنامه یادگیری ماشینی تحت یک
440
00:15:18,459 –> 00:15:20,800
هوش مصنوعی بسیار بزرگ است
441
00:15:20,800 –> 00:15:23,230
زیرا اکنون شروع به یادگیری نحوه
442
00:15:23,230 –> 00:15:26,350
یادگیری کرده ایم که یک جهش بزرگ در دنیای
443
00:15:26,350 –> 00:15:28,389
کامپیوتر و یادگیری ماشینی است و ما به
444
00:15:28,389 –> 00:15:29,410
عقب برمی گردیم. و
445
00:15:29,410 –> 00:15:31,779
نوعی بازگشت به یادگیری تحت نظارت در مقابل
446
00:15:31,779 –> 00:15:33,940
بدون نظارت، درک
447
00:15:33,940 –> 00:15:36,190
این موضوع بسیار زیاد است، زیرا
448
00:15:36,190 –> 00:15:38,680
در هر پروژه ای که روی آن کار می کنید، این موضوع به وجود می آید،
449
00:15:38,680 –> 00:15:41,079
ما در یادگیری نظارت شده،
450
00:15:41,079 –> 00:15:43,720
داده ها را برچسب گذاری کرده ایم، بازخورد مستقیم داریم، بنابراین
451
00:15:43,720 –> 00:15:45,550
فردی که قبلاً در آنجا رفته است، گفت بله
452
00:15:45,550 –> 00:15:46,629
این یک مثلث است
453
00:15:46,629 –> 00:15:48,339
نه که یک مثلث نیست و شما
454
00:15:48,339 –> 00:15:49,839
نتیجه را پیشبینی کردهاند، بنابراین شما یک پیشبینی خوب دارید
455
00:15:49,839 –> 00:15:51,879
، این مجموعه جدیدی از
456
00:15:51,879 –> 00:15:53,410
دادهها وارد میشود و ما میدانیم که اینطور
457
00:15:53,410 –> 00:15:55,389
خواهد بود و سپس با
458
00:15:55,389 –> 00:15:57,819
آموزش بدون نظارت، برچسب گذاری نشده است، بنابراین ما واقعاً
459
00:15:57,819 –> 00:16:00,009
نمی دانم چیست، هیچ بازخوردی وجود ندارد،
460
00:16:00,009 –> 00:16:02,259
بنابراین به آن نمی گوییم که
461
00:16:02,259 –> 00:16:03,970
درست است یا غلط، به آن نمی گوییم
462
00:16:03,970 –> 00:16:05,500
مثلث یا مربع است،
463
00:16:05,500 –> 00:16:07,689
ما به آن نمی گوییم تمام کاری که می کنیم به چپ یا راست برود.
464
00:16:07,689 –> 00:16:10,089
ما هستیم پیدا کردن
465
00:16:10,089 –> 00:16:12,610
ساختار پنهان در داده ها گروه بندی داده ها
466
00:16:12,610 –> 00:16:14,800
با هم برای اینکه بفهمید چه چیزی به یکدیگر متصل است
467
00:16:14,800 –> 00:16:16,839
و می توانید از آنها
468
00:16:16,839 –> 00:16:19,389
با هم استفاده کنید، بنابراین تصور کنید که یک تصویر
469
00:16:19,389 –> 00:16:21,370
دارید و مطمئن نیستید به دنبال چه هستید،
470
00:16:21,370 –> 00:16:23,319
بنابراین وارد شوید و
471
00:16:23,319 –> 00:16:25,870
داده های بدون ساختار همه این چیزهایی را پیدا می کنند
472
00:16:25,870 –> 00:16:27,670
که به یکدیگر متصل هستند و سپس
473
00:16:27,670 –> 00:16:29,980
کسی به آن ها نگاه می کند و برچسب گذاری می کند،
474
00:16:29,980 –> 00:16:32,019
اکنون می توانید داده های برچسب را بردارید و
475
00:16:32,019 –> 00:16:34,240
چیزی را برنامه ریزی کنید تا آنچه در تصویر است را پیش بینی کنید
476
00:16:34,240 –> 00:16:36,040
تا بتوانید ببینید که چگونه آنها به
477
00:16:36,040 –> 00:16:37,509
عقب و جلو می روند و می توانید شروع به
478
00:16:37,509 –> 00:16:39,310
اتصال کنید. همه این ابزارهای مختلف
479
00:16:39,310 –> 00:16:41,410
با هم برای ایجاد یک تصویر بزرگتر، الگوریتم های
480
00:16:41,410 –> 00:16:43,389
یادگیری ماشینی جالب بسیاری وجود دارد،
481
00:16:43,389 –> 00:16:45,610
بیایید نگاهی به چند مورد از آنها بیاندازیم.
482
00:16:45,610 –> 00:16:46,870
483
00:16:46,870 –> 00:16:48,759
484
00:16:48,759 –> 00:16:50,529
485
00:16:50,529 –> 00:16:52,480
ما به
486
00:16:52,480 –> 00:16:55,149
درخت تصمیم رگرسیون خطی و
487
00:16:55,149 –> 00:16:57,699
ماشین بردار پشتیبان
488
00:16:57,699 –> 00:17:00,009
نگاهی خواهیم انداخت. بیایید با نگاهی دقیق تر به رگرسیون خطی شروع
489
00:17:00,009 –> 00:17:01,959
490
00:17:01,959 –> 00:17:03,299
کنیم. الگوریتم های شناخته شده و شناخته شده
491
00:17:03,299 –> 00:17:05,530
در آمار و
492
00:17:05,530 –> 00:17:07,630
یادگیری ماشین رگرسیون خطی یک
493
00:17:07,630 –> 00:17:10,179
مدل خطی است به عنوان مثال مدلی که یک
494
00:17:10,179 –> 00:17:12,429
رابطه خطی بین
495
00:17:12,429 –> 00:17:14,679
متغیرهای ورودی X و متغیر تک خروجی
496
00:17:14,679 –> 00:17:17,409
Y را فرض می کند و اگر به خاطر داشته باشید این را خواهید دید.
497
00:17:17,409 –> 00:17:19,449
کلاس های جبر y
498
00:17:19,449 –> 00:17:22,419
برابر است با MX به علاوه C تصور کنید ما
499
00:17:22,419 –> 00:17:24,490
مسافت طی شده Y را از سرعت X پیش بینی می کنیم
500
00:17:24,490 –> 00:17:26,980
501
00:17:26,980 –> 00:17:29,020
502
00:17:29,020 –> 00:17:32,590
503
00:17:32,590 –> 00:17:36,010
504
00:17:36,010 –> 00:17:38,530
. y-intercept
505
00:17:38,530 –> 00:17:39,970
و ما قصد داریم به دو
506
00:17:39,970 –> 00:17:42,220
تغییر مختلف از این نگاه کنیم،
507
00:17:42,220 –> 00:17:43,169
اول با
508
00:17:43,169 –> 00:17:45,269
زمان ثابت است و می توانید ببینید که ما
509
00:17:45,269 –> 00:17:47,249
یک دوچرخه سوار داریم که او تجهیزات ایمنی دارد که
510
00:17:47,249 –> 00:17:49,830
خدا را شکر سرعت آن برابر با ده متر
511
00:17:49,830 –> 00:17:52,080
در ثانیه است. و بنابراین در
512
00:17:52,080 –> 00:17:54,090
مدت زمان معینی مسافت او برابر با 36
513
00:17:54,090 –> 00:17:56,730
کیلومتر است، ما یک دوچرخه سوار دوم
514
00:17:56,730 –> 00:17:59,100
داریم که دو برابر سرعت یا 20 متر
515
00:17:59,100 –> 00:18:01,230
در ثانیه می رود و می توانید حدس بزنید که آیا
516
00:18:01,230 –> 00:18:02,970
او دو برابر سرعت می رود یا خیر. d و زمان
517
00:18:02,970 –> 00:18:05,159
ثابت است پس او دو برابر
518
00:18:05,159 –> 00:18:08,009
مسافت را طی می کند و به راحتی می توان 36
519
00:18:08,009 –> 00:18:11,879
ضربدر 2 را محاسبه کرد، شما 72 کیلومتر می گیرید، بنابراین
520
00:18:11,879 –> 00:18:13,980
اگر این سوال را داشتید که یک نفر با
521
00:18:13,980 –> 00:18:15,840
چه سرعتی سه بار با سرعت می رود
522
00:18:15,840 –> 00:18:17,999
یا 30 متر در ثانیه شما هستید. میتوانیم
523
00:18:17,999 –> 00:18:20,039
به راحتی فاصله در ذهن خود را محاسبه کنیم،
524
00:18:20,039 –> 00:18:21,539
میتوانیم این کار را بدون نیاز به
525
00:18:21,539 –> 00:18:23,249
رایانه انجام دهیم، اما میخواهیم این کار را برای
526
00:18:23,249 –> 00:18:25,169
دادههای پیچیدهتر انجام دهیم، بنابراین
527
00:18:25,169 –> 00:18:26,489
مقایسه این دو خوب است، اما اجازه دهید
528
00:18:26,489 –> 00:18:28,019
نگاهی به آن بیندازیم و به چه شکلی است.
529
00:18:28,019 –> 00:18:30,809
بنابراین در یک مدل رگرسیون خطی
530
00:18:30,809 –> 00:18:33,480
فاصله خود را با سرعت داریم و
531
00:18:33,480 –> 00:18:36,690
M ما برابر با شیب ve
532
00:18:36,690 –> 00:18:38,429
خط است و متوجه می شویم که خط دارای
533
00:18:38,429 –> 00:18:41,159
شیب مثبت است و با افزایش سرعت
534
00:18:41,159 –> 00:18:42,629
فاصله نیز افزایش می یابد،
535
00:18:42,629 –> 00:18:44,369
بنابراین متغیرها دارای یک شیب هستند. رابطه مثبت است
536
00:18:44,369 –> 00:18:46,830
و بنابراین سرعت شما
537
00:18:46,830 –> 00:18:49,080
که برابر با y برابر است با MX به علاوه C
538
00:18:49,080 –> 00:18:51,359
فقط در یک بازه زمانی ثابت طی می شود
539
00:18:51,359 –> 00:18:53,369
و ما به راحتی می توانیم
540
00:18:53,369 –> 00:18:55,080
یا با دنبال کردن خط یا فقط
541
00:18:55,080 –> 00:18:56,879
سه برابر ده متر در
542
00:18:56,879 –> 00:18:58,710
ثانیه را محاسبه کنیم. s تقریباً صد و دو
543
00:18:58,710 –> 00:19:00,389
کیلومتر مسافتی است که سومین
544
00:19:00,389 –> 00:19:03,409
دوچرخه سوار آن را طی کرده است یکی از تعاریف کلیدی
545
00:19:03,409 –> 00:19:06,289
در اینجا رابطه مثبت است،
546
00:19:06,289 –> 00:19:08,730
بنابراین شیب خط با
547
00:19:08,730 –> 00:19:11,100
افزایش مسافت مثبت است، بنابراین
548
00:19:11,100 –> 00:19:13,169
سرعت افزایش می یابد، اجازه دهید به
549
00:19:13,169 –> 00:19:15,090
مثال دوم خود نگاهی بیندازیم. قرار دادن
550
00:19:15,090 –> 00:19:17,609
فاصله ثابت است، بنابراین سرعت ما برابر با 10
551
00:19:17,609 –> 00:19:19,499
متر در ثانیه است، آنها مسافت مشخصی
552
00:19:19,499 –> 00:19:21,330
را باید طی کنند و صد ثانیه طول می کشد
553
00:19:21,330 –> 00:19:22,710
تا آن مسافت را طی کند
554
00:19:22,710 –> 00:19:25,169
و ما دوچرخه سوار دوم خود را داریم که
555
00:19:25,169 –> 00:19:27,149
هنوز 20 متر در ثانیه انجام می دهد زیرا
556
00:19:27,149 –> 00:19:29,190
او دو برابر می رود. سرعت ما می توانیم حدس بزنیم
557
00:19:29,190 –> 00:19:30,509
که او مسافت را در
558
00:19:30,509 –> 00:19:33,359
نیمی از زمان 50 ثانیه طی
559
00:19:33,359 –> 00:19:34,649
می کند و البته شما احتمالاً می توانید روی سومی
560
00:19:34,649 –> 00:19:36,960
صد تقسیم بر 30 را حدس بزنید زیرا
561
00:19:36,960 –> 00:19:39,029
او سه برابر سرعتی است که شما
562
00:19:39,029 –> 00:19:40,679
به راحتی می توانید حدس بزنید اگر این سی و سه باشد.
563
00:19:40,679 –> 00:19:43,320
نقطه سه سه سه ثانیه زمان
564
00:19:43,320 –> 00:19:44,940
آن را در یک مدل رگرسیون خطی
565
00:19:44,940 –> 00:19:47,340
یا یک نمودار قرار می دهیم اگر فاصله ثابت فرض
566
00:19:47,340 –> 00:19:49,230
شود، بیایید رابطه
567
00:19:49,230 –> 00:19:51,690
بین سرعت و زمان را ببینیم. d با افزایش
568
00:19:51,690 –> 00:19:53,999
زمان مقدار سرعت برای رفتن به همان
569
00:19:53,999 –> 00:19:55,040
فاصله کاهش می
570
00:19:55,040 –> 00:19:57,500
یابد، بنابراین اکنون M شما برابر است با شیب منهای
571
00:19:57,500 –> 00:19:59,870
خط با افزایش سرعت
572
00:19:59,870 –> 00:20:00,980
زمان کاهش می یابد،
573
00:20:00,980 –> 00:20:02,930
بنابراین متغیر
574
00:20:02,930 –> 00:20:05,180
دوباره رابطه منفی دارد،
575
00:20:05,180 –> 00:20:07,130
تعریف ما رابطه مثبت و
576
00:20:07,130 –> 00:20:09,200
رابطه منفی است. با توجه به
577
00:20:09,200 –> 00:20:11,180
شیب خط و با یک
578
00:20:11,180 –> 00:20:14,330
فرمول ساده مانند این و حتی مقدار قابل
579
00:20:14,330 –> 00:20:16,280
توجهی داده، اجازه دهید با
580
00:20:16,280 –> 00:20:18,530
اجرای ریاضی
581
00:20:18,530 –> 00:20:20,360
رگرسیون خطی ببینیم و این داده ها را می
582
00:20:20,360 –> 00:20:22,130
گیریم، بنابراین فرض کنید این مجموعه داده را داریم که در آن
583
00:20:22,130 –> 00:20:25,370
XY x برابر است. یک دو سه چهار پنج
584
00:20:25,370 –> 00:20:28,610
سری استاندارد و مقدار Y برابر است با سه
585
00:20:28,610 –> 00:20:30,590
دو و چهار سه
586
00:20:30,590 –> 00:20:32,390
وقتی آن را می گیریم و ادامه می دهیم و
587
00:20:32,390 –> 00:20:35,030
این نقاط را روی یک نمودار
588
00:20:35,030 –> 00:20:36,830
رسم می کنیم.
589
00:20:36,830 –> 00:20:38,480
590
00:20:38,480 –> 00:20:40,280
وسط آن، اما ما
591
00:20:40,280 –> 00:20:42,110
دقیقاً آن خط را برای
592
00:20:42,110 –> 00:20:44,090
رگرسیون خطی محاسبه می کنیم و اولین کاری که انجام می دهیم این
593
00:20:44,090 –> 00:20:47,120
است که به اینجا می رسیم، میانگین X I را داریم
594
00:20:47,120 –> 00:20:49,070
و به یاد داشته باشید که میانگین اساساً این است.
595
00:20:49,070 –> 00:20:51,530
میانگین پنج به علاوه چهار به اضافه
596
00:20:51,530 –> 00:20:53,390
سه به اضافه سه به علاوه یک را جمع کرده و بر پنج تقسیم می کنیم
597
00:20:53,390 –> 00:20:56,810
که به سادگی به صورت سه می شود و
598
00:20:56,810 –> 00:20:58,760
سپس همین کار را برای y انجام می دهیم
599
00:20:58,760 –> 00:21:00,500
و تمام آن اعداد را
600
00:21:00,500 –> 00:21:02,810
جمع کرده و بر پنج تقسیم می کنیم و در نهایت
601
00:21:02,810 –> 00:21:06,350
مقدار میانگین y از I برابر با 2.8 است که
602
00:21:06,350 –> 00:21:08,960
در آن مرجع X I یک میانگین یا به معنای
603
00:21:08,960 –> 00:21:11,270
مقدار است و Y I نیز برابر با
604
00:21:11,270 –> 00:21:13,550
مقدار میانگین y است و وقتی رسم می کنیم خواهید
605
00:21:13,550 –> 00:21:16,310
دید که می توانیم y را وارد کنیم. برابر با 2.8
606
00:21:16,310 –> 00:21:18,890
و x برابر با 3 در نمودار
607
00:21:18,890 –> 00:21:20,210
ما کمی
608
00:21:20,210 –> 00:21:21,860
رنگ متفاوت به آن می دهیم تا بتوانید آن را با
609
00:21:21,860 –> 00:21:24,080
خطوط چین جدا کنید و
610
00:21:24,080 –> 00:21:25,370
توجه داشته باشید که وقتی رگرسیون خطی را انجام می دهیم،
611
00:21:25,370 –> 00:21:27,560
مدل رگرسیون خطی
612
00:21:27,560 –> 00:21:30,650
باید اکنون از آن نقطه عبور کنید، بیایید
613
00:21:30,650 –> 00:21:32,360
معادله رگرسیون خود را پیدا کنیم تا
614
00:21:32,360 –> 00:21:34,280
بهترین خط تناسب را پیدا کنیم و
615
00:21:34,280 –> 00:21:36,560
y خود را برابر MX به اضافه C در نظر بگیریم، بنابراین ما به
616
00:21:36,560 –> 00:21:39,320
دنبال M و C هستیم، بنابراین برای یافتن این معادله
617
00:21:39,320 –> 00:21:42,110
برای داده های خود، باید آن را پیدا کنیم. شیب M
618
00:21:42,110 –> 00:21:45,260
و ضریب ما C و y
619
00:21:45,260 –> 00:21:49,430
برابر است با MX به اضافه C که در آن M eq
620
00:21:49,430 –> 00:21:53,090
مجموع X منهای X ضربدر y منهای y
621
00:21:53,090 –> 00:21:55,730
میانگین یا Y یعنی و X به معنای بیش از
622
00:21:55,730 –> 00:21:59,210
مجموع x منهای x به معنای مجذور است،
623
00:21:59,210 –> 00:22:00,800
به این ترتیب شیب مقدار
624
00:22:00,800 –> 00:22:02,750
خط را بدست می آوریم و به راحتی می توانیم با ایجاد چند ستون این کار را انجام دهیم.
625
00:22:02,750 –> 00:22:04,870
در اینجا ما
626
00:22:04,870 –> 00:22:06,530
کامپیوترهای XY واقعاً در مورد
627
00:22:06,530 –> 00:22:08,720
تکرار از طریق داده ها خوب هستند و بنابراین ما
628
00:22:08,720 –> 00:22:10,850
می توانیم به راحتی این را محاسبه کنیم و
629
00:22:10,850 –> 00:22:13,490
نموداری از داده ها را پر کنیم و در نمودار ما
630
00:22:13,490 –> 00:22:15,830
به راحتی می توانید ببینید که اگر مقدار x ما
631
00:22:15,830 –> 00:22:18,890
1 باشد و اگر X I یا به یاد داشته باشید
632
00:22:18,890 –> 00:22:21,650
مقدار میانگین 3 1 منهای 3 برابر با
633
00:22:21,650 –> 00:22:25,190
منفی 2 و 2 منهای 3 برابر با
634
00:22:25,190 –> 00:22:28,039
منفی 1 است و به همین ترتیب و
635
00:22:28,039 –> 00:22:30,320
به راحتی می توانیم ستون X منهای X I
636
00:22:30,320 –> 00:22:34,190
Y منهای y I را پر کنیم و سپس از آنها می
637
00:22:34,190 –> 00:22:37,549
توانیم X منهای X I را محاسبه کنیم. مربع و X منهای
638
00:22:37,549 –> 00:22:40,700
X I ضربدر y منهای y I و می توانید حدس
639
00:22:40,700 –> 00:22:42,470
بزنید که مرحله بعدی این است که به جلو بروید و
640
00:22:42,470 –> 00:22:43,730
ستون های مختلف
641
00:22:43,730 –> 00:22:46,100
پاسخ های مورد نیاز خود را جمع آوری کنید، بنابراین مجموعاً
642
00:22:46,100 –> 00:22:49,070
برای X منهای X I مجذور 10 و مجموع 10 بدست می آوریم.
643
00:22:49,070 –> 00:22:52,120
2 برای X منهای X I ضربدر y منهای y I
644
00:22:52,120 –> 00:22:55,730
و آنها را وصل می کنیم 2/10 بدست می آوریم که
645
00:22:55,730 –> 00:22:57,770
برابر است با p Oint 2 بنابراین اکنون می دانیم که
646
00:22:57,770 –> 00:23:00,110
شیب خط ما برابر با نقطه 2 است بنابراین می
647
00:23:00,110 –> 00:23:02,150
توانیم مقدار C را محاسبه کنیم که
648
00:23:02,150 –> 00:23:03,679
مرحله بعدی است که باید بدانیم کجا
649
00:23:03,679 –> 00:23:06,320
از محور y عبور می کند و اگر
650
00:23:06,320 –> 00:23:08,179
به خاطر داشته باشید قبلاً اشاره کردم که
651
00:23:08,179 –> 00:23:10,669
رگرسیون خطی خط باید
652
00:23:10,669 –> 00:23:13,490
از مقدار میانگین عبور کند و چیزی که
653
00:23:13,490 –> 00:23:15,409
قبلا نشان دادیم، میتوانیم
654
00:23:15,409 –> 00:23:17,510
به آن نمودار برگردیم و میتوانید
655
00:23:17,510 –> 00:23:19,250
دقیقاً اینجا ببینید که مقدار میانگین ما وجود دارد
656
00:23:19,250 –> 00:23:22,850
که 3 x برابر 3 و y برابر با 2.8 است و
657
00:23:22,850 –> 00:23:25,370
از آنجایی که ما آن مقدار را میدانیم. ما به سادگی می توانیم
658
00:23:25,370 –> 00:23:28,940
آن را به فرمول خود وصل کنیم که y برابر با
659
00:23:28,940 –> 00:23:31,400
نقطه 2 X به اضافه C است، بنابراین ما آن را وصل می کنیم
660
00:23:31,400 –> 00:23:35,390
که 2.8 برابر 0.2 برابر 3 به علاوه C می شود و
661
00:23:35,390 –> 00:23:37,580
شما فقط می توانید C را حل کنید، بنابراین اکنون می دانیم
662
00:23:37,580 –> 00:23:39,710
که ضریب ما برابر است با دو نقطه
663
00:23:39,710 –> 00:23:42,470
دو و یک بار ما تمام آنچه را که میتوانیم ادامه دهیم
664
00:23:42,470 –> 00:23:44,990
و خط رگرسیون y
665
00:23:44,990 –> 00:23:47,690
برابر با 0.2 برابر X به اضافه دو نقطه دو ترسیم کنیم
666
00:23:47,690 –> 00:23:50,390
و سپس از این معادله میتوانیم
667
00:23:50,390 –> 00:23:53,330
مقادیر جدیدی را محاسبه کنیم، بنابراین بیایید
668
00:23:53,330 –> 00:23:56,179
مقادیر Y را با استفاده از x مساوی یک دو سه
669
00:23:56,179 –> 00:23:58,370
چهار پنج پیشبینی کنیم و نقاط را رسم کنیم.
670
00:23:58,370 –> 00:24:00,200
یک دو سه چهار پنج را به خاطر بسپار مقادیر X اصلی بود،
671
00:24:00,200 –> 00:24:02,600
بنابراین اکنون میخواهیم ببینیم که Y چه چیزی
672
00:24:02,600 –> 00:24:04,549
فکر میکند که واقعاً
673
00:24:04,549 –> 00:24:07,909
نیستند و آنها را وصل میکنیم و Y را میگیریم
674
00:24:07,909 –> 00:24:10,280
که با Y از P تعیین کردهام، میتوانید ببینید که
675
00:24:10,280 –> 00:24:12,470
x مساوی یک برابر است با دو نقطه چهار x
676
00:24:12,470 –> 00:24:14,510
برابر است. دو به نقطه شش می رود و غیره
677
00:24:14,510 –> 00:24:15,470
و به
678
00:24:15,470 –> 00:24:18,440
همین ترتیب بنابراین ما مقادیر پیش بینی شده y خود را از
679
00:24:18,440 –> 00:24:20,149
آنچه که فکر می کنیم می شود داشته باشیم،
680
00:24:20,149 –> 00:24:21,830
آن اعداد را وارد می کنیم و وقتی
681
00:24:21,830 –> 00:24:22,370
پیش بینی شده را
682
00:24:22,370 –> 00:24:24,770
همراه با مقادیر واقعی رسم می کنیم، می توانیم تفاوت را ببینیم
683
00:24:24,770 –> 00:24:26,630
و این یکی از
684
00:24:26,630 –> 00:24:28,010
چیزهایی که با
685
00:24:28,010 –> 00:24:29,510
رگرسیون خطی در هر یک از این مدلها بسیار مهم است
686
00:24:29,510 –> 00:24:31,610
درک خطا است و بنابراین ما میتوانیم
687
00:24:31,610 –> 00:24:33,050
خطا را روی همه
688
00:24:33,050 –> 00:24:34,550
مقادیر مختلف خود محاسبه کنیم و میتوانید در
689
00:24:34,550 –> 00:24:38,090
اینجا ببینید x و y و Y را پیشبینی
690
00:24:38,090 –> 00:24:39,980
کردهایم و ترسیم کردیم. یک خط کوچک می
691
00:24:39,980 –> 00:24:41,300
توانید ببینید که خطا در آنجا بین نقاط مختلف چگونه به نظر می رسد
692
00:24:41,300 –> 00:24:43,430
، بنابراین هدف ما
693
00:24:43,430 –> 00:24:45,530
کاهش این خطا است، ما می خواهیم
694
00:24:45,530 –> 00:24:47,990
مقدار خطا را در مدل رگرسیون خطی خود
695
00:24:47,990 –> 00:24:50,270
696
00:24:50,270 –> 00:24:52,580
به حداقل برسانیم و فاصله را به حداقل برسانیم، راه های زیادی برای به حداقل رساندن
697
00:24:52,580 –> 00:24:54,380
فاصله وجود دارد. بین تی خط او و نقاط داده
698
00:24:54,380 –> 00:24:57,290
مانند مجموع مجذور خطاها مجموع
699
00:24:57,290 –> 00:24:59,870
خطاهای مطلق ریشه میانگین مربع خطا
700
00:24:59,870 –> 00:25:02,480
و غیره ما این خط را در
701
00:25:02,480 –> 00:25:04,220
نقاط داده حرکت می دهیم تا مطمئن شویم بهترین
702
00:25:04,220 –> 00:25:06,590
خط برازش حداقل فاصله مربع را
703
00:25:06,590 –> 00:25:07,880
بین نقاط داده و
704
00:25:07,880 –> 00:25:10,340
خط رگرسیون دارد. برای جمع بندی با یک
705
00:25:10,340 –> 00:25:12,710
مدل رگرسیون خطی بسیار ساده، ابتدا
706
00:25:12,710 –> 00:25:14,900
فرمول خط خود را
707
00:25:14,900 –> 00:25:16,610
از وسط مشخص می کنیم و سپس به آرامی
708
00:25:16,610 –> 00:25:18,890
خط را تنظیم می کنیم تا خطا را به حداقل برسانیم،
709
00:25:18,890 –> 00:25:20,870
به خاطر داشته باشید که این یک فرمول بسیار ساده
710
00:25:20,870 –> 00:25:22,880
است که ریاضی بدست می آورد حتی اگر
711
00:25:22,880 –> 00:25:24,830
ریاضی بسیار باشد. همانطور که ابعاد مختلف را اضافه می کنیم بسیار پیچیده تر می شود،
712
00:25:24,830 –> 00:25:26,960
713
00:25:26,960 –> 00:25:28,370
بنابراین این فقط دو
714
00:25:28,370 –> 00:25:31,880
بعد y برابر است با MX به علاوه C، اما شما
715
00:25:31,880 –> 00:25:35,660
می توانید آن را به X Z ijq تمام
716
00:25:35,660 –> 00:25:37,280
ویژگی های مختلف موجود در آنجا را بردارید و آنها می توانند
717
00:25:37,280 –> 00:25:39,050
یک مدل رگرسیون خطی را روی همه ترسیم کنند. از بین
718
00:25:39,050 –> 00:25:41,000
کسانی که از فرمول های مختلف برای به
719
00:25:41,000 –> 00:25:43,490
حداقل رساندن خطا استفاده می کنند، اجازه دهید پیش برویم و
720
00:25:43,490 –> 00:25:45,350
به درخت های تصمیم نگاهی بیندازیم، روش بسیار
721
00:25:45,350 –> 00:25:47,240
متفاوتی برای حل مسائل در
722
00:25:47,240 –> 00:25:49,429
درخت تصمیم مدل رگرسیون خطی،
723
00:25:49,429 –> 00:25:51,590
درخت است. الگوریتم شکلی که برای
724
00:25:51,590 –> 00:25:53,690
تعیین مسیر عمل استفاده میشود، هر شاخه
725
00:25:53,690 –> 00:25:55,280
از درخت،
726
00:25:55,280 –> 00:25:58,010
تصمیم یا جریانها یا واکنش احتمالی را نشان میدهد که دادههایی را در اختیار داریم
727
00:25:58,010 –> 00:26:00,679
که به ما میگوید آیا روز خوبی
728
00:26:00,679 –> 00:26:03,170
برای بازی گلف است و آیا قرار است این
729
00:26:03,170 –> 00:26:05,780
دادهها را در یک صفحه گسترده باز کنیم. می توانید
730
00:26:05,780 –> 00:26:07,850
ببینید که ما چشم انداز داریم که آیا
731
00:26:07,850 –> 00:26:11,150
هوا بارانی است، دمای آفتابی گرم،
732
00:26:11,150 –> 00:26:15,410
رطوبت ملایم خنک باد، و آیا دوست
733
00:26:15,410 –> 00:26:17,270
داشتم آن روز گلف بازی کنم، بله یا خیر،
734
00:26:17,270 –> 00:26:19,670
بنابراین ما در حال انجام سرشماری هستیم و
735
00:26:19,670 –> 00:26:21,260
مطمئناً نمی خواهم رایانه ای به من بگوید چه زمانی
736
00:26:21,260 –> 00:26:23,179
من باید بروم گلف بازی کنم یا نه، اما
737
00:26:23,179 –> 00:26:24,740
می توانید تصور کنید که اگر شب
738
00:26:24,740 –> 00:26:26,120
قبل از اینکه سعی کنید برای روزتان برنامه ریزی کنید
739
00:26:26,120 –> 00:26:28,490
از خواب بیدار شوید و بگوید فردا صبح
740
00:26:28,490 –> 00:26:30,290
روز خوبی برای گلف شما خواهد
741
00:26:30,290 –> 00:26:31,760
بود نه روز خوبی. روز
742
00:26:31,760 –> 00:26:33,500
بعد از ظهر یا چیزی شبیه به
743
00:26:33,500 –> 00:26:35,300
آن بسیار سودمند می شود و ما
744
00:26:35,300 –> 00:26:36,000
این را در بسیاری از
745
00:26:36,000 –> 00:26:37,650
برنامه های کاربردی می بینیم که اکنون
746
00:26:37,650 –> 00:26:39,630
به شما پیشنهاد می دهد و به شما امکان
747
00:26:39,630 –> 00:26:42,180
می دهد بدانید چه چیزی برای
748
00:26:42,180 –> 00:26:43,770
روز بعد یا خرید بعدی یا خرید بعدی شما مناسب است.
749
00:26:43,770 –> 00:26:46,440
بعدی چه شما می دانید که وعده غذایی بعدی
750
00:26:46,440 –> 00:26:48,780
در این مورد فردا یک روز خوب
751
00:26:48,780 –> 00:26:50,370
برای بازی گلف بر اساس آب
752
00:26:50,370 –> 00:26:52,710
و هوای آینده است و بنابراین ما می آییم و بیایید
753
00:26:52,710 –> 00:26:55,140
تعیین کنیم که آیا زمانی که روز آفتابی و باد است باید گلف بازی کنید یا خیر،
754
00:26:55,140 –> 00:26:57,510
بنابراین ما
755
00:26:57,510 –> 00:26:58,800
پیش بینی فردا را فهمیدیم
756
00:26:58,800 –> 00:27:01,350
آفتابی و بادی خواهد بود و فرض کنید درختمان را به
757
00:27:01,350 –> 00:27:03,090
این شکل می کشیم، رطوبت خود را
758
00:27:03,090 –> 00:27:05,040
خواهیم داشت و سپس نرمال خود را داریم
759
00:27:05,040 –> 00:27:07,860
، یعنی اگر
760
00:27:07,860 –> 00:27:09,660
رطوبت معمولی داشته باشید، می روید گلف بازی کنید و
761
00:27:09,660 –> 00:27:11,970
اگر رطوبت هوا بالا باشد. واقعاً بالاست، پس ما
762
00:27:11,970 –> 00:27:13,560
به چشم انداز نگاه می کنیم و اگر چشم
763
00:27:13,560 –> 00:27:16,140
انداز آفتابی ابری یا بارانی باشد،
764
00:27:16,140 –> 00:27:18,480
کاری را که انتخاب می کنید تغییر می دهد، بنابراین اگر می
765
00:27:18,480 –> 00:27:21,030
دانید که رطوبت بسیار زیاد است و هوا
766
00:27:21,030 –> 00:27:22,710
آفتابی است، احتمالاً
767
00:27:22,710 –> 00:27:24,000
گلف بازی نمی کنید زیرا خواهید بود.
768
00:27:24,000 –> 00:27:26,220
مبارزه با پشههایی
769
00:27:26,220 –> 00:27:28,110
که به شما میپیوندند تا با شما گلف بازی کنند،
770
00:27:28,110 –> 00:27:29,460
شاید اگر بارانی است،
771
00:27:29,460 –> 00:27:30,480
احتمالاً نمیخواهید زیر باران بازی کنید،
772
00:27:30,480 –> 00:27:32,520
اما اگر هوا کمی ابری باشد،
773
00:27:32,520 –> 00:27:35,370
سایهی مناسب را دریافت میکنید که روز خوبی
774
00:27:35,370 –> 00:27:37,560
برای بازی گلف است. بیرون باشد
775
00:27:37,560 –> 00:27:40,020
اکنون در این مثال،
776
00:27:40,020 –> 00:27:42,000
احتمالاً میتوانید درخت خود را
777
00:27:42,000 –> 00:27:43,950
به راحتی بسازید، مجموعهای از دادهها و هوای بیش از حد ساده
778
00:27:43,950 –> 00:27:46,200
که وارد آن میشوند، اما سؤال این است که چگونه
779
00:27:46,200 –> 00:27:47,640
میدانید چه چیزی را باید در کجا تقسیم
780
00:27:47,640 –> 00:27:49,050
کنید، چه اگر این دادهها بسیار
781
00:27:49,050 –> 00:27:51,180
پیچیدهتر باشد. در جایی که چیزی نیست
782
00:27:51,180 –> 00:27:53,190
که شما بخصوص
783
00:27:53,190 –> 00:27:55,950
مانند مطالعه سرطان درک کنید،
784
00:27:55,950 –> 00:27:57,960
آنها حدود 36 اندازه گیری از
785
00:27:57,960 –> 00:28:00,540
سلول های سرطانی را انجام می دهند و سپس هر یک از
786
00:28:00,540 –> 00:28:02,730
آن اندازه گیری ها نشان می دهد که چقدر
787
00:28:02,730 –> 00:28:04,560
پیازدار است چقدر گشاد است که
788
00:28:04,560 –> 00:28:06,690
لبه ها چقدر تیز هستند که ما به عنوان یک
789
00:28:06,690 –> 00:28:08,880
انسان آن را انجام می دهیم.
790
00:28:08,880 –> 00:28:10,860
نمیدانیم چگونه میتوانیم تصمیم بگیریم که چگونه
791
00:28:10,860 –> 00:28:12,990
دادهها را تقسیم کنیم و آیا
792
00:28:12,990 –> 00:28:14,670
درخت تصمیم درست است، اما سؤالاتی
793
00:28:14,670 –> 00:28:16,680
پیش میآید که آیا این درخت تصمیم درست است
794
00:28:16,680 –> 00:28:19,410
که باید آنتروپی را محاسبه کنیم و
795
00:28:19,410 –> 00:28:22,500
اطلاعات دو کلمه مهم واژگانی را به دست آوریم.
796
00:28:22,500 –> 00:28:24,810
آنتروپی صفر و
797
00:28:24,810 –> 00:28:27,240
آنتروپی اطلاعات به دست آمده
798
00:28:27,240 –> 00:28:30,240
معیاری از تصادفی بودن یا ناخالصی
799
00:28:30,240 –> 00:28:33,000
در مجموعه داده است آنتروپی باید کم باشد بنابراین
800
00:28:33,000 –> 00:28:34,470
ما می خواهیم هرج و مرج ایجاد شود. برای اینکه تا حد
801
00:28:34,470 –> 00:28:36,600
امکان پایین باشد، نمی خواهیم به آن نگاه کنیم و
802
00:28:36,600 –> 00:28:38,670
با تصاویر یا
803
00:28:38,670 –> 00:28:40,680
آنچه در آنجا با داده های مختلط می گذرد گیج شویم و
804
00:28:40,680 –> 00:28:42,740
اطلاعات به دست آمده از آن معیاری برای
805
00:28:42,740 –> 00:28:45,480
کاهش آنتروپی پس از تقسیم مجموعه داده ها است که به
806
00:28:45,480 –> 00:28:49,410
آن نیز معروف است.
807
00:28:49,410 –> 00:28:51,780
بهره اطلاعات کاهش آنتروپی باید زیاد باشد، بنابراین
808
00:28:51,780 –> 00:28:53,730
میخواهیم اطلاعات ما که از تقسیم خارج میشویم
809
00:28:53,730 –> 00:28:55,680
تا حد امکان بالا باشد،
810
00:28:55,680 –> 00:28:57,930
اجازه دهید نگاهی به آنتروپی از جنبه ریاضی بیندازیم،
811
00:28:57,930 –> 00:29:00,540
در این مورد،
812
00:29:00,540 –> 00:29:03,840
آنتروپی را به عنوان I از P eV نشان میدهیم. و
813
00:29:03,840 –> 00:29:07,200
در جایی که P احتمال این است که
814
00:29:07,200 –> 00:29:09,750
شما یک بازی گلف بازی کنید و
815
00:29:09,750 –> 00:29:11,520
در آن احتمالی است که شما
816
00:29:11,520 –> 00:29:13,200
بازی گلف را
817
00:29:13,200 –> 00:29:14,430
انجام نمی دهید اکنون واقعاً لازم نیست این فرمول ها را به خاطر بسپارید
818
00:29:14,430 –> 00:29:16,350
، تعدادی از آنها وجود دارد. آنها
819
00:29:16,350 –> 00:29:17,640
بسته به چیزی که با آن کار می کنید وجود دارد،
820
00:29:17,640 –> 00:29:19,290
اما مهم است که توجه داشته باشید
821
00:29:19,290 –> 00:29:20,790
که این فرمول از اینجا می آید، بنابراین
822
00:29: