در این مطلب، ویدئو درخت تصمیم | درخت تصمیم در پایتون | الگوریتم های یادگیری ماشین | ادورکا | ML Rewind – 6 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:46:50
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:10,240 –> 00:00:12,960
سلام به همه، صبح بخیر
2
00:00:12,960 –> 00:00:15,759
عصر به همه، امیدوارم که
3
00:00:15,759 –> 00:00:17,600
همه چیز خوبی داشته باشید،
4
00:00:17,600 –> 00:00:18,960
پس
5
00:00:18,960 –> 00:00:21,760
بیایید با وبینار امروز شروع کنیم
6
00:00:21,760 –> 00:00:24,000
و موضوع وبینار امروز
7
00:00:24,000 –> 00:00:27,760
درخت تصمیم است، جایی که سعی می
8
00:00:27,760 –> 00:00:30,000
کنم بینش های مختلفی را در مورد نحوه ساختن به شما ارائه دهم.
9
00:00:30,000 –> 00:00:32,640
درخت تصمیم و چگونه
10
00:00:32,640 –> 00:00:36,320
میتوانیم آن را به عنوان یک الگوریتم طبقهبندی
11
00:00:36,320 –> 00:00:38,399
انجام دهیم، بنابراین بیایید با الگوریتم درخت تصمیم
12
00:00:38,399 –> 00:00:39,760
13
00:00:39,760 –> 00:00:41,440
شروع کنیم، بنابراین با آنچه که
14
00:00:41,440 –> 00:00:43,600
طبقهبندی است شروع
15
00:00:43,600 –> 00:00:45,760
میکنیم، سپس به سراغ شما میرویم،
16
00:00:45,760 –> 00:00:48,239
مانند انواع طبقهبندی که داریم،
17
00:00:48,239 –> 00:00:50,160
سپس به موارد استفاده طبقه بندی بروید
18
00:00:50,160 –> 00:00:51,199
19
00:00:51,199 –> 00:00:53,920
، درخت تصمیم درست
20
00:00:53,920 –> 00:00:56,239
چیست و اصطلاحاتی که در
21
00:00:56,239 –> 00:00:58,640
ارتباط با درخت تصمیم به کار می رود،
22
00:00:58,640 –> 00:01:00,960
تجسم درخت تصمیم و
23
00:01:00,960 –> 00:01:03,440
تخصص عملی در درخت تصمیم
24
00:01:03,440 –> 00:01:05,360
چیست، بنابراین اول از همه بیایید با طبقه بندی شروع کنیم،
25
00:01:05,360 –> 00:01:09,439
پس طبقه بندی چیست؟
26
00:01:09,439 –> 00:01:11,119
و اگر بخواهم در مورد طبقه بندی به شما بگویم
27
00:01:11,119 –> 00:01:12,560
28
00:01:12,560 –> 00:01:13,760
29
00:01:13,760 –> 00:01:16,560
مثلاً آنچه اتفاق می افتد این است
30
00:01:16,560 –> 00:01:18,960
که وقتی در مورد لیر ماشینی یادگیری ماشین صحبت می کنیم دو نوع داریم
31
00:01:18,960 –> 00:01:20,720
ning
32
00:01:20,720 –> 00:01:22,720
چیزی نیست، اما شما می دانید مانند یک سری
33
00:01:22,720 –> 00:01:24,720
دستورالعمل های زیادی که آن را به
34
00:01:24,720 –> 00:01:26,720
رایانه می دهید تا بتواند
35
00:01:26,720 –> 00:01:28,799
الگوهای مجموعه داده های شما را به درستی یاد بگیرد و
36
00:01:28,799 –> 00:01:30,960
به شما مثالی بدهد تصور
37
00:01:30,960 –> 00:01:32,960
کنید یک موضوع پرطرفدار وجود دارد، مثلاً
38
00:01:32,960 –> 00:01:35,360
آن را پیدا کرده اید که می خواهید دریابید که آیا
39
00:01:35,360 –> 00:01:37,759
نخستوزیر مودی
40
00:01:37,759 –> 00:01:39,520
دوباره
41
00:01:39,520 –> 00:01:41,200
نخستوزیر کشور خواهد شد یا خیر،
42
00:01:41,200 –> 00:01:43,680
بنابراین اکنون کاری که انجام خواهید داد این است که
43
00:01:43,680 –> 00:01:45,280
مجموعه دادهها را از چندین
44
00:01:45,280 –> 00:01:48,479
منبع مختلف جمعآوری کنید و
45
00:01:48,479 –> 00:01:51,280
در واقع آن را بسازید. مانند الگوریتمی
46
00:01:51,280 –> 00:01:53,600
که در آن شما یک برچسب به عنوان بله یا
47
00:01:53,600 –> 00:01:55,600
خیر دریافت خواهید کرد بله او به عنوان نخست وزیر بعدی ادامه می دهد
48
00:01:55,600 –> 00:01:57,600
یا خیر او به عنوان
49
00:01:57,600 –> 00:01:59,360
نخست وزیر بعدی ادامه نمی دهد بنابراین
50
00:01:59,360 –> 00:02:01,360
مجموعه داده را جمع آوری کرده و این
51
00:02:01,360 –> 00:02:03,200
مجموعه داده را به کامپیوتر و این فرآیند
52
00:02:03,200 –> 00:02:06,240
53
00:02:06,240 –> 00:02:09,520
در حال حاضر به عنوان یک یادگیری ماشین نامیده می شود، بنابراین اکنون در این مورد آنچه اتفاق می افتد این است که um
54
00:02:09,520 –> 00:02:11,920
بنابراین این در مورد طبقه بندی است،
55
00:02:11,920 –> 00:02:14,480
بنابراین در حال حاضر یادگیری ماشین
56
00:02:14,480 –> 00:02:16,480
اساساً از دو نوع یک است که تحت نظارت نامیده می شود.
57
00:02:16,480 –> 00:02:18,319
یادگیری ماشین دیگری
58
00:02:18,319 –> 00:02:20,080
به عنوان یک یادگیری ماشینی بدون نظارت نامیده می شود
59
00:02:20,080 –> 00:02:21,760
و سومین مورد
60
00:02:21,760 –> 00:02:23,840
یادگیری ماشینی تقویتی است، بنابراین وقتی
61
00:02:23,840 –> 00:02:25,599
در مورد یادگیری ماشین نظارت شده صحبت می کنیم
62
00:02:25,599 –> 00:02:27,599
همانطور که از نام آن پیداست
63
00:02:27,599 –> 00:02:29,760
نظارت درستی را ارائه می دهد، به
64
00:02:29,760 –> 00:02:31,760
عنوان مثال معلمی که کیت را آموزش می دهد
65
00:02:31,760 –> 00:02:34,160
یک یادگیری ماشینی نظارت شده است.
66
00:02:34,160 –> 00:02:36,000
ما نمونههای آموزشدیده را ارائه میدهیم
67
00:02:36,000 –> 00:02:37,840
، مجموعه دادههای آموزشدیده را با
68
00:02:37,840 –> 00:02:40,160
برچسب خالص در بالای آن میدهیم
69
00:02:40,160 –> 00:02:42,319
که به عنوان یادگیری ماشینی نظارت شده نامیده میشود،
70
00:02:42,319 –> 00:02:44,319
بنابراین اگر من
71
00:02:44,319 –> 00:02:46,319
این نوع یادگیری ماشینی را در مقابل شما ترسیم کنم، شبیه به
72
00:02:46,319 –> 00:02:49,040
این یادگیری ماشینی نظارتشده به
73
00:02:49,040 –> 00:02:50,720
نظر میرسد. اتفاق می افتد مانند این است که شما
74
00:02:50,720 –> 00:02:53,040
مجموعه داده ای دارید که یک مجموعه داده ساختاریافته است
75
00:02:53,040 –> 00:02:54,640
و یک ستون دارید که
76
00:02:54,640 –> 00:02:56,800
به عنوان برچسب نامیده می شود آنچه را که می خواهید
77
00:02:56,800 –> 00:02:59,680
پیش بینی کنید خوب است و
78
00:02:59,680 –> 00:03:01,920
پیش بینی کننده های مختلفی خواهید داشت که می خواهید
79
00:03:01,920 –> 00:03:04,000
پیش بینی کنید تا به شما یک به عنوان مثال تصور کنید
80
00:03:04,000 –> 00:03:05,920
که می خواهید قیمت یک
81
00:03:05,920 –> 00:03:08,400
جامعه را پیش بینی کنید خوب شما می خواهید پیش بینی کنید
82
00:03:08,400 –> 00:03:10,319
که قیمت آپارتمان در یک ارتباط خاص چقدر خواهد بود.
83
00:03:10,319 –> 00:03:12,720
وحدت در حال حاضر این می
84
00:03:12,720 –> 00:03:14,720
تواند متغیر باشد، مانند شما می توانید ببینید که
85
00:03:14,720 –> 00:03:16,400
تعداد طبقات آن چقدر خواهد بود
86
00:03:16,400 –> 00:03:18,319
، می توانید متغیری
87
00:03:18,319 –> 00:03:20,480
مانند میزان آلودگی
88
00:03:20,480 –> 00:03:22,400
چند موسسه آموزشی در نزدیکی خود داشته باشید
89
00:03:22,400 –> 00:03:24,400
تا بر اساس آن قیمت گذاری شود.
90
00:03:24,400 –> 00:03:27,040
تغییر اما این نوع یادگیری ماشین نظارت شده
91
00:03:27,040 –> 00:03:28,319
چرا به آن یادگیری ماشین سرپرست می گویند
92
00:03:28,319 –> 00:03:30,879
زیرا ما
93
00:03:30,879 –> 00:03:33,040
متغیر مستقل را ارائه می دهیم یا
94
00:03:33,040 –> 00:03:35,280
پیش بینی کننده ها را نیز ارائه می دهیم
95
00:03:35,280 –> 00:03:37,280
مجموعه داده های برچسب را ارائه می دهیم
96
00:03:37,280 –> 00:03:39,920
خوب اکنون یادگیری ماشین نظارت
97
00:03:39,920 –> 00:03:42,480
شده اساساً از دو نوع است این
98
00:03:42,480 –> 00:03:44,959
یادگیری ماشین نظارت شده یک نوع است.
99
00:03:44,959 –> 00:03:47,440
اولی بهعنوان یادگیری ماشینی نظارتشده مبتنی بر رگرسیون
100
00:03:47,440 –> 00:03:50,080
101
00:03:50,080 –> 00:03:52,159
خوب نامیده میشود و دومی بهعنوان یادگیری
102
00:03:52,159 –> 00:03:54,080
ماشینی نظارتشده مبتنی بر طبقهبندی نامیده میشود،
103
00:03:54,080 –> 00:03:56,000
حالا تفاوت
104
00:03:56,000 –> 00:03:57,360
بین رگرسیون مبتنی بر رگرسیون و یادگیری ماشین نظارتشده مبتنی بر رگرسیون مبتنی بر
105
00:03:57,360 –> 00:03:59,519
طبقهبندی
106
00:03:59,519 –> 00:04:01,519
107
00:04:01,519 –> 00:04:02,879
این است که ماشین
108
00:04:02,879 –> 00:04:04,239
یاد
109
00:04:04,239 –> 00:04:06,400
بگیرید که در آن چیزی که می خواهید پیش بینی کنید
110
00:04:06,400 –> 00:04:09,920
ماهیت پیوسته دارد خوب تصور کنید
111
00:04:09,920 –> 00:04:12,480
که میخواهید قیمتهای انجمن com را درست پیشبینی کنید
112
00:04:12,480 –> 00:04:15,200
که یک مقدار پیوسته است
113
00:04:15,200 –> 00:04:17,440
اگر یک مقدار پیوسته باشد، پس ما
114
00:04:17,440 –> 00:04:19,040
با یادگیری ماشینی مبتنی بر رگرسیون خوب پیش میرویم،
115
00:04:19,040 –> 00:04:21,680
در حالی که
116
00:04:21,680 –> 00:04:23,759
اگر میخواهید چیزی را پیشبینی کنید
117
00:04:23,759 –> 00:04:26,400
که نتیجه گسسته به شما میدهد.
118
00:04:26,400 –> 00:04:28,639
مثالی که میخواهید پیشبینی کنید که آیا
119
00:04:28,639 –> 00:04:30,880
من در مسابقه برنده خواهم
120
00:04:30,880 –> 00:04:33,040
121
00:04:33,040 –> 00:04:34,960
122
00:04:34,960 –> 00:04:36,560
شد یا
123
00:04:36,560 –> 00:04:38,320
124
00:04:38,320 –> 00:04:40,880
125
00:04:40,880 –> 00:04:43,680
خیر. منظورم را درست دریافت کردم، بنابراین
126
00:04:43,680 –> 00:04:46,160
اگر خروجی دارید که میخواهید
127
00:04:46,160 –> 00:04:48,880
پیشبینی کنید به شکل بله یا خیر یا
128
00:04:48,880 –> 00:04:52,160
درست یا غلط است، این به عنوان
129
00:04:52,160 –> 00:04:52,880
130
00:04:52,880 –> 00:04:55,199
یادگیری ماشینی نظارت شده نامیده میشود، اما یادگیری
131
00:04:55,199 –> 00:04:57,199
ماشین نظارت شده مبتنی بر طبقهبندی
132
00:04:57,199 –> 00:04:59,600
خوب است، بنابراین ماشین نظارتشده مبتنی بر طبقهبندی
133
00:04:59,600 –> 00:05:01,199
یادگیری
134
00:05:01,199 –> 00:05:03,759
فرآیند تقسیم مجموعه دادهها به
135
00:05:03,759 –> 00:05:06,160
دستهها یا گروههای مختلف با افزودن
136
00:05:06,160 –> 00:05:09,360
یک برچسب خوب است، بنابراین همیشه به یاد داشته باشید که
137
00:05:09,360 –> 00:05:12,080
هر زمان که بخواهید
138
00:05:12,080 –> 00:05:14,000
هر زمان که میخواهید پیشبینی کنید کلاسهای مجموعه داده
139
00:05:14,000 –> 00:05:15,840
را پیشبینی کنید، میدانید که آیا
140
00:05:15,840 –> 00:05:17,840
این اتفاق میافتد یا خیر،
141
00:05:17,840 –> 00:05:19,280
142
00:05:19,280 –> 00:05:21,759
آیا یک نفر کلاهبرداری از کارت اعتباری انجام میدهد یا خیر، شما دقیقاً
143
00:05:21,759 –> 00:05:23,440
به این نکته توجه میکنید که آیا
144
00:05:23,440 –> 00:05:25,120
کارمند از شرکت خارج میشود
145
00:05:25,120 –> 00:05:27,360
یا خیر. درست نیست که آیا فرد خاص
146
00:05:27,360 –> 00:05:29,360
دیابت را به عنوان یک بیماری خواهد داشت
147
00:05:29,360 –> 00:05:31,520
یا نه همه این سؤالات را در هر کجا که
148
00:05:31,520 –> 00:05:34,080
می خواهید بفهمید بله یا خیر یا درست یا
149
00:05:34,080 –> 00:05:36,080
غلط یا می خواهید کلاس هایی را در
150
00:05:36,080 –> 00:05:38,320
مجموعه داده ها پیش بینی کنید این به عنوان
151
00:05:38,320 –> 00:05:40,560
طبقه بندی مبتنی بر نظارت نامیده می شود.
152
00:05:40,560 –> 00:05:42,000
یادگیری ماشین بسیار خوب است،
153
00:05:42,000 –> 00:05:43,520
بنابراین این چیزی است که به عنوان یادگیری
154
00:05:43,520 –> 00:05:45,280
ماشین نظارت شده مبتنی بر طبقه بندی نامیده می شود
155
00:05:45,280 –> 00:05:47,280
و
156
00:05:47,280 –> 00:05:49,919
امروز به شما آموزش می دهم که
157
00:05:49,919 –> 00:05:51,280
می دانید در مورد اشکال مختلف یادگیری
158
00:05:51,280 –> 00:05:53,199
ماشین نظارت شده مبتنی بر طبقه بندی به شما خواهم گفت،
159
00:05:53,199 –> 00:05:55,680
اگرچه ما
160
00:05:55,680 –> 00:05:58,160
در حال حاضر به درخت تصمیم گیری عمیق خواهیم پرداخت. قادر خواهد
161
00:05:58,160 –> 00:06:00,160
بود درخت تصمیم را درک کند که
162
00:06:00,160 –> 00:06:02,080
چگونه درخت تصمیم به شبکه متصل می شود،
163
00:06:02,080 –> 00:06:04,160
آنچه امروز
164
00:06:04,160 –> 00:06:05,039
با
165
00:06:05,039 –> 00:06:07,039
ماشین نظارت شده مبتنی بر طبقه بندی می آموزیم. خوب
166
00:06:07,039 –> 00:06:08,240
167
00:06:08,240 –> 00:06:09,360
یاد نمی
168
00:06:09,360 –> 00:06:12,560
گیریم، حالا ما الگوریتم های مختلفی داریم
169
00:06:12,560 –> 00:06:14,960
الگوریتم چیزی نیست جز مجموعه ای از
170
00:06:14,960 –> 00:06:18,000
معادلات ریاضی برای طبقه بندی مبتنی
171
00:06:18,000 –> 00:06:20,479
بر یادگیری ماشینی نظارت شده ما اول از
172
00:06:20,479 –> 00:06:22,400
همه چیزی به نام
173
00:06:22,400 –> 00:06:24,560
درخت تصمیم داریم، سپس چیزی به
174
00:06:24,560 –> 00:06:27,120
نام جنگل تصادفی و سپس پایه چاقو و
175
00:06:27,120 –> 00:06:29,440
سپس k nn که به عنوان k نزدیکترین همسایه نامیده می شود،
176
00:06:29,440 –> 00:06:31,840
خوب است، بنابراین اجازه دهید چند
177
00:06:31,840 –> 00:06:33,680
گزاره در مورد این الگوریتم به شما بدهم و
178
00:06:33,680 –> 00:06:35,840
ما بسیاری دیگر را داریم، اما امروز ما بر
179
00:06:35,840 –> 00:06:38,560
روی یکی از آنها که درخت تصمیم است تمرکز می کنیم،
180
00:06:38,560 –> 00:06:40,800
بنابراین اکنون ابتدا اجازه دهید با درخت تصمیم شروع کنیم و
181
00:06:40,800 –> 00:06:42,960
حالا چیست؟ درخت تصمیم چیزی است که
182
00:06:42,960 –> 00:06:44,639
من به شما می گفتم باور کنید یا نه
183
00:06:44,639 –> 00:06:47,199
درخت تصمیم چیزی است که شما هر
184
00:06:47,199 –> 00:06:49,039
روز در
185
00:06:49,039 –> 00:06:51,199
زندگی روزمره خود از آن استفاده می کنید، به عنوان مثال تصمیم می گیرید
186
00:06:51,199 –> 00:06:54,000
و برای امتحان امروز نیز
187
00:06:54,000 –> 00:06:55,919
تصمیم گرفتید در این وبینار شرکت کنید،
188
00:06:55,919 –> 00:06:59,039
اما چگونه می توانید تصمیمی را
189
00:06:59,039 –> 00:07:01,599
بر اساس تصمیمات مختلف بیشتر بگیرید،
190
00:07:01,599 –> 00:07:03,520
به عنوان مثال برای امروز که به وبینار ملحق می
191
00:07:03,520 –> 00:07:06,560
شوید، دیدید که خوب، وقتی
192
00:07:06,560 –> 00:07:08,960
این وبینار تقریباً خوب است، بنابراین شما گفتید
193
00:07:08,960 –> 00:07:11,039
این روز هفته یا آخر هفته است، پس ممکن
194
00:07:11,039 –> 00:07:13,039
است گفته باشید درست
195
00:07:13,039 –> 00:07:15,039
ساعت وبینار را بررسی کنید، سپس ممکن است آن را
196
00:07:15,039 –> 00:07:16,560
بررسی کرده باشید که موضوع
197
00:07:16,560 –> 00:07:19,599
وبینار چیست و چه کسی
198
00:07:19,599 –> 00:07:21,680
این وبینار را برگزار می کند، بنابراین بر اساس این موضوع، تصمیم
199
00:07:21,680 –> 00:07:23,840
گرفتید تصمیم
200
00:07:23,840 –> 00:07:25,759
بگیرم یا ادامه ندهم، شما راه حل من را درست می گیرید، بنابراین
201
00:07:25,759 –> 00:07:27,520
این چیزی است که به عنوان درخت تصمیم نامیده می شود،
202
00:07:27,520 –> 00:07:29,520
ما آن را درخت تصمیم می نامیم، زیرا
203
00:07:29,520 –> 00:07:31,840
این یک نمایش گرافیکی از تمام
204
00:07:31,840 –> 00:07:33,919
راه حل های ممکن برای یک تصمیم است،
205
00:07:33,919 –> 00:07:36,720
مانند یک درخت درخت تصمیم مانند
206
00:07:36,720 –> 00:07:39,680
درخت است چرا چون یک درخت نیز با یک ریشه شروع می شود
207
00:07:39,680 –> 00:07:41,759
و سپس به شاخه های مختلف ظاهر می شود به
208
00:07:41,759 –> 00:07:44,080
طور مشابه شما یک درخت تصمیم دارید
209
00:07:44,080 –> 00:07:46,319
که من در اینجا به عنوان ساده ترین الگوریتم به شما نشان می دهم
210
00:07:46,319 –> 00:07:48,800
که اکنون
211
00:07:48,800 –> 00:07:51,280
برای اهداف یادگیری ماشین استفاده
212
00:07:51,280 –> 00:07:53,199
می شود. چیزی شبیه به این است تصور کنید
213
00:07:53,199 –> 00:07:55,759
که می خواهید بفهمید که می
214
00:07:55,759 –> 00:07:57,599
215
00:07:57,599 –> 00:08:00,000
دانید می خواهید به رستوران بروید یا می خواهید یک
216
00:08:00,000 –> 00:08:02,400
همبرگر بخرید خوب است، بنابراین شما دو انتخاب
217
00:08:02,400 –> 00:08:04,560
دارید یا می توانید به رستوران بروید
218
00:08:04,560 –> 00:08:06,560
یا یکی اکنون می توانید یک همبرگر بخرید چگونه
219
00:08:06,560 –> 00:08:08,400
تصمیم می گیرید کدام یک را
220
00:08:08,400 –> 00:08:10,960
دنبال کنید تا با چیزی که
221
00:08:10,960 –> 00:08:12,560
به عنوان نت ریشه نامیده می شود شروع کنید و
222
00:08:12,560 –> 00:08:14,560
با این نت شروع کنید که آیا من
223
00:08:14,560 –> 00:08:18,240
گرسنه هستم یا نه اگر درست گرسنه
224
00:08:18,240 –> 00:08:20,879
باشم فقط من
225
00:08:20,879 –> 00:08:23,759
اگر من اصلا گرسنه نباشم، تمام این فعالیت ها را انجام خواهم داد، پس
226
00:08:23,759 –> 00:08:26,639
به سادگی برو و بخواب، منظورم را درست متوجه شدی،
227
00:08:26,639 –> 00:08:28,160
بنابراین اینگونه
228
00:08:28,160 –> 00:08:29,919
با اولین یادداشت شروع می کنی، یعنی متوجه می شوی
229
00:08:29,919 –> 00:08:31,680
که آیا احساس گرسنگی می کنم
230
00:08:31,680 –> 00:08:34,159
یا نه. من احساس گرسنگی می
231
00:08:34,159 –> 00:08:35,679
کنم پس تصمیم می گیرم که
232
00:08:35,679 –> 00:08:38,000
خوب من پول دارم که اگر پول داشته باشم حدود
233
00:08:38,000 –> 00:08:41,279
25 ارزش دارد،
234
00:08:41,279 –> 00:08:43,120
اگر پول نداشته باشم به رستوران می روم
235
00:08:43,120 –> 00:08:45,440
سپس یک همبرگر می
236
00:08:45,440 –> 00:08:47,600
خرم. سادهترین
237
00:08:47,600 –> 00:08:50,000
نمایش درخت
238
00:08:50,000 –> 00:08:52,160
تصمیم اساساً شما بر
239
00:08:52,160 –> 00:08:55,120
اساس نتایج قبلی تصمیم میگیرید و
240
00:08:55,120 –> 00:08:57,360
میتوانید هر نوع مثالی را در اینجا تصور کنید
241
00:08:57,360 –> 00:08:58,880
تصور کنید که میخواهید بفهمید
242
00:08:58,880 –> 00:09:00,720
که آیا شخص دوباره کلاهبرداری از کارت اعتباری انجام میدهد
243
00:09:00,720 –> 00:09:03,279
یا نه، این به
244
00:09:03,279 –> 00:09:05,440
نتیجه قبلی بستگی دارد. شرایطی که شما kn
245
00:09:05,440 –> 00:09:07,839
به عنوان مثال، این بستگی به این
246
00:09:07,839 –> 00:09:09,760
دارد که حقوق فردی که شما
247
00:09:09,760 –> 00:09:11,600
چقدر است، به مشخصات شغلی
248
00:09:11,600 –> 00:09:13,680
فرد بستگی دارد، به این بستگی دارد که
249
00:09:13,680 –> 00:09:16,000
شما می دانید مثلاً چند کلاهبرداری
250
00:09:16,000 –> 00:09:18,240
یا چند کارت این شخص دارد. درست است
251
00:09:18,240 –> 00:09:19,920
بنابراین بر اساس شما تصمیم می گیرید که
252
00:09:19,920 –> 00:09:21,920
آیا این یک کلاهبرداری از کارت اعتباری انجام می دهد
253
00:09:21,920 –> 00:09:23,600
یا خیر،
254
00:09:23,600 –> 00:09:25,600
بنابراین این ساده ترین شکل
255
00:09:25,600 –> 00:09:28,240
الگوریتم مبتنی بر طبقه بندی است،
256
00:09:28,240 –> 00:09:30,399
سپس ما الگوریتم بعدی را داریم که
257
00:09:30,399 –> 00:09:32,880
به عنوان جنگل تصادفی نامیده می شود و اکنون جنگل تصادفی به عنوان یک جنگل تصادفی نامیده می شود.
258
00:09:32,880 –> 00:09:35,440
نام نشان میدهد که
259
00:09:35,440 –> 00:09:37,519
در آخرین نمونه یک درخت تصمیم
260
00:09:37,519 –> 00:09:39,600
درست کردهاید، اما
261
00:09:39,600 –> 00:09:41,519
یک درخت تصمیم گاهی اوقات میتواند
262
00:09:41,519 –> 00:09:44,480
به عنوان یک مورد مناسب باشد، بنابراین مردم
263
00:09:44,480 –> 00:09:46,560
گفتند که میدانید چرا باید
264
00:09:46,560 –> 00:09:48,959
فقط به یک درخت تصمیم اعتماد کنم، برای مثال،
265
00:09:48,959 –> 00:09:50,800
هر زمان که تصمیم جسورانهای در
266
00:09:50,800 –> 00:09:53,279
زندگی خود میگیرید. شما فقط به یک صدای واحد اعتماد ندارید
267
00:09:53,279 –> 00:09:54,800
درست است
268
00:09:54,800 –> 00:09:56,480
که می خواهید آن را از چندین
269
00:09:56,480 –> 00:09:58,480
نفر مختلف بشنوید تا تصمیم خود را
270
00:09:58,480 –> 00:10:01,279
قوی تر کنید،
271
00:10:01,279 –> 00:10:03,120
اگر پزشک به شما گفت که این نوع دیس را دارید به پزشک مراجعه کنید.
272
00:10:03,120 –> 00:10:05,360
به راحتی باور نمی
273
00:10:05,360 –> 00:10:07,760
کنید که کاری که انجام می دهید این است که
274
00:10:07,760 –> 00:10:09,600
با پزشک دوم دکتر سوم دکتر چهارم نیز صحبت کنید
275
00:10:09,600 –> 00:10:11,839
تا تأیید کنید که این
276
00:10:11,839 –> 00:10:13,200
درست است یا خیر،
277
00:10:13,200 –> 00:10:15,120
بنابراین این همان چیزی است که به عنوان جنگل تصادفی نامیده می شود همانطور که
278
00:10:15,120 –> 00:10:17,440
از نام نشان می دهد که چرا
279
00:10:17,440 –> 00:10:19,200
به آن تصادفی می گویند. جنگل به آن
280
00:10:19,200 –> 00:10:21,440
جنگل تصادفی می گویند، زیرا اکنون شما در حال
281
00:10:21,440 –> 00:10:23,839
ساختن تعداد مختلف
282
00:10:23,839 –> 00:10:26,000
درخت تصمیم در اینجا هستید، مانند جنگلی از همه
283
00:10:26,000 –> 00:10:28,560
درختان است، درست است که دیگر یک
284
00:10:28,560 –> 00:10:31,760
درخت نیست، بلکه جنگلی از درختان کامل
285
00:10:31,760 –> 00:10:33,839
است، برای مثال می توانید تصور کنید که
286
00:10:33,839 –> 00:10:36,240
اگر مجموعه داده های آموزشی من است من مجموعه داده های
287
00:10:36,240 –> 00:10:38,320
آموزشی خود را به چندین مثال تقسیم می کنم،
288
00:10:38,320 –> 00:10:40,880
درخت های تصمیم گیری متعددی ساخته می شوند
289
00:10:40,880 –> 00:10:43,680
و سپس بر اساس اکثریت
290
00:10:43,680 –> 00:10:46,160
تصمیم خواهم گرفت که آیا این کار را انجام دهم یا
291
00:10:46,160 –> 00:10:48,480
خیر، بنابراین به عنوان یک نوع بسته بندی نیز نامیده می شود.
292
00:10:48,480 –> 00:10:51,040
روششناسی که در آن
293
00:10:51,040 –> 00:10:53,440
نتیجه مدلهای مختلف
294
00:10:53,440 –> 00:10:55,519
را میآوریم یا نتیجه درختان مختلف را
295
00:10:55,519 –> 00:10:57,920
با هم
296
00:10:57,920 –> 00:11:00,480
میآوریم تا تصمیم قدرتمند خود را
297
00:11:00,480 –> 00:11:02,880
درست کنیم، بنابراین این یک مثال دیگر است این
298
00:11:02,880 –> 00:11:04,959
الگوریتم دیگری است که به نام
299
00:11:04,959 –> 00:11:08,000
جنگل تصادفی
300
00:11:08,079 –> 00:11:10,320
و بعد از جنگل تصادفی
301
00:11:10,320 –> 00:11:13,360
چیزی به نام پایه چاقو داریم،
302
00:11:13,360 –> 00:11:15,760
حالا الگوریتم پایه
303
00:11:15,760 –> 00:11:18,800
چاقویی ساده ترین الگوریتم است، اما بیز
304
00:11:18,800 –> 00:11:21,120
ساده اساساً بر اساس
305
00:11:21,120 –> 00:11:24,240
قضیه بیز است، بسیار خوب، بنابراین این الگوریتم
306
00:11:24,240 –> 00:11:26,079
اساساً بر اساس قضیه پایه است. و
307
00:11:26,079 –> 00:11:28,160
قضیه پایه بر اساس احتمال شرطی
308
00:11:28,160 –> 00:11:29,440
309
00:11:29,440 –> 00:11:32,160
درست است، بنابراین بر اساس احتمال شرطی است
310
00:11:32,160 –> 00:11:34,560
که ساده لوح شما
311
00:11:34,560 –> 00:11:38,480
در حال حاضر در نام این است که چه اتفاقی می افتد مانند
312
00:11:38,480 –> 00:11:39,920
ما تصمیم
313
00:11:39,920 –> 00:11:41,920
می گیریم که آیا چیزی اتفاق می افتد یا
314
00:11:41,920 –> 00:11:45,680
نه بر اساس احتمال، بنابراین اجازه دهید
315
00:11:45,680 –> 00:11:48,240
من توضیح دهم شما با این مثال
316
00:11:48,240 –> 00:11:50,800
تصور کنید که می خواهید بفهمید
317
00:11:50,800 –> 00:11:54,240
که آیا من یک بیماری دارم یا خیر،
318
00:11:54,240 –> 00:11:57,360
بنابراین اول از همه احتمال
319
00:11:57,360 –> 00:12:00,079
ابتلا به بیماری 0.10
320
00:12:00,079 –> 00:12:02,320
و احتمال عدم ابتلا به
321
00:12:02,320 –> 00:12:05,760
بیماری 0.90 است، پس اگر احتمال وجود داشته باشد، خوب است.
322
00:12:05,760 –> 00:12:09,200
از داشتن یک بیماری 0.10 است
323
00:12:09,200 –> 00:12:11,200
، در ادامه متوجه
324
00:12:11,200 –> 00:12:12,800
325
00:12:12,800 –> 00:12:16,079
خواهید شد که با توجه به اینکه من
326
00:12:16,079 –> 00:12:17,519
بیمار
327
00:12:17,519 –> 00:12:20,000
هستم، احتمال مثبت شدن آزمایش من چقدر است. آزمایش برای
328
00:12:20,000 –> 00:12:22,160
تشخیص بیماری منفی است با توجه به اینکه
329
00:12:22,160 –> 00:12:23,440
من یک بیماری دارم
330
00:12:23,440 –> 00:12:25,519
درست به همین ترتیب اگر به این
331
00:12:25,519 –> 00:12:27,680
سمت بروید اگر احتمال
332
00:12:27,680 –> 00:12:30,320
ابتلا به بیماری 0.90 باشد، متوجه خواهید
333
00:12:30,320 –> 00:12:33,040
شد که
334
00:12:33,040 –> 00:12:35,600
احتمال ابتلا به بیماری چقدر است که یک آزمایش
335
00:12:35,600 –> 00:12:38,480
مثبت است. با داشتن بدون بیماری
336
00:12:38,480 –> 00:12:40,959
و احتمال عدم وجود بیماری چقدر است،
337
00:12:40,959 –> 00:12:42,880
من بیماری را ندارم که
338
00:12:42,880 –> 00:12:45,920
0.90 است، بنابراین اساساً در اینجا شما
339
00:12:45,920 –> 00:12:47,519
نتایج را
340
00:12:47,519 –> 00:12:49,680
در اینجا بررسی می کنید که نتیجه
341
00:12:49,680 –> 00:12:51,760
همه قسمت ها را بررسی می کنید همه ترکیبات ممکن
342
00:12:51,760 –> 00:12:53,600
این چیزی است که به آن می گویند.
343
00:12:53,600 –> 00:12:56,320
الگوریتم بیس
344
00:12:56,320 –> 00:12:58,079
ساده یا قضیه پایه یا
345
00:12:58,079 –> 00:13:00,079
می دانید قضیه مبتنی بر احتمال شرطی
346
00:13:00,079 –> 00:13:02,240
خوب است،
347
00:13:02,240 –> 00:13:04,320
پس ما چیزی را نیز داریم که
348
00:13:04,320 –> 00:13:06,480
به عنوان نزدیکترین همسایه کلیدی نامیده می شود
349
00:13:06,480 –> 00:13:09,920
که یکی از بهترین الگوریتم ها است
350
00:13:09,920 –> 00:13:13,200
که همچنین به شما در تصمیم گیری
351
00:13:13,200 –> 00:13:15,440
طبقه بندی در حال حاضر کمک می کند که k
352
00:13:15,440 –> 00:13:17,839
نزدیکترین است. همسایه k نزدیکترین همسایه همانطور
353
00:13:17,839 –> 00:13:19,680
که از نام پیداست آنچه در این مورد اتفاق می افتد این
354
00:13:19,680 –> 00:13:22,959
است که ما سعی می کنیم بسازیم شما می دانید که ما سعی می کنیم
355
00:13:22,959 –> 00:13:24,560
356
00:13:24,560 –> 00:13:27,120
اساساً آن را مانند یک همسایه بسازیم بنابراین چیزی است
357
00:13:27,120 –> 00:13:29,040
اگر
358
00:13:29,040 –> 00:13:31,519
مجموعه دادهها را به شما میدهم، بگویم که مجموعه دادههای مشتری را به شما میدهم
359
00:13:31,519 –> 00:13:32,639
360
00:13:32,639 –> 00:13:33,519
خوب است
361
00:13:33,519 –> 00:13:36,000
و این یک مجموعه داده تراکنش است، بنابراین
362
00:13:36,000 –> 00:13:37,920
مشتری شماره
363
00:13:37,920 –> 00:13:40,240
یک محصول شماره یک را
364
00:13:40,240 –> 00:13:42,399
مستقیماً از یک فروشنده خاص با
365
00:13:42,399 –> 00:13:44,399
نرخی خاص خریداری کرده است. سودی که
366
00:13:44,399 –> 00:13:46,720
این مشتری به ما داده است و
367
00:13:46,720 –> 00:13:49,360
این درآمد است، خوب، این مشتری شماره یک کلاس من است، به
368
00:13:49,360 –> 00:13:51,680
طور مشابه،
369
00:13:51,680 –> 00:13:53,760
شما مشتری شماره دو مشتری شماره
370
00:13:53,760 –> 00:13:56,720
سه مشتری شماره چهار در حال حاضر خواهید داشت،
371
00:13:56,720 –> 00:13:59,040
اگر از شما بپرسم که پروفایل مشتری
372
00:13:59,040 –> 00:14:00,160
یکسان
373
00:14:00,160 –> 00:14:02,720
است، همین نزدیکی است. بنابراین کاری که میتوانید انجام دهید این
374
00:14:02,720 –> 00:14:05,279
است که میتوانید مشتریان خود را گروهبندی کنید یا
375
00:14:05,279 –> 00:14:07,360
میدانید که کدام مشتری
376
00:14:07,360 –> 00:14:09,680
به شیوهای مشابه رفتار میکند، بنابراین میتوانید بگویید
377
00:14:09,680 –> 00:14:11,839
که مشتری یک مشتری سه و
378
00:14:11,839 –> 00:14:13,920
مشتری چهار به روشی مشابه رفتار میکنند،
379
00:14:13,920 –> 00:14:16,000
زیرا آنها به ما امتیاز بالایی میدهند.
380
00:14:16,000 –> 00:14:18,800
سود و حاشیه درآمد بالا را فهمیدید،
381
00:14:18,800 –> 00:14:21,680
بنابراین این چیزی است که
382
00:14:21,680 –> 00:14:24,079
در مورد k نزدیکترین همسایه اتفاق می افتد، بنابراین k
383
00:14:24,079 –> 00:14:26,560
نادرترین همسایه، کاری که شما به طور کلی انجام می دهید این است
384
00:14:26,560 –> 00:14:29,040
که متوجه می شوید که
385
00:14:29,040 –> 00:14:32,160
اوه من می توانم برای شما چه کاری انجام دهم. میدانید
386
00:14:32,160 –> 00:14:34,320
نزدیکترین همسایه من کیست،
387
00:14:34,320 –> 00:14:36,000
مانند شباهتهای
388
00:14:36,000 –> 00:14:38,560
الگوهایی که ما داریم، درست این چیزی است که
389
00:14:38,560 –> 00:14:41,519
برای k نزدیکترین همسایه استفاده میکنیم و این
390
00:14:41,519 –> 00:14:43,279
را میبینید که برای مثال الگوریتم
391
00:14:43,279 –> 00:14:45,519
مبتنی بر مکانیسم مبتنی بر فاصله
392
00:14:45,519 –> 00:14:48,320
متوجه میشود که چند نفر یا چه
393
00:14:48,320 –> 00:14:50,880
نوع مخاطبی شبیه به
394
00:14:50,880 –> 00:14:51,920
نتایج
395
00:14:51,920 –> 00:14:53,040
درست است،
396
00:14:53,040 –> 00:14:56,000
بنابراین با موضوع دوم به اینجا بیشتر
397
00:14:56,000 –> 00:14:58,720
میرویم، بیایید به جزئیات در
398
00:14:58,720 –> 00:15:01,600
مورد درخت تصمیمگیری بپردازیم که همه چیز درست است
399
00:15:01,600 –> 00:15:03,839
تا اینجا من
400
00:15:03,839 –> 00:15:06,320
اساس الگوریتم مبتنی بر طبقهبندی را درست
401
00:15:06,320 –> 00:15:08,000
انجام دادهام. انواع مختلفی از
402
00:15:08,000 –> 00:15:10,079
الگوریتم های مبتنی بر طبقه بندی را به شما آموزش می داد، اما از آنجایی
403
00:15:10,079 –> 00:15:12,240
که تمرکز کلاس امروزی
404
00:15:12,240 –> 00:15:14,720
درخت تصمیم است، بیایید به درخت تصمیم شیرجه بزنیم،
405
00:15:14,720 –> 00:15:17,440
پس بیایید
406
00:15:17,440 –> 00:15:20,079
با درخت تصمیم شروع کنیم، درخت تصمیم یک
407
00:15:20,079 –> 00:15:22,560
نمایش گرافیکی از تمام
408
00:15:22,560 –> 00:15:24,880
راه حل های ممکن برای یک تصمیم است. بر اساس یک
409
00:15:24,880 –> 00:15:27,199
شرط معین یعنی چه به این
410
00:15:27,199 –> 00:15:29,920
معناست که به همین سادگی است
411
00:15:29,920 –> 00:15:31,839
که تصور کنید این درخت درست است
412
00:15:31,839 –> 00:15:33,120
پس مانند درختی است
413
00:15:33,120 –> 00:15:34,079
که در آن
414
00:15:34,079 –> 00:15:35,920
شما یک بیانیه مشکلی داشته باشید که آیا
415
00:15:35,920 –> 00:15:39,040
باید یک پیشنهاد شغلی را بپذیرم یا تصور نکنم که
416
00:15:39,040 –> 00:15:40,800
می خواهید بفهمید که آیا
417
00:15:40,800 –> 00:15:43,120
پیشنهاد شغلی را بپذیرم یا نه این یک
418
00:15:43,120 –> 00:15:44,800
بیانیه مشکل است که اکنون در ذهن شما وجود دارد
419
00:15:44,800 –> 00:15:46,240
چگونه این
420
00:15:46,240 –> 00:15:47,920
بیانیه مشکل را با به کمک
421
00:15:47,920 –> 00:15:50,240
درخت تصمیم ما اول از همه
422
00:15:50,240 –> 00:15:52,399
شما با چیزی که ما به عنوان گره ریشه می
423
00:15:52,399 –> 00:15:54,399
نامیم شروع می کنیم، ما با یک گره ریشه شروع می کنیم
424
00:15:54,399 –> 00:15:56,720
که با شما شروع می کنیم تا
425
00:15:56,720 –> 00:15:59,440
بفهمید حقوق چقدر است خوب من چقدر هستم من حقوق چیست؟
426
00:15:59,440 –> 00:16:01,839
من می گیرم اگر حقوقم
427
00:16:01,839 –> 00:16:03,440
428
00:16:03,440 –> 00:16:06,639
برابر یا بیشتر از 50 000 باشد، اگر حقوقم بیشتر از 50 000 نباشد
429
00:16:06,639 –> 00:16:09,759
، به اینجا می روم
430
00:16:09,759 –> 00:16:12,240
، می گویم
431
00:16:12,240 –> 00:16:14,160
این پیشنهاد را نمی پذیرم،
432
00:16:14,160 –> 00:16:14,959
خوب
433
00:16:14,959 –> 00:16:16,880
حالا تصور کنید که می گویید
434
00:16:16,880 –> 00:16:19,040
حقوق شما بیشتر از 50 000 است، سپس
435
00:16:19,040 –> 00:16:21,600
متغیر دیگری را
436
00:16:21,600 –> 00:16:23,519
در اینجا بررسی می کنید، آن را بررسی می کنید که آیا
437
00:16:23,519 –> 00:16:25,920
باید بیش از یک ساعت
438
00:16:25,920 –> 00:16:28,320
رفت و آمد داشته باشم اگر بیش از یک ساعت رفت و آمد داشته
439
00:16:28,320 –> 00:16:30,560
440
00:16:30,560 –> 00:16:32,560
باشم، پیشنهادی را رد می کنم. پس
441
00:16:32,560 –> 00:16:34,480
اگر مجبور به رفت و آمد نباشید، این کار را خواهید کرد بعد
442
00:16:34,480 –> 00:16:35,920
از یک ساعت، شما
443
00:16:35,920 –> 00:16:37,519
همچنان این گزینه را در نظر می گیرید و سپس آن را
444
00:16:37,519 –> 00:16:39,360
بررسی می کنید، به عنوان مثال، در این مورد، ما
445
00:16:39,360 –> 00:16:41,120
در حال بررسی آن هستیم که آیا
446
00:16:41,120 –> 00:16:43,519
پیشنهادات رایگان را نیز دریافت می کنید، مانند قهوه
447
00:16:43,519 –> 00:16:45,920
یا برخی از میان وعده ها یا چیزهای دیگری مانند آن،
448
00:16:45,920 –> 00:16:48,240
اگر بله، پس شما در نهایت پیشنهاد را می پذیرم در
449
00:16:48,240 –> 00:16:50,959
غیر این صورت پیشنهادی را رد
450
00:16:50,959 –> 00:16:51,920
451
00:16:51,920 –> 00:16:53,759
می کنید که متوجه شدید نظر من این است که چگونه
452
00:16:53,759 –> 00:16:56,320
درخت تصمیم ما کار می کند اساساً
453
00:16:56,320 –> 00:16:58,160
درخت تصمیم به تقسیم شدن ادامه می دهد به
454
00:16:58,160 –> 00:17:00,399
تقسیم شدن ادامه دهید مگر اینکه و تا زمانی که بتوانید
455
00:17:00,399 –> 00:17:03,040
آن را پیدا کنید تصمیم شما
456
00:17:03,040 –> 00:17:05,599
خوب است بنابراین تصمیم در اینجا بود. آیا
457
00:17:05,599 –> 00:17:08,559
این را بپذیرم یا نه، بنابراین
458
00:17:08,559 –> 00:17:10,319
به تقسیم کردن ادامه خواهد داد، به تقسیم کردن ادامه خواهد داد، مگر اینکه
459
00:17:10,319 –> 00:17:12,160
و تا زمانی که تصمیم خود را بگیری
460
00:17:12,160 –> 00:17:14,959
که آیا این کار را انجام میدهی یا نه، این مثال را دوست دارم که باید انجام دهم،
461
00:17:14,959 –> 00:17:17,119
من به شما توضیح دادم
462
00:17:17,119 –> 00:17:18,880
خوب است،
463
00:17:18,880 –> 00:17:21,439
حالا چه اتفاقی میافتد به من اجازه
464
00:17:21,439 –> 00:17:23,359
دهید اگر بیشتر بروم و
465
00:17:23,359 –> 00:17:25,599
در مورد این درخت تصمیم به شما توضیح
466
00:17:25,599 –> 00:17:26,959
467
00:17:26,959 –> 00:17:29,039
بیشتری بدهم، مهمتر از آن را درک کنیم، بیایید
468
00:17:29,039 –> 00:17:32,640
این را یکی یکی بفهمیم، بنابراین تصور کنید که این
469
00:17:32,640 –> 00:17:35,760
مجموعه داده های من در حال حاضر در داده های من خوب است.
470
00:17:35,760 –> 00:17:37,360
می توانید ببینید که
471
00:17:37,360 –> 00:17:39,280
من رنگ های مختلفی به شما داده ام
472
00:17:39,280 –> 00:17:41,360
مانند یک رنگ سبز رنگ زرد رنگ قرمز
473
00:17:41,360 –> 00:17:44,000
رنگ قرمز و یک رنگ زرد می
474
00:17:44,000 –> 00:17:46,480
گویم اگر این یک
475
00:17:46,480 –> 00:17:49,600
میوه سبز رنگ با قطر سه
476
00:17:49,600 –> 00:17:52,880
سمت راست باشد و من می توانم بگو انبه است
477
00:17:52,880 –> 00:17:54,799
در حالی که من می گویم اگر رنگ زرد
478
00:17:54,799 –> 00:17:56,960
باشد و قطر سه هنوز هم
479
00:17:56,960 –> 00:17:58,400
به عنوان انبه نامیده می شود
480
00:17:58,400 –> 00:18:01,120
اگر رنگ قرمز با یک قطر باشد
481
00:18:01,120 –> 00:18:02,640
پس انگور است
482
00:18:02,640 –> 00:18:04,880
و می تواند قرمز با یک رنگ باشد.
483
00:18:04,880 –> 00:18:06,720
قطر یک هنوز هم میتواند
484
00:18:06,720 –> 00:18:07,919
خاکستری باشد، اما
485
00:18:07,919 –> 00:18:10,000
حتی یک زرد با قطر سه
486
00:18:10,000 –> 00:18:12,320
میتواند لیمویی باشد، اکنون آنچه در
487
00:18:12,320 –> 00:18:14,320
این مورد اتفاق میافتد این است که اگر این نوع
488
00:18:14,320 –> 00:18:16,720
مجموعه دادهای دارید که
489
00:18:16,720 –> 00:18:19,039
میخواهید برچسب میوه را درست پیشبینی کنید. برای
490
00:18:19,039 –> 00:18:21,200
پیش بینی اینکه آیا میوه ای انبه خواهد بود،
491
00:18:21,200 –> 00:18:23,919
آیا میوه ای لیمو است یا
492
00:18:23,919 –> 00:18:26,080
اینکه میوه ای در این مورد انبه
493
00:18:26,080 –> 00:18:29,120
و لیمو یا انگور است، باید
494
00:18:29,120 –> 00:18:30,960
طبقه بندی کننده ای بسازم که طبقه بندی درخت تصمیم است
495
00:18:30,960 –> 00:18:33,600
بر اساس این مجموعه داده ها
496
00:18:33,600 –> 00:18:35,280
تصور کنید این یک بیانیه مشکل
497
00:18:35,280 –> 00:18:37,520
به شما داده می شود در حال حاضر اول از همه چه شما
498
00:18:37,520 –> 00:18:39,840
در اینجا این کار را انجام میدهید، این
499
00:18:39,840 –> 00:18:42,160
مجموعه داده را درست میگیرید، این مجموعه داده
500
00:18:42,160 –> 00:18:44,559
را میگیرید و با یک گره ریشه شروع میکنید،
501
00:18:44,559 –> 00:18:47,520
تصور کنید در اینجا
502
00:18:47,520 –> 00:18:49,919
قطر میوه بزرگتر از 3 است یا
503
00:18:49,919 –> 00:18:53,280
خوب نیست قطر من از میوه
504
00:18:53,280 –> 00:18:56,160
بزرگتر از 3 یا نه اگر
505
00:18:56,160 –> 00:18:58,480
بزرگتر از 3 باشد
506
00:18:58,480 –> 00:19:00,720
در حال حاضر اگر بزرگتر از
507
00:19:00,720 –> 00:19:03,120
3 باشد می توانید ببینید که در
508
00:19:03,120 –> 00:19:05,919
اینجا 3 میوه دارید 3 ردیف از مجموعه داده در اینجا یکی
509
00:19:05,919 –> 00:19:08,000
سبز است با 3 انبه
510
00:19:08,000 –> 00:19:11,600
زرد v3 زرد لیمویی با سه انبه
511
00:19:11,600 –> 00:19:14,080
و هر جا که شکست بخورد در شرایطی
512
00:19:14,080 –> 00:19:16,320
که شما باقی میماند که قطر
513
00:19:16,320 –> 00:19:18,000
آن بیشتر از سه نباشد،
514
00:19:18,000 –> 00:19:20,320
کمتر از سه است، پس
515
00:19:20,320 –> 00:19:23,679
مجموعه دادهای که داریم یک انگور قرمز و
516
00:19:23,679 –> 00:19:25,919
یک انگور قرمز داریم،
517
00:19:25,919 –> 00:19:27,840
خوب است. امیدوارم به درستی متوجه شده باشید
518
00:19:27,840 –> 00:19:30,240
که چگونه ما با
519
00:19:30,240 –> 00:19:31,760
درخت تصمیم با
520
00:19:31,760 –> 00:19:34,559
شرطی که در اینجا بر اساس یک شرط است که قطر است،
521
00:19:34,559 –> 00:19:37,280
اکنون بر اساس آن شروع می کنیم، آنچه که من انجام خواهم داد این است که
522
00:19:37,280 –> 00:19:39,440
باید آن را بیشتر در اینجا تقسیم کنم، در این
523
00:19:39,440 –> 00:19:41,440
مورد من ندارم. آن را تقسیم کنم زیرا
524
00:19:41,440 –> 00:19:44,080
قبلاً آن را داشتم بنابراین اگر
525
00:19:44,080 –> 00:19:46,320
قطر من در مجموعه دادههای من بزرگتر از 3
526
00:19:46,320 –> 00:19:48,640
باشد، اگر قطر
527
00:19:48,640 –> 00:19:50,960
مساوی با بزرگتر از 3 نباشد، میدانم که این یک
528
00:19:50,960 –> 00:19:52,400
انگور است،
529
00:19:52,400 –> 00:19:55,039
در حالی که اگر قطر بزرگتر از
530
00:19:55,039 –> 00:19:57,760
3 باشد، میتواند یک انبه یا
531
00:19:57,760 –> 00:20:00,000
می تواند یک لیمو باشد، من در تصمیم خود مطمئن نیستم،
532
00:20:00,000 –> 00:20:02,240
بنابراین کاری که در اینجا انجام خواهم داد این است که
533
00:20:02,240 –> 00:20:04,720
آن را بیشتر تقسیم می
534
00:20:04,720 –> 00:20:06,799
کنم، بنابراین باید این را بیشتر
535
00:20:06,799 –> 00:20:09,039
در اینجا تقسیم کنم، تقسیم کردن لازم نیست، اما
536
00:20:09,039 –> 00:20:11,520
اگر این را بیشتر تقسیم کنم، می توانم آن را بررسی
537
00:20:11,520 –> 00:20:14,240
کنم حالا رنگ برابر با زرد است یا
538
00:20:14,240 –> 00:20:17,520
نه حالا اگر رنگ آن برابر با زرد است،
539
00:20:17,520 –> 00:20:20,640
پس من دو میوه دارم که این
540
00:20:20,640 –> 00:20:23,280
ردیف شماست که شما می دانید
541
00:20:23,280 –> 00:20:26,640
انبه یا لیموی خود را می شناسید و اگر رنگ
542
00:20:26,640 –> 00:20:28,880
آن برابر با زرد نباشد، آن را خواهید
543
00:20:28,880 –> 00:20:31,440
داشت. ردیف دیگری از مجموعه داده ها که این است که
544
00:20:31,440 –> 00:20:33,679
شما می دانید کدام سمت راست باقی مانده است،
545
00:20:33,679 –> 00:20:36,720
بنابراین به این صورت است که در مورد درخت تصمیم خود این کار را انجام داده اید
546
00:20:36,720 –> 00:20:39,840
547
00:20:39,840 –> 00:20:42,320
و چگونه آن را در
548
00:20:42,320 –> 00:20:44,799
کدام نوع از معیارها یا کدام نوع
549
00:20:44,799 –> 00:20:46,880
از آن ها پیدا خواهید کرد. الگوریتم است یا اینکه کدام نوع
550
00:20:46,880 –> 00:20:48,799
معیار یا متغیر را باید
551
00:20:48,799 –> 00:20:51,360
در اینجا انتخاب کنم تقسیم درخت بر
552
00:20:51,360 –> 00:20:54,080
اساس شاخص جن و به دست آوردن اطلاعات است
553
00:20:54,080 –> 00:20:56,240
که من آن را نشان خواهم داد و در چند اسلاید از این به بعد به شما نشان خواهم داد،
554
00:20:56,240 –> 00:20:59,120
بنابراین امیدوارم
555
00:20:59,120 –> 00:21:01,600
با این کار درک کنید که
556
00:21:01,600 –> 00:21:03,360
درخت تصمیم شما اساساً بر اساس شرایط چگونه کار می کند
557
00:21:03,360 –> 00:21:05,679
و اگر شما یک زیرمجموعه خالص دریافت میکنید،
558
00:21:05,679 –> 00:21:07,760
پس نیازی به تقسیم آن
559
00:21:07,760 –> 00:21:10,080
بیشتر نیست، اگر زیر مجموعه خالص وجود ندارد
560
00:21:10,080 –> 00:21:12,080
، به تقسیم کردن
561
00:21:12,080 –> 00:21:15,200
ادامه میدهید، مگر اینکه و تا زمانی که یک زیرمجموعه خالص به دست آورید
562
00:21:15,200 –> 00:21:16,480
خوب است،
563
00:21:16,480 –> 00:21:18,880
بنابراین در این مورد آنچه اتفاق افتاده این است
564
00:21:18,880 –> 00:21:21,280
که صددرصد انبه دارید.
565
00:21:21,280 –> 00:21:23,520
پنجاه درصد انبه و پنجاه درصد
566
00:21:23,520 –> 00:21:26,320
لیمو خوب است،
567
00:21:26,320 –> 00:21:28,240
بنابراین اکنون
568
00:21:28,240 –> 00:21:30,320
این چیزی است که در اسلاید قبلی به شما گفته ام،
569
00:21:30,320 –> 00:21:32,880
مانند اینکه در حال حاضر چگونه کار می کند،
570
00:21:32,880 –> 00:21:34,640
571
00:21:34,640 –> 00:21:37,760
همه اینها به اساس شاخص جن بستگی دارد
572
00:21:37,760 –> 00:21:40,559
در حال حاضر در اسلاید بعدی بعدی،
573
00:21:40,559 –> 00:21:43,039
اجازه دهید به شما بگویم و توضیح دهم شما
574
00:21:43,039 –> 00:21:45,760
در مورد نمایه جن و به دست آوردن اطلاعات
575
00:21:45,760 –> 00:21:48,400
چگونه کار می کند درست کار می کند چگونه آن
576
00:21:48,400 –> 00:21:51,520
چیزی بر اساس شاخص جن شما
577
00:21:51,520 –> 00:21:52,880
578
00:21:52,880 –> 00:21:55,600
کار می کند بنابراین تصور کنید که می دانید مانند تصور کنید
579
00:21:55,600 –> 00:21:56,400
که
580
00:21:56,400 –> 00:21:58,799
من یک ویژگی در اینجا دارم رنگ gree است n
581
00:21:58,799 –> 00:22:01,600
یا نه مبنای درستی برای اینکه آیا هلویی
582
00:22:01,600 –> 00:22:03,760
رنگ سبز دارید یا نه،
583
00:22:03,760 –> 00:22:06,000
چه اتفاقی میافتد این است که اگر رنگ
584
00:22:06,000 –> 00:22:07,039
585
00:22:07,039 –> 00:22:09,280
سبز باشد، این ردیف را در اینجا
586
00:22:09,280 –> 00:22:11,039
میگیرید، اگر اینطور نیست، این دو ردیف را در اینجا خواهید
587
00:22:11,039 –> 00:22:13,919
گرفت. ممکن است در مورد پایه های دیگر تصمیم بگیرید
588
00:22:13,919 –> 00:22:16,480
درست می تواند
589
00:22:16,480 –> 00:22:18,240
قطری است که بزرگتر از
590
00:22:18,240 –> 00:22:22,240
3 است یا خیر و خیلی چیزهای دیگر بسیار خوب
591
00:22:22,240 –> 00:22:24,880
حالا بیایید به مثال و
592
00:22:24,880 –> 00:22:27,280
سوالاتی که به ذهن شما
593
00:22:27,280 –> 00:22:29,280
می رسد مربوط به درخت تصمیم گیری می دانید
594
00:22:29,280 –> 00:22:31,440
اصطلاحات من تقریباً مطمئن هستم
595
00:22:31,440 –> 00:22:33,360
که این سؤالات در ذهن شما وجود دارد
596
00:22:33,360 –> 00:22:34,799
و شما به این فکر می کنید که چگونه
597
00:22:34,799 –> 00:22:36,880
باید تصمیم بگیرم از کدام ویژگی
598
00:22:36,880 –> 00:22:38,720
استفاده کنم و از کدام ویژگی استفاده نکنم
599
00:22:38,720 –> 00:22:40,720
این سؤالی است که شما داشتید
600
00:22:40,720 –> 00:22:42,480
و این یک سؤال عالی است سوالی برای
601
00:22:42,480 –> 00:22:44,640
درک درخت تصمیم است اما
602
00:22:44,640 –> 00:22:46,960
قبل از اینکه به آن ادامه دهم باید
603
00:22:46,960 –> 00:22:49,440
در مورد برخی از اصطلاحاتی
604
00:22:49,440 –> 00:22:51,679
که معمولاً در هنگام ساختن درخت تصمیم استفاده می کنیم به شما بگویم،
605
00:22:51,679 –> 00:22:54,320
بنابراین اول از همه
606
00:22:54,320 –> 00:22:55,919
درخت تصمیم شبیه این نوع درخت
607
00:22:55,919 –> 00:22:58,880
است. ساختار درست است، بنابراین هر
608
00:22:58,880 –> 00:23:01,679
درخت تصمیم دارای گره ریشه خواهد بود، بنابراین گره ریشه
609
00:23:01,679 –> 00:23:03,840
جایی است که درخت تصمیم از آنجا شروع می شود،
610
00:23:03,840 –> 00:23:06,000
بنابراین کل جمعیت یا
611
00:23:06,000 –> 00:23:08,720
نمونه را نشان می دهد و بیشتر
612
00:23:08,720 –> 00:23:10,799
به دو یا چند مجموعه همگن تقسیم می شود، بنابراین
613
00:23:10,799 –> 00:23:12,240
می دانید که این خواهد بود. اولین
614
00:23:12,240 –> 00:23:14,559
ویژگی بر اساس درخت شما
615
00:23:14,559 –> 00:23:16,799
شروع می شود مانند درختان که با ریشه شروع می شوند،
616
00:23:16,799 –> 00:23:18,640
در این مورد درخت تصمیم
617
00:23:18