در این مطلب، ویدئو آموزش یادگیری ماشین Python – 11 Random Forest با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:12:48
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,240 –> 00:00:02,720
الگوریتم جنگل تصادفی یکی دیگر
2
00:00:02,720 –> 00:00:04,720
از تکنیکهای یادگیری ماشینی محبوب است
3
00:00:04,720 –> 00:00:06,879
که در رگرسیون و طبقهبندی استفاده میشود،
4
00:00:06,879 –> 00:00:09,120
هم اکنون چرا به آن جنگل تصادفی میگویند
5
00:00:09,120 –> 00:00:12,000
جنگل درخت دارد و درخت در
6
00:00:12,000 –> 00:00:13,599
دنیای یادگیری ماشینی به معنی
7
00:00:13,599 –> 00:00:15,920
درخت تصمیم است، اگر
8
00:00:15,920 –> 00:00:18,240
آموزش درخت تصمیم من را ندیدهاید،
9
00:00:18,240 –> 00:00:20,480
شما باید همین الان روی آن دکمه مکث کلیک کنید و
10
00:00:20,480 –> 00:00:21,439
11
00:00:21,439 –> 00:00:23,519
به تماشای آموزش درخت تصمیم بروید و سپس
12
00:00:23,519 –> 00:00:25,119
به اینجا برگردید
13
00:00:25,119 –> 00:00:27,519
با فرض اینکه این را تماشا کنید آنچه ما سعی می
14
00:00:27,519 –> 00:00:29,279
کنیم در آن آموزش انجام دهیم
15
00:00:29,279 –> 00:00:32,558
پیش بینی حقوق کارمندان بر اساس
16
00:00:32,558 –> 00:00:33,120
ویژگی های خاص است
17
00:00:33,120 –> 00:00:36,079
و ما یک درخت تصمیم مانند این می سازیم
18
00:00:36,079 –> 00:00:37,600
اکنون این تصمیم درخت بسیار پیچیده به نظر می رسد،
19
00:00:37,600 –> 00:00:39,360
بنابراین
20
00:00:39,360 –> 00:00:42,000
می توانید آن را در یک تصویر بسیار ساده
21
00:00:42,000 –> 00:00:42,719
نشان دهید،
22
00:00:42,719 –> 00:00:45,440
بله، شما آن را دارید،
23
00:00:45,440 –> 00:00:46,320
نمونه های
24
00:00:46,320 –> 00:00:48,800
قرمز رنگی دارید و بر اساس آن، درخت تصمیم
25
00:00:48,800 –> 00:00:49,360
خود را می سازید
26
00:00:49,360 –> 00:00:53,680
اکنون چگونه می توانید
27
00:00:53,680 –> 00:00:56,399
یک درخت تصمیم چندگانه از این
28
00:00:56,399 –> 00:00:57,600
مجموعه داده واحد بسازید.
29
00:00:57,600 –> 00:00:59,680
خوب یک رویکرد این است که مجموعه داده های خود را می
30
00:00:59,680 –> 00:01:02,239
گیرید، سپس آن را به
31
00:01:02,239 –> 00:01:05,920
دسته ای از مجموعه های داده تصادفی تقسیم می کنید و
32
00:01:05,920 –> 00:01:08,320
سپس درخت تصمیم را برای هر یک از
33
00:01:08,320 –> 00:01:09,520
آنها
34
00:01:09,520 –> 00:01:12,240
می سازید. از آنجایی که ما در اینجا نمونهبرداری تصادفی انجام دادیم،
35
00:01:12,240 –> 00:01:13,760
جنگل تصادفی نامیده میشود
36
00:01:13,760 –> 00:01:16,080
و اکنون چندین درخت داریم، بنابراین
37
00:01:16,080 –> 00:01:19,040
میبینید که یک جنگل در حال شکلگیری است،
38
00:01:19,040 –> 00:01:21,840
وقتی آموزش داده شد، چیزی را
39
00:01:21,840 –> 00:01:23,600
که میخواهید پیشبینی کنید، میدهید و
40
00:01:23,600 –> 00:01:26,000
همه آنها تصمیم متفاوتی خواهند گرفت
41
00:01:26,000 –> 00:01:28,720
که شما ممکن است بگیرید. اکثریت از
42
00:01:28,720 –> 00:01:29,520
آن چه نتیجه میدهند
43
00:01:29,520 –> 00:01:32,479
و تصمیم میگیرند، بنابراین این اصل اساسی
44
00:01:32,479 –> 00:01:33,600
45
00:01:33,600 –> 00:01:36,240
در پشت الگوریتم جنگل تصادفی است و من
46
00:01:36,240 –> 00:01:38,479
اخیراً از رویکرد مشابهی برای
47
00:01:38,479 –> 00:01:40,400
تصمیمگیری در زندگی
48
00:01:40,400 –> 00:01:43,360
واقعیام استفاده کردم، میخواستم ترموستات لانه بخرم و
49
00:01:43,360 –> 00:01:43,840
به
50
00:01:43,840 –> 00:01:46,240
تعدادی از دوستانم زنگ زدم و بله. به هر حال
51
00:01:46,240 –> 00:01:48,240
این من در عکس هستم
52
00:01:48,240 –> 00:01:51,680
و آن افراد باهوش نظرات متفاوتی به من دادند،
53
00:01:51,680 –> 00:01:54,159
یکی از پسرها به من گفت که میدانی
54
00:01:54,159 –> 00:01:56,079
این پول برایت صرفهجویی میکند، من سال گذشته حدود 500 پول پس انداز
55
00:01:56,079 –> 00:01:57,040
کردم،
56
00:01:57,040 –> 00:02:00,000
بنابراین باید آن را بخری،
57
00:02:00,000 –> 00:02:02,240
دوستان دیگر میگویند اوه این خیلی عجیب است
58
00:02:02,240 –> 00:02:04,719
200 هدر دادن پول، آن را نخر،
59
00:02:04,719 –> 00:02:06,560
مرد سوم به من گفت: اوه، میتوانی دمای خود را از
60
00:02:06,560 –> 00:02:07,600
61
00:02:07,600 –> 00:02:09,598
راه دور از هر جایی از بیرون کنترل کنی، بنابراین
62
00:02:09,598 –> 00:02:11,280
مطمئناً آن را
63
00:02:11,280 –> 00:02:15,120
بخر، تمام کاری که انجام دادم این بود که اکثریت را
64
00:02:15,120 –> 00:02:18,000
گرفتم و تصمیم گرفتم آن را بخرم و تصمیمگیری را ببینم.
65
00:02:18,000 –> 00:02:19,200
66
00:02:19,200 –> 00:02:22,800
در زندگی خیلی ساده است فقط با دوستان خود تماس بگیرید
67
00:02:22,800 –> 00:02:24,959
و اکثریت جنگ را انجام دهید
68
00:02:24,959 –> 00:02:26,319
، همیشه کار نمی کند،
69
00:02:26,319 –> 00:02:28,560
اما حداقل در این مورد کار می کند
70
00:02:28,560 –> 00:02:31,040
و من تصمیمی داشتم و این را نمی
71
00:02:31,040 –> 00:02:32,560
سازم، همین دیروز آن را نصب
72
00:02:32,560 –> 00:02:34,480
کردم. در حال حاضر ما
73
00:02:34,480 –> 00:02:36,319
از
74
00:02:36,319 –> 00:02:39,360
مجموعه داده اعداد sk یاد میگیریم
75
00:02:39,360 –> 00:02:42,400
برای طبقهبندی
76
00:02:42,400 –> 00:02:45,440
با استفاده از جنگل تصادفی استفاده میکنیم، به طوری که مجموعه دادهها
77
00:02:45,440 –> 00:02:46,640
اساساً
78
00:02:46,640 –> 00:02:49,599
حاوی تصاویر کاراکترهای دستنویس است و
79
00:02:49,599 –> 00:02:51,760
تمام تلاش شما این است که فقط
80
00:02:51,760 –> 00:02:53,599
در یکی از این 10 دسته طبقهبندی کنید.
81
00:02:53,599 –> 00:02:54,879
یک رقم
82
00:02:54,879 –> 00:02:58,159
از 0 تا 10 بسیار خوب است، بنابراین این همان کاری است که
83
00:02:58,159 –> 00:03:01,280
ما امروز در برنامه نویسی پایتون خود انجام خواهیم داد
84
00:03:01,280 –> 00:03:01,519
و
85
00:03:01,519 –> 00:03:03,280
در پایان
86
00:03:03,280 –> 00:03:05,120
تمرین جالبی برای شما خواهیم داشت
87
00:03:05,120 –> 00:03:06,959
که طبق معمول حل
88
00:03:06,959 –> 00:03:08,159
89
00:03:08,159 –> 00:03:12,480
کنید. از
90
00:03:12,480 –> 00:03:14,959
مجموعه داده sklearn کاملاً درست است و اگر به
91
00:03:14,959 –> 00:03:17,120
خصوصیات این مجموعه داده نگاه
92
00:03:17,120 –> 00:03:20,400
کنم، داده های واقعی و هدف را
93
00:03:20,400 –> 00:03:23,760
در حال حاضر دارد، می خواهم از matplotlib
94
00:03:23,760 –> 00:03:28,000
برای تجسم داده های خود استفاده کنم و وقتی این را اجرا می کنم
95
00:03:28,000 –> 00:03:30,000
اینگونه به نظر می رسد بنابراین اساساً دارم
96
00:03:30,000 –> 00:03:32,319
چارای دست نوشته cters که مانند
97
00:03:32,319 –> 00:03:35,760
آرایه پیکسلی 8 در 8 است مانند یک
98
00:03:35,760 –> 00:03:37,519
آرایه چند بعدی است
99
00:03:37,519 –> 00:03:40,319
و وقتی از matplotlib استفاده می کنم به این شکل به نظر می
100
00:03:40,319 –> 00:03:42,319
رسد شما می توانید ببینید که این کاراکتر 0
101
00:03:42,319 –> 00:03:46,159
1 2 3 است و به همین ترتیب خوب
102
00:03:46,159 –> 00:03:52,080
حالا من یک قاب داده پاندا
103
00:03:52,080 –> 00:03:56,080
از این داده ها ایجاد خواهم کرد. داده ها را
104
00:03:57,760 –> 00:04:00,319
به گونه ای رقم بزنید اساساً داده ها این است که اگر
105
00:04:00,319 –> 00:04:02,239
ببینید آیا می خواهید آن را ببینید
106
00:04:02,239 –> 00:04:05,360
فقط برای ساده کردن آن، خواهید دید
107
00:04:05,360 –> 00:04:06,239
که یک
108
00:04:06,239 –> 00:04:10,400
آرایه دو بعدی از اعداد است،
109
00:04:10,400 –> 00:04:14,239
بنابراین بیایید ابتدا به پنج نگاه کنیم،
110
00:04:14,239 –> 00:04:16,399
پنج اول را ببینید، مانند هر عنصر فقط
111
00:04:16,399 –> 00:04:19,279
یک دو بعدی است.
112
00:04:19,279 –> 00:04:21,279
این در واقع یک آرایه یک بعدی است
113
00:04:21,279 –> 00:04:23,040
اما مانند ماتریس هشت در هشت است،
114
00:04:23,040 –> 00:04:26,000
بنابراین طول این آرایه 64 است. بسیار
115
00:04:26,000 –> 00:04:29,440
خوب و اگر از قاب داده استفاده می کنید، می توانید این را به روشی بهتر تجسم کنید،
116
00:04:29,440 –> 00:04:31,360
117
00:04:31,360 –> 00:04:33,280
118
00:04:33,280 –> 00:04:35,759
هر نمونه چیزی نیست جز آرایه ای از
119
00:04:35,759 –> 00:04:37,520
64
120
00:04:37,520 –> 00:04:41,199
عدد صحیح و آنها
121
00:04:41,199 –> 00:04:45,400
به متغیر هدف نگاشت کنید، بنابراین اگر digits.target را انجام دهید
122
00:04:45,400 –> 00:04:48,400
123
00:04:49,280 –> 00:04:52,800
، متغیر هدف را نشان میدهد
124
00:04:52,800 –> 00:04:55,840
و من آن را به
125
00:04:55,840 –> 00:04:59,040
قاب دادهام اضافه میکنم به
126
00:04:59,040 –> 00:05:01,759
این صورت یک ستون جدید در قاب داده پاندا ایجاد میکنید،
127
00:05:01,759 –> 00:05:04,800
128
00:05:04,800 –> 00:05:07,919
این چیزی نیست جز اعداد نقطه هدف
129
00:05:07,919 –> 00:05:11,840
و وقتی به دی خود نگاه می کنم
130
00:05:12,160 –> 00:05:15,440
f.head میگوید که این
131
00:05:15,440 –> 00:05:18,320
نمونههای 64 Uh آنها را به صفر نشان میدهند،
132
00:05:18,320 –> 00:05:20,479
به عنوان مثال،
133
00:05:20,479 –> 00:05:23,280
این تصویر در اینجا در واقع صفر است، بنابراین
134
00:05:23,280 –> 00:05:25,199
این هدف در حال حاضر حقیقت را به شما نشان میدهد،
135
00:05:25,199 –> 00:05:28,320
کاری که من میخواهم انجام دهم این است که
136
00:05:28,320 –> 00:05:32,000
از تقسیم آزمایشی قطار استفاده کنم.
137
00:05:32,000 –> 00:05:35,930
از sklearn dot انتخاب مدل
138
00:05:35,930 –> 00:05:37,759
[Music]
139
00:05:37,759 –> 00:05:40,960
train day split
140
00:05:40,960 –> 00:05:44,720
زمانی که وارد کنید که به
141
00:05:44,720 –> 00:05:48,960
x train x test
142
00:05:49,440 –> 00:05:53,680
y train y test بسیار
143
00:05:53,680 –> 00:05:58,720
خوب و تقسیم روز قطار
144
00:05:58,720 –> 00:06:01,759
اکنون x من فقط مجموعه ای از
145
00:06:01,759 –> 00:06:04,000
متغیرهای مستقل است، اکنون df من
146
00:06:04,000 –> 00:06:05,120
قبلاً هدف دارد انجام می
147
00:06:05,120 –> 00:06:09,840
دهد. باید هدف را از آن حذف
148
00:06:09,840 –> 00:06: