در این مطلب، ویدئو کد پایان به پایان پایتون را برای رگرسیون جنگل تصادفی کامل کنید با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:17
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:01,740
در ویدیوی آخر،
2
00:00:01,740 –> 00:00:04,049
شهود پشت تکنیک رگرسیون جنگل تصادفی را توضیح دادم،
3
00:00:04,049 –> 00:00:06,029
اکنون ممکن
4
00:00:06,029 –> 00:00:08,280
است تعجب کنید که چگونه میتوانیم
5
00:00:08,280 –> 00:00:10,500
یک مدل رگرسیون جنگل تصادفی بسازیم و آموزش دهیم
6
00:00:10,500 –> 00:00:13,679
و همچنین این
7
00:00:13,679 –> 00:00:16,079
مدل غیر خطی و غیر پیوسته را در این ویدیو
8
00:00:16,079 –> 00:00:18,330
که به شما نشان میدهم تجسم کنیم. مراحل آنها برای ساختن
9
00:00:18,330 –> 00:00:20,369
و آموزش مدل رگرسیون جنگل تصادفی
10
00:00:20,369 –> 00:00:23,100
به صورت گام به گام از
11
00:00:23,100 –> 00:00:25,289
ابتدا، همچنین خواهید دید که چگونه می توانیم
12
00:00:25,289 –> 00:00:28,050
این مدل را تجسم کنیم، لطفا توجه داشته باشید که
13
00:00:28,050 –> 00:00:30,240
من از همان مجموعه داده ای استفاده خواهم کرد
14
00:00:30,240 –> 00:00:33,600
که برای آموزش چند جمله ای و تصمیم گیری استفاده کردم.
15
00:00:33,600 –> 00:00:36,280
مدلهای رگرسیون درختی، پس با ما همراه باشید
16
00:00:36,280 –> 00:00:46,710
[موسیقی]،
17
00:00:46,710 –> 00:00:49,810
بنابراین ما قبلاً یاد گرفتیم که جنگل
18
00:00:49,810 –> 00:00:52,210
تصادفی گروهی از چندین درخت تصمیم است
19
00:00:52,210 –> 00:00:55,180
که هر یک از آنها پیشبینیهای خود را
20
00:00:55,180 –> 00:00:58,150
از متغیر هدف انجام میدهند، اکنون
21
00:00:58,150 –> 00:01:00,310
همه این پیشبینیهای فردی با
22
00:01:00,310 –> 00:01:03,130
هم ترکیب شدهاند تا میانگین همه درختها را ارائه دهند.
23
00:01:03,130 –> 00:01:06,430
پیش بینی های مختلف مرتبط
24
00:01:06,430 –> 00:01:08,290
با این بیماری ها و درختان مختلف
25
00:01:08,290 –> 00:01:11,590
در جنگل تصادفی جنگل
26
00:01:11,590 –> 00:01:13,930
قطعا بهتر از درخت تصمیم گیری فردی است
27
00:01:13,930 –> 00:01:17,040
زیرا r الگوریتمهای جنگل andom
28
00:01:17,040 –> 00:01:20,440
پیشبینی دقیقتری ارائه میدهند، درست مانند
29
00:01:20,440 –> 00:01:22,479
درختهای تصمیم، جنگل تصادفی نیز
30
00:01:22,479 –> 00:01:25,000
ماهیت غیرخطی و غیر پیوسته دارد،
31
00:01:25,000 –> 00:01:27,490
بنابراین بیان مسئله
32
00:01:27,490 –> 00:01:30,280
مانند رگرسیون چند جملهای و همچنین
33
00:01:30,280 –> 00:01:34,090
مورد رگرسیون درخت تصمیم، یکسان میماند، ما
34
00:01:34,090 –> 00:01:37,630
این مجموعه دادههای ارتفاع و سن را داریم که
35
00:01:37,630 –> 00:01:40,240
شامل دو عدد است. ستون های شماره یک سن
36
00:01:40,240 –> 00:01:43,030
و شماره دو قد است در اینجا ما می خواهیم
37
00:01:43,030 –> 00:01:45,490
قد یک فرد را با توجه به سن او پیش بینی کنیم
38
00:01:45,490 –> 00:01:47,920
اکنون نکته مهمی که در اینجا باید به آن توجه شود این است
39
00:01:47,920 –> 00:01:49,690
که نمی خواهیم
40
00:01:49,690 –> 00:01:52,690
قد فردی را که سن کمتر از 10
41
00:01:52,690 –> 00:01:56,080
سال دارد پیش بینی کنیم. زیرا اگر توجه داشته باشید که مجموعه دادهها
42
00:01:56,080 –> 00:01:59,080
شامل دادههای سن و قد بالاتر و
43
00:01:59,080 –> 00:02:02,530
برابر با 10 سال است، این دادهها فقط برای
44
00:02:02,530 –> 00:02:04,360
مصورسازی هستند و میتوانید
45
00:02:04,360 –> 00:02:07,240
از دادههای واقعیتر مبتنی بر
46
00:02:07,240 –> 00:02:10,570
موارد استفاده خاص استفاده کنید، زیرا دادهها میتوانند
47
00:02:10,570 –> 00:02:12,820
از حالت استفاده به مورد دیگر متفاوت باشند.
48
00:02:12,820 –> 00:02:15,160
بدون تاخیر بیشتر وارد
49
00:02:15,160 –> 00:02:17,080
کد مربوط به سقوط تصادفی
50
00:02:17,080 –> 00:02:20,230
رگرسیون می شویم، بنابراین در اینجا سلول شماره یک سلول
51
00:02:20,230 –> 00:02:22,450
شماره دو و سلول شماره سه
52
00:02:22,450 –> 00:02:24,910
حاوی کد پایتون هستند که به
53
00:02:24,910 –> 00:02:27,430
نوعی برای هر الگوریتم رگرسیون تکرار می
54
00:02:27,430 –> 00:02:29,769
شود که قبلا
55
00:02:29,769 –> 00:02:32,019
توضیح دادم، کد نشان داده شده در این سلول ها را
56
00:02:32,019 –> 00:02:34,120
در ویدیوی قبلی توضیح دادم و همچنین در جایی
57
00:02:34,120 –> 00:02:37,299
که یک درخت تصمیم یک مدل رگرسیون
58
00:02:37,299 –> 00:02:39,610
با استفاده از scikit-learn ساختیم، بنابراین
59
00:02:39,610 –> 00:02:41,739
اگر می خواهید آن ویدیو را دریافت کنید، می توانید آن ویدیو را تماشا کنید.
60
00:02:41,739 –> 00:02:44,500
توضیح دقیق این مراحل
61
00:02:44,500 –> 00:02:46,900
پیوند در دکمه I در بالا در این
62
00:02:46,900 –> 00:02:49,090
ویدیو داده شده است. من می خواهم مستقیماً از
63
00:02:49,090 –> 00:02:51,340
شماره سلول برای جایی که در حال وارد کردن
64
00:02:51,340 –> 00:02:53,709
جنگل های تصادفی رگرسیون هستیم شروع کنم، بنابراین
65
00:02:53,709 –> 00:02:56,830
بیایید مستقیماً روی این سلول بیاییم در اینجا ما در
66
00:02:56,830 –> 00:02:59,440
حال توسعه یک مدل جنگل تصادفی هستیم.
67
00:02:59,440 –> 00:03:02,110
در اینجا ما ابتدا
68
00:03:02,110 –> 00:03:05,920
کلاس رگرسیور جنگل تصادفی را از بسته SK Learn
69
00:03:05,920 –> 00:03:08,440
dot Ensemble وارد می کنیم در خط بعدی
70
00:03:08,440 –> 00:03:10,210
یک
71
00:03:10,210 –> 00:03:14,560
شی جنگل تصادفی از کلاس رگرسیور جنگل تصادفی ایجاد می کنیم
72
00:03:14,560 –> 00:03:19,450
و آن را به عنوان یک نام RF rag می دهیم در
73
00:03:19,450 –> 00:03:22,720
این یک آرگومان به
74
00:03:22,720 –> 00:03:25,660
نام Underscore ارسال می کنیم. تخمینزنانی که پیشفرضشان
75
00:03:25,660 –> 00:03:28,570
هنگام ایستادن و نشان میدهد که چند
76
00:03:28,570 –> 00:03:31,660
درخت باید در جنگل خود بگنجانیم،
77
00:03:31,660 –> 00:03:34,630
ما با نگهداشتن چند درخت
78
00:03:34,630 –> 00:03:38,200
که مقدار پیشفرض است شروع کردیم. e یا به عنوان 10 و سپس
79
00:03:38,200 –> 00:03:40,120
ما همچنین سعی کردیم تعداد
80
00:03:40,120 –> 00:03:44,380
درختان را به 500 و سپس 10 1000 افزایش
81
00:03:44,380 –> 00:03:47,440
دهیم، بنابراین من همین کار را بعداً به شما نشان خواهم داد، لطفاً
82
00:03:47,440 –> 00:03:50,110
توجه داشته باشید که من همچنین به شما نشان خواهم داد که چگونه
83
00:03:50,110 –> 00:03:52,480
تجسم Ville تغییر می کند
84
00:03:52,480 –> 00:03:55,420
هنگامی که من مقدار را افزایش می دهم. عدد یا
85
00:03:55,420 –> 00:03:57,670
آرگومان برآوردگر زیرخط به مقدار
86
00:03:57,670 –> 00:04:00,130
در حال حاضر تخمین خط پایانی
87
00:04:00,130 –> 00:04:02,470
مقدار آرگومان به عنوان 10
88
00:04:02,470 –> 00:04:04,810
آرگومان بعدی یک حالت زیرخط تصادفی است
89
00:04:04,810 –> 00:04:08,050
که مقدار آن را صفر نگه داشته ایم تا
90
00:04:08,050 –> 00:04:11,650
در خط بعدی که برازش می کنیم نیز بتوانید همان نتیجه را دریافت کنید.
91
00:04:11,650 –> 00:04:13,650
92
00:04:13,650 –> 00:04:16,988
رگرسیون جنگل تصادفی با داده های آموزشی که
93
00:04:16,988 –> 00:04:20,500
با X قطار یا قطار زیرخط X و قطار زیرخط y
94
00:04:20,500 –> 00:04:23,020
نشان داده شده است و با استفاده از روشی
95
00:04:23,020 –> 00:04:25,510
به نام تناسب که با
96
00:04:25,510 –> 00:04:28,270
جنگل های تصادفی ما از مهاجم مرتبط است، زمانی که من
97
00:04:28,270 –> 00:04:30,669
گناه یک جنگل تصادفی
98
00:04:30,669 –> 00:04:33,370
مدل رگرسیون را اجرا کردم ایجاد شد و شما میتواند ببیند که
99
00:04:33,370 –> 00:04:37,060
در خروجی
100
00:04:37,060 –> 00:04:40,660
مقادیر پیشفرض آرگومانهایی مانند
101
00:04:40,660 –> 00:04:45,910
معیار را بهعنوان میانگین مربع خطا حداکثر
102
00:04:45,910 –> 00:04:50,140
عمق بهعنوان هیچکدام از ویژگیهای حداکثر بهعنوان خودکار و غیره گرفته یا انتخاب کرده است
103
00:04:50,140 –> 00:04:52,330
و این مقادیر را گرفته است. به
104
00:04:52,330 –> 00:04:54,220
طور خودکار برای ساخت این
105
00:04:54,220 –> 00:04:57,040
مدل اگر می خواهید جزئیات بیشتری
106
00:04:57,040 –> 00:04:59,740
در مورد این استدلال ها به دست آورید و بازی کنید
107
00:04:59,740 –> 00:05:02,169
و همچنین جنگل های تصادفی را
108
00:05:02,169 –> 00:05:04,060
مطابق با نیاز خود سفارشی کنید، می توانید از طریق
109
00:05:04,060 –> 00:05:07,000
این صفحه
110
00:05:07,000 –> 00:05:09,190
مستندات بروید و لینک آن را در توضیحات ارائه خواهم کرد.
111
00:05:09,190 –> 00:05:12,789
بخش در حال حرکت در سلول بعدی من
112
00:05:12,789 –> 00:05:15,640
سعی می کنم جنگل های تصادفی
113
00:05:15,640 –> 00:05:18,010
مدل رگرسیون را با استفاده از روش مربع R ارزیابی کنم
114
00:05:18,010 –> 00:05:20,110
اگر می خواهید جزئیات
115
00:05:20,110 –> 00:05:21,640
مربوط به تکنیک های ارزیابی مبتنی بر مقررات مختلف
116
00:05:21,640 –> 00:05:23,950
مانند R مربع تنظیم شده R
117
00:05:23,950 –> 00:05:26,530
مربع میانگین خطای مطلق میانگین مربع
118
00:05:26,530 –> 00:05:28,720
خطا و غیره را بدست آورید. می توانید این ویدیوها را تماشا
119
00:05:28,720 –> 00:05:31,720
کنید پیوند این ویدیوها در
120
00:05:31,720 –> 00:05:34,750
دکمه I در بالا آمده است، بنابراین ابتدا سعی می کنم
121
00:05:34,750 –> 00:05:37,539
122
00:05:37,539 –> 00:05:39,940
با گذراندن تست زیرخط X به عنوان
123
00:05:39,940 –> 00:05:43,390
آرگومان در روش پیش بینی نقطه RF، ارتفاع پیش بینی شده را از مجموعه داده های تست دریافت
124
00:05:43,390 –> 00:05:47,470
کنم سپس کلاس ماتریس را از F وارد کردم.
125
00:05:47,470 –> 00:05:50,289
مقیاسی که شامل R تا
126
00:05:50,289 –> 00:05:53,080
روش امتیاز زیرخط برای
127
00:05:53,080 –> 00:05:56,410
ارزیابی ارزش مدل با استفاده از مربع R است، ما
128
00:05:56,410 –> 00:06:00,520
هم مقادیر واقعی و هم
129
00:06:00,520 –> 00:06:03,700
مقادیر پیشبینیشده داخل R را به زیر خط منتقل کردیم. روش مربع سنگ معدن
130
00:06:03,700 –> 00:06:07,060
و سپس نتیجه را در خط بعدی چاپ کردم،
131
00:06:07,060 –> 00:06:10,539
بنابراین در اینجا تست Y حاوی
132
00:06:10,539 –> 00:06:12,370
مقادیر واقعی است و y
133
00:06:12,370 –> 00:06:14,680
underscore پیش بینی زیر خط R fr حاوی
134
00:06:14,680 –> 00:06:17,860
مقادیر پیش بینی شده ارتفاع است وقتی
135
00:06:17,860 –> 00:06:21,180
سلول را اجرا کردم، مقدار مربع R را 0.99 5:09 دریافت کردم.
136
00:06:21,180 –> 00:06:23,470
137
00:06:23,470 –> 00:06:26,289
که نزدیک به 1 است، این نشان میدهد که
138
00:06:26,289 –> 00:06:29,470
مدل رگرسیون جنگل تصادفی ما
139
00:06:29,470 –> 00:06:31,960
بسیار دقیق است،
140
00:06:31,960 –> 00:06:33,820
زمانی که
141
00:06:33,820 –> 00:06:36,150
میخواهیم تعداد
142
00:06:36,150 –> 00:06:38,470
تخمینگرهای شناختهشده یا تعداد درختها را در واقع
143
00:06:38,470 –> 00:06:42,220
با استفاده از این آرگومان به نام تخمینگرهای زیر
144
00:06:42,220 –> 00:06:44,680
خطی افزایش دهیم، ممکن است شاهد بهبودهایی در این باشیم. سلول بعدی ما
145
00:06:44,680 –> 00:06:46,830
سعی می کنیم جنگل تصادفی را تجسم کنیم
146
00:06:46,830 –> 00:06:49,240
لطفاً توجه داشته باشید که در مورد
147
00:06:49,240 –> 00:06:51,340
جنگل تصادفی چندین درخت تصمیم داریم بنابراین
148
00:06:51,340 –> 00:06:54,550
اساساً چندین