در این مطلب، ویدئو پیاده سازی درختان تصمیم (CART) با استفاده از پایتون | طبقه بندی | یادگیری ماشین بخش – 2 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:22:25
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:02,009
خیلی خوب به ویدیوی دیگر خوش آمدید
2
00:00:02,009 –> 00:00:04,170
و این قسمت دوم
3
00:00:04,170 –> 00:00:07,560
ویدیو است که می دانید ما در
4
00:00:07,560 –> 00:00:10,260
قسمت اول متوقف شدیم و یاد گرفتیم که چگونه کار را
5
00:00:10,260 –> 00:00:13,230
افزایش می دهید و به طور خاص
6
00:00:13,230 –> 00:00:15,540
در مورد الگوریتم سبد خرید و نحوه کار کردن آن یاد می گیریم
7
00:00:15,540 –> 00:00:17,340
و شما همه چیز را می دانید پیشینه ریاضی
8
00:00:17,340 –> 00:00:20,400
که ما به آن نیاز داشتیم
9
00:00:20,400 –> 00:00:21,930
قبل از اینکه بتوانیم به
10
00:00:21,930 –> 00:00:23,820
علامت پیاده سازی برویم به دست می آید که آنقدرها هم
11
00:00:23,820 –> 00:00:26,099
سخت نیست زیرا با توجه به اینکه ما
12
00:00:26,099 –> 00:00:27,570
از کتابخانه Python استفاده می کردیم scikit-learn به
13
00:00:27,570 –> 00:00:29,580
این معنا نیست که آنقدرها هم
14
00:00:29,580 –> 00:00:31,560
سخت نخواهد بود، فقط می دانید ما فقط باید
15
00:00:31,560 –> 00:00:33,989
چند خط کد بنویسیم تا شما بدانید تا
16
00:00:33,989 –> 00:00:34,829
این اتفاق بیفتد،
17
00:00:34,829 –> 00:00:36,930
بنابراین برای ما بسیار مهم
18
00:00:36,930 –> 00:00:38,070
بود که یاد گرفتیم
19
00:00:38,070 –> 00:00:39,390
پس زمینه ریاضی پشت مهره
20
00:00:39,390 –> 00:00:42,059
پشت مدل اصلی که
21
00:00:42,059 –> 00:00:44,969
قرار است درست از آن استفاده کنیم چیست. قبلاً قول دادهام
22
00:00:44,969 –> 00:00:46,170
که
23
00:00:46,170 –> 00:00:48,270
این را با استفاده از پایتون پیادهسازی خواهیم کرد، بنابراین بیایید به درستی
24
00:00:48,270 –> 00:00:49,079
آن را پیش
25
00:00:49,079 –> 00:00:51,719
ببریم، کتابخانههایی که
26
00:00:51,719 –> 00:00:54,360
باید در این مورد برای این
27
00:00:54,360 –> 00:00:58,350
پیادهسازی خاص استفاده کنیم. پاندا باشید، بنابراین
28
00:00:58,350 –> 00:00:59,640
من فقط میروم و
29
00:00:59,640 –> 00:01:02,120
30
00:01:04,229 –> 00:01:06,240
پانداها را کاملاً وارد میکنم و سپس ما همچنین باید از یک
31
00:01:06,240 –> 00:01:08,250
روان در کتابخانه آنها استفاده کنیم، گاهی اوقات میتوانم
32
00:01:08,250 –> 00:01:11,420
یاد بگیرم که باید
33
00:01:11,450 –> 00:01:13,940
وارد کنم درخت تصمیم خود را درست وارد میکنم، بنابراین
34
00:01:13,940 –> 00:01:15,380
اول از همه هنوز هستم یک ورودی خط مشی منسجم،
35
00:01:15,380 –> 00:01:18,700
بنابراین
36
00:01:18,930 –> 00:01:21,360
درخت تصمیم دارای طبقهبندی درخت تصمیم
37
00:01:21,360 –> 00:01:23,310
درست است، بنابراین ما یک
38
00:01:23,310 –> 00:01:25,560
رگرسیون درخت تصمیم داریم و یک طبقهبندی که من از
39
00:01:25,560 –> 00:01:27,060
آن استفاده خواهم کرد، این واقعاً طبقهبندیکننده
40
00:01:27,060 –> 00:01:28,170
نیست، زیرا بدیهی است که ما باید طبقهبندی را انجام دهیم
41
00:01:28,170 –> 00:01:30,390
و نه رگرسیون را به درستی
42
00:01:30,390 –> 00:01:33,950
انجام دهیم. شما نیاز به وارد کردن دارید این است
43
00:01:33,950 –> 00:01:36,120
که ما باید کتابخانه پیش پردازش را وارد کنیم
44
00:01:36,120 –> 00:01:39,900
که به سادگی
45
00:01:39,900 –> 00:01:42,300
به ما کمک می کند تا رمزگذاری را انجام دهیم و
46
00:01:42,300 –> 00:01:43,680
خواهید دید که چرا من در واقع همه
47
00:01:43,680 –> 00:01:44,790
این کتابخانه ها را وارد می کنم، بنابراین اگر متوجه نمی
48
00:01:44,790 –> 00:01:45,960
شوید اینجا چه اتفاقی می افتد و چه اتفاقی می افتد.
49
00:01:45,960 –> 00:01:48,540
این کتابخانهها قرار است چه
50
00:01:48,540 –> 00:01:49,710
کاری انجام دهند، بنابراین شما در حال حاضر نگران آن نباشید،
51
00:01:49,710 –> 00:01:51,900
تنها کاری که باید انجام دهید این است که به نظر
52
00:01:51,900 –> 00:01:53,310
میرسد تمرکز کرده باشید و میدانید که
53
00:01:53,310 –> 00:01:55,619
الان دارم چه کار
54
00:01:55,619 –> 00:01:57,810
میکنم، اوه فراموش کردم
55
00:01:57,810 –> 00:02:03,110
کلمه کلیدی مهم lea را اضافه کنم. der و بنابراین از شما بپرسم که
56
00:02:04,299 –> 00:02:06,740
چه چیز دیگری داریم بله، بنابراین ما به
57
00:02:06,740 –> 00:02:09,979
من پیشنهاد دادیم که تابع تقسیم آزمایشی تست قطار را
58
00:02:09,979 –> 00:02:11,900
وارد کنم که قرار است
59
00:02:11,900 –> 00:02:13,940
برای تقسیم داده های ما به آموزش
60
00:02:13,940 –> 00:02:16,519
و آزمایش استفاده شود چرا این کار را انجام می دهم
61
00:02:16,519 –> 00:02:20,769
زیرا خوب وجود دارد چیزی به
62
00:02:20,769 –> 00:02:23,209
نام داده های آموزشی وجود دارد
63
00:02:23,209 –> 00:02:24,980
و داده های آزمایشی آب به
64
00:02:24,980 –> 00:02:27,650
دو چیز است، بنابراین اگر اینطور هستید در
65
00:02:27,650 –> 00:02:29,750
ویدیوهای بعدی خواهید دید که در
66
00:02:29,750 –> 00:02:31,549
هر مدلی که قرار
67
00:02:31,549 –> 00:02:33,590
است یاد بگیریم باید خود را تقسیم کنیم. داده ها
68
00:02:33,590 –> 00:02:35,569
به دو مجموعه تبدیل می شوند، بنابراین اولین مورد
69
00:02:35,569 –> 00:02:37,099
قرار است داده های آموزشی در داده های آزمایشی
70
00:02:37,099 –> 00:02:39,260
برای حفظ داده ها و آزمایش داده ها باشد
71
00:02:39,260 –> 00:02:41,510
و این دو وحشت چیست،
72
00:02:41,510 –> 00:02:44,090
من به عنوان کدنویسی توضیح خواهم داد، بنابراین
73
00:02:44,090 –> 00:02:46,190
اول از همه تازه وارد کردم. این
74
00:02:46,190 –> 00:02:47,420
کتابخانه ها همانطور که می بینید در حال حاضر من
75
00:02:47,420 –> 00:02:50,510
همه آنها را وارد کرده ام و اکنون همانطور که
76
00:02:50,510 –> 00:02:52,519
می بینید امروز
77
00:02:52,519 –> 00:02:54,379
آماده کرده ام داده های خود را اینجا آماده کرده ام می توانید ببینید
78
00:02:54,379 –> 00:02:56,540
این مجموعه داده های ساده ای است که من دارم و
79
00:02:56,540 –> 00:02:58,579
کاری که در اینجا انجام می دهم من فقط
80
00:02:58,579 –> 00:03:00,590
تمام ستون ها را نوشتم در ما به من اجازه میدهیم
81
00:03:00,590 –> 00:03:02,510
یاد بگیرم تنها تفاوت این است که
82
00:03:02,510 –> 00:03:04,760
در ستون بادی که ما در مورد آن یاد میگیریم،
83
00:03:04,760 –> 00:03:06,349
بنابراین میتوانید سمت داده را دقیقاً
84
00:03:06,349 –> 00:03:06,709
در اینجا ببینید
85
00:03:06,709 –> 00:03:10,400
، باد آخر هفته
86
00:03:10,400 –> 00:03:13,280
قوی بود، اما در عوض من سقوط و
87
00:03:13,280 –> 00:03:15,739
درست را دارم و اینطور نیست. مهم نیست زیرا
88
00:03:15,739 –> 00:03:17,720
این ویژگی ها عادی هستند یا
89
00:03:17,720 –> 00:03:18,739
چیزی که می توانید بگویید آنها فقط
90
00:03:18,739 –> 00:03:20,750
ویژگی های باینری هستند، بنابراین تنها کاری که باید انجام دهیم این
91
00:03:20,750 –> 00:03:23,150
است که باید آنها را به صفر
92
00:03:23,150 –> 00:03:24,889
و یک تبدیل کنیم و در اینجا می توانید کمی
93
00:03:24,889 –> 00:03:27,950
بارانی یا اتومبیل و آفتابی را ببینید. من
94
00:03:27,950 –> 00:03:29,510
فقط میروم و آنها را کدنویسی
95
00:03:29,510 –> 00:03:32,150
میکنم تا بتوانیم آنها را به وضوح ببینیم و چگونه
96
00:03:32,150 –> 00:03:33,560
درست به نظر میرسند، بنابراین بقیه مواردی که من
97
00:03:33,560 –> 00:03:38,060
PD PD دریافت کردم فقط نام مستعار
98
00:03:38,060 –> 00:03:40,730
پانداهای Halling هستند بنابراین من فقط دارم
99
00:03:40,730 –> 00:03:42,920
فایل CSV را میخوانم و اینطور نیست.
100
00:03:42,920 –> 00:03:45,560
نام فایل temp dot CSV بود و
101
00:03:45,560 –> 00:03:47,570
در حال حاضر من فقط میروم و
102
00:03:47,570 –> 00:03:49,700
این مرکز داده را چاپ میکنم تا بتوانید ببینید و همین
103
00:03:49,700 –> 00:03:51,560
الان ببینید که
104
00:03:51,560 –> 00:03:54,680
مجموعه دادهها را بلافاصله وارد کردهایم و
105
00:03:54,680 –> 00:03:56,480
Outlook دارای صفات اسمی
106
00:03:56,480 –> 00:03:59,180
بارانی ابری آفتابی بنابراین
107
00:03:59,180 –> 00:04:01,340
ما باید آنها را نیز رمزگذاری کنیم، بنابراین
108
00:04:01,340 –> 00:04:02,750
مقادیر رمزگذاری شده برای این کار خواهد بود،
109
00:04:02,750 –> 00:04:04,580
اجازه دهید بگوییم ابر
110
00:04:04,580 –> 00:04:06,740
ابری می شود صفر بارانی می شود یک و آفتابی تبدیل به دو می شود
111
00:04:06,740 –> 00:04:08,780
و به طور مشابه زندگی در انگلستان به
112
00:04:08,780 –> 00:04:10,520
این دلیل است که چرا باید
113
00:04:10,520 –> 00:04:12,770
این را رمزگذاری کنیم
114
00:04:12,770 –> 00:04:14,450
مدلهای یادگیری ماشین ما در پایتون
115
00:04:14,450 –> 00:04:15,980
مقدار رشته را درک نمیکنند، بنابراین بدیهی است
116
00:04:15,980 –> 00:04:17,690
که باید اعداد را تغذیه
117
00:04:17,690 –> 00:04:20,000
118
00:04:20,000 –> 00:04:22,640
کنیم تا درست روی آن اعداد واکنش نشان دهد، بنابراین باید
119
00:04:22,640 –> 00:04:24,260
اعداد را در اینجا مشخص کنیم، بنابراین باید کل دادهها را تبدیل کنیم.
120
00:04:24,260 –> 00:04:26,860
به درستی اعداد را تنظیم کنید و
121
00:04:26,860 –> 00:04:29,150
این کار بسیار
122
00:04:29,150 –> 00:04:30,830
آسانی خواهد بود و آنها در نظر دارند
123
00:04:30,830 –> 00:04:32,930
که ما در اینجا از پایتون استفاده می کنیم بنابراین
124
00:04:32,930 –> 00:04:34,550
لزوماً نیازی به انجام یا کارهای زیادی
125
00:04:34,550 –> 00:04:35,990
با آن نداریم، اما من قطعاً می توانم
126
00:04:35,990 –> 00:04:39,050
با استفاده از پانداها برای رمزگذاری آن، یک خراش از فرم کد ایجاد کنید،
127
00:04:39,050 –> 00:04:40,760
اما من فقط از
128
00:04:40,760 –> 00:04:42,200
برچسب و گوشه استفاده میکنم، زیرا ما یک
129
00:04:42,200 –> 00:04:43,940
حق داریم، بنابراین لازم نیست از چیز
130
00:04:43,940 –> 00:04:47,570
دیگری درست استفاده کنیم، بنابراین اول از
131
00:04:47,570 –> 00:04:49,520
همه شروع میکنیم، فقط میدانیم این را حذف کنید.
132
00:04:49,520 –> 00:04:51,410
غیر ضروری ستونی که به آن نیاز داریم
133
00:04:51,410 –> 00:04:52,640
درست به این ستون نیاز نداریم، بنابراین به
134
00:04:52,640 –> 00:04:54,740
این ستون ID نیازی نداریم، شما قبلاً شناسه ما
135
00:04:54,740 –> 00:04:57,260
را در اینجا دارید، بنابراین من فقط میروم
136
00:04:57,260 –> 00:04:59,290
و میگویم مجموعه دادهها
137
00:04:59,290 –> 00:05:05,400
برابر است با PD dot بتا
138
00:05:06,300 –> 00:05:09,090
قاب بزرگ و اکنون باید بگوییم دادههای ما
139
00:05:09,090 –> 00:05:13,050
یک آرگومان کلمه کلیدی است
140
00:05:13,050 –> 00:05:14,370
که او باید آن را به
141
00:05:14,370 –> 00:05:16,680
چارچوب داده پیتر بفرستد و سپس من فقط باید به
142
00:05:16,680 –> 00:05:18,960
سادگی ادامه دهم و
143
00:05:18,960 –> 00:05:20,370
همه ستونهای مجموعه داده را خوب بگویم.
144
00:05:20,370 –> 00:05:21,840
برخی از آنها می گویند مجموعه داده ها باید آن ستون ها را به درستی شامل شود
145
00:05:21,840 –> 00:05:23,669
146
00:05:23,669 –> 00:05:28,349
. من قفل می کنم و چه چیزی را باید بگوییم خیلی
147
00:05:28,349 –> 00:05:30,659
ساده است، بنابراین شما باید همه
148
00:05:30,659 –> 00:05:33,449
سطرها و سپس از 1 تا 5، بنابراین تمام
149
00:05:33,449 –> 00:05:35,909
ستون ها را بگنجانید، بنابراین اگر من فقط بگویم 6 به این معنی است که
150
00:05:35,909 –> 00:05:41,310
من 0 1 2 3 4 را درست می گویم و اگر من فقط به
151
00:05:41,310 –> 00:05:43,650
این شکل می گویم بسیار خوب، من به شما نشان خواهم داد،
152
00:05:43,650 –> 00:05:50,550
بنابراین مانند 0 1 2 3 4 است، بنابراین باید 5 را
153
00:05:50,550 –> 00:05:52,110
در اینجا بگویم
154
00:05:52,110 –> 00:05:55,680
و سپس شما نیز باید مقادیر نقطه را بگویید،
155
00:05:55,680 –> 00:05:57,659
بنابراین همه مقادیر در این ستون ها
156
00:05:57,659 –> 00:06:00,560
باید بلافاصله سریع باشند.
157
00:06:00,560 –> 00:06:04,110
و در نهایت فقط میخواهم بگویم
158
00:06:04,110 –> 00:06:05,939
همه نامهای ستونها
159
00:06:05,939 –> 00:06:08,520
برابر با ستونها هستند و سپس میتوانیم نامهایی را مشخص کنیم
160
00:06:08,520 –> 00:06:14,509
که نامهای Outlook هستند و دما داریم.
161
00:06:14,509 –> 00:06:16,440
162
00:06:16,440 –> 00:06:18,600
فقط میتوانم از نامهای
163
00:06:18,600 –> 00:06:20,940
زیر استفاده کنم، اما من فقط میخواهم ادامه بده و
164
00:06:20,940 –> 00:06:23,190
خودم اسم ها را گفتم پس
165
00:06:23,190 –> 00:06:24,570
موردی ندارم و گفتم اگر
166
00:06:24,570 –> 00:06:26,730
این اسنپ ها را نمی خواهم این
167
00:06:26,730 –> 00:06:27,990
حروف بزرگ را در ابتدای نام نمی
168
00:06:27,990 –> 00:06:29,730
خواهم بنابراین فقط خودم آنها را نام می برم و می توانم استفاده کنم.
169
00:06:29,730 –> 00:06:31,740
همان نام هایی که من در مجموعه داده دارم
170
00:06:31,740 –> 00:06:35,070
اما فقط برای اینکه به شما نشان
171
00:06:35,070 –> 00:06:37,070
دهم این کار را از ابتدا انجام می دهم و از ابتدا این کار را انجام می دهم
172
00:06:37,070 –> 00:06:39,410
173
00:06:39,410 –> 00:06:40,990
واضح است که موسیقی ما را پیدا میکند،
174
00:06:40,990 –> 00:06:44,990
بنابراین ما آنها فوقالعاده هستند، بنابراین
175
00:06:44,990 –> 00:06:49,550
یک خطا داریم درست و خطا، خوب است شما
176
00:06:49,550 –> 00:06:52,930
از پنج ستون استفاده میکنید،
177
00:06:52,930 –> 00:06:55,220
پس چرا ما حتی از پنج ستون استفاده میکنیم، پس چرا
178
00:06:55,220 –> 00:06:57,080
از شش ستون استفاده میکنیم، بنابراین باید از شش ستون در اینجا استفاده
179
00:06:57,080 –> 00:06:59,870
کنیم یا به سادگی می توانیم بگوییم یک صفر
180
00:06:59,870 –> 00:07:02,870
از پنج خوب است، بنابراین باید اضافه کنیم ما باید
181
00:07:02,870 –> 00:07:04,100
182
00:07:04,100 –> 00:07:06,760
آن ستون را حذف کنیم، دقیقاً به همین دلیل است که من
183
00:07:06,760 –> 00:07:09,980
باید از شش استفاده کنم و همانطور که می بینید اکنون
184
00:07:09,980 –> 00:07:12,140
مجموعه مرده را تشکیل داده ایم و به نظر می رسد.
185
00:07:12,140 –> 00:07:14,840
مثل اینکه درست به نظر می رسد، بنابراین
186
00:07:14,840 –> 00:07:18,170
تمام ستون های مورد نیاز را دارد و اکنون
187
00:07:18,170 –> 00:07:19,880
می توانیم ادامه دهیم و شروع به رمزگذاری
188
00:07:19,880 –> 00:07:22,150
همه این ستون ها کنیم تا چیزی به نظر
189
00:07:22,150 –> 00:07:24,620
برسد که مدل یادگیری ماشین ما
190
00:07:24,620 –> 00:07:26,390
بتواند به درستی درک کند، بنابراین ما این
191
00:07:26,390 –> 00:07:29,270
کار را انجام نمی دهیم اول از همه برای
192
00:07:29,270 –> 00:07:33,340
اینکه این کار کار کند، من فقط میروم و
193
00:07:33,340 –> 00:07:36,250
یک رمزگذار برچسب ایجاد میکنم، بنابراین چگونه
194
00:07:36,250 –> 00:07:37,600
میتوانیم یک رمزگذار سطح ایجاد کنیم، به سختی میتوانیم
195
00:07:37,600 –> 00:07:39,610
به سادگی بگوییم le ما فقط یک نام متغیر داریم
196
00:07:39,610 –> 00:07:41,260
و من فقط میخواهم بگویم
197
00:07:41,260 –> 00:07:43,450
رمزگذار برچسب این است. دقیقاً نحوه ایجاد یک
198
00:07:43,450 –> 00:07:45,790
رمزگذار برچسب در Pyt است با استفاده از
199
00:07:45,790 –> 00:07:47,110
کتابخانه دوم، همانطور که می بینید من
200
00:07:47,110 –> 00:07:49,090
رنگ کمی در اینجا قرار نداده ام و سپس
201
00:07:49,090 –> 00:07:52,480
می خواهیم بگوییم خوب اول از همه،
202
00:07:52,480 –> 00:07:55,380
فقط می خواهم ادامه دهم و بگوییم که مجموعه داده
203
00:07:55,380 –> 00:07:57,270
زیرخط رمزگذاری شده است، بنابراین باید
204
00:07:57,270 –> 00:07:59,400
در واقع یک دیگری ایجاد کنیم. مجموعه دادهای
205
00:07:59,400 –> 00:08:00,570
که به رنگ درست است، بنابراین ما میتوانیم
206
00:08:00,570 –> 00:08:02,790
کسی آنچه را که برای ما کدگذاری شده است، پیگیری
207
00:08:02,790 –> 00:08:05,010
کند، بنابراین دقیقاً به همین دلیل است که من
208
00:08:05,010 –> 00:08:06,660
یک متغیر جدید ایجاد میکنم تا بتوانیم
209
00:08:06,660 –> 00:08:08,790
ردیابی کنیم که
210
00:08:08,790 –> 00:08:10,470
مجموعه داده قبلی چگونه بود و این
211
00:08:10,470 –> 00:08:13,920
مجموعه دادههای رمزگذاریشده در حال حاضر چگونه به نظر میرسد، بنابراین اکنون
212
00:08:13,920 –> 00:08:15,780
میخواهم ادامه دهم و بگویم
213
00:08:15,780 –> 00:08:20,190
مجموعه دادهها نقطهای ثبت نام کردهام و فقط میخواهم بگویم
214
00:08:20,190 –> 00:08:23,670
همه ردیفها فقط همه ردیفها و
215
00:08:23,670 –> 00:08:27,000
از 0 تا 5 را میگیرند، پس این چه کار میکند به این
216
00:08:27,000 –> 00:08:29,880
معنی است که 0 1 2 3 4 پس 0 شامل
217
00:08:29,880 –> 00:08:32,490
و 5 از مجموعه داده های ما حذف می شود، بنابراین
218
00:08:32,490 –> 00:08:36,419
از 0 به 1 2 3 4 می رود،
219
00:08:36,419 –> 00:08:38,429
بنابراین دقیقاً همان چیزی است که ما در حال حاضر می بینیم
220
00:08:38,429 –> 00:08:39,599
این همان طرف دیگر است که شما
221
00:08:39,599 –> 00:08:41,970
در اینجا اختصاص داده اید، اما ما باید برچسب را اعمال کنیم،
222
00:08:41,970 –> 00:08:44,370
بنابراین آنچه که برچسب
223
00:08:44,370 –> 00:08:47,040
شامل یک رمزگذاری 1 مشخصه می شود. درست است
224
00:08:47,040 –> 00:08:50,220
و شماره آن را خروجی می دهد، بنابراین اجازه دهید من
225
00:08:50,220 –> 00:08:51,840
بروم اجازه دهید فقط به شما نشان دهم که یک
226
00:08:51,840 –> 00:08:54,480
نمونه از آن را درست به شما نشان دهم، بنابراین می
227
00:08:54,480 –> 00:08:56,280
خواهم بگویم m sale the le dot ما
228
00:08:56,280 –> 00:08:58,260
ایجاد زیرخط شکل متقاطع را ایجاد می
229
00:08:58,260 –> 00:09:00,170
کنیم. تابع
230
00:09:00,170 –> 00:09:02,450
اعمال رمزگذار کوچک روی و من می
231
00:09:02,450 –> 00:09:03,769
توانم درست به نظر برسم، بنابراین من فقط می خواهم بگویم
232
00:09:03,769 –> 00:09:07,130
و سپس کاری که می توانم انجام دهم این است که من فقط
233
00:09:07,130 –> 00:09:09,589
این را از اینجا کپی نکردم و فرض کنید
234
00:09:09,589 –> 00:09:11,750
می خواستم ستون Outlook را در سمت راست رمزگذاری کنم.
235
00:09:11,750 –> 00:09:13,190
بنابراین این نام Outlook است،
236
00:09:13,190 –> 00:09:16,730
بنابراین اگر من این کار را انجام دهم، اگر دیدید که
237
00:09:16,730 –> 00:09:19,190
فوراً Outlook را برای ما رمزگذاری کرده است، می
238
00:09:19,190 –> 00:09:22,430
توانید ببینید که اکنون 1 1 0 2 2 2 1 1
239
00:09:22,430 –> 00:09:24,140
1 دارد، بنابراین همه آن مقادیر را رمزگذاری کرده است.
240
00:09:24,140 –> 00:09:26,510
همه آن ها مقادیر رشته ای هستند،
241
00:09:26,510 –> 00:09:28,640
بنابراین به طور خودکار فهمید که این
242
00:09:28,640 –> 00:09:30,500
یک ویژگی اسمی است و فقط اگر
243
00:09:30,500 –> 00:09:32,690
نتوانید آرایه هایی را انتخاب کنید که آفتابی
244
00:09:32,690 –> 00:09:34,250
و بارانی هستند، بنابراین آنها را به اعدادی مانند آن عالی رمزگذاری می کند،
245
00:09:34,250 –> 00:09:36,649
بنابراین اکنون می
246
00:09:36,649 –> 00:09:40,180
دانیم که نیاز داریم برای اعمال همان
247
00:09:40,180 –> 00:09:43,010
روش یا تمام ویژگی های خود، بنابراین
248
00:09:43,010 –> 00:09:44,360
می توانیم به سادگی از یک حلقه برای استفاده کنیم این
249
00:09:44,360 –> 00:09:46,190
درست است، بنابراین من فقط میخواهم
250
00:09:46,190 –> 00:09:48,900
251
00:09:48,900 –> 00:09:52,540
برای I در مجموعه دادههای
252
00:09:52,540 –> 00:09:55,660
زیرخط رمزگذاریشده صرفهجویی کنم، بنابراین کاری که
253
00:09:55,660 –> 00:09:57,010
در حال حاضر انجام میدهم این است که فقط
254
00:09:57,010 –> 00:09:58,420
میروم و
255
00:09:58,420 –> 00:10:00,910
از ترکیب نامهای ستونها حلقه میکنم. برای حلقه و سپس
256
00:10:00,910 –> 00:10:03,490
آنچه می توانم بگویم آنچه می توانم اینجا انجام دهم این است که
257
00:10:03,490 –> 00:10:06,040
فقط می توانم فقط مجموعه داده را بگویم، بنابراین اگر
258
00:10:06,040 –> 00:10:09,500
ما نیاز به جایگزینی تک تک ستون ها
259
00:10:09,500 –> 00:10:11,750
داریم باید هر ستون آیات را
260
00:10:11,750 –> 00:10:14,690
با مقادیر رمزگذاری شده جایگزین کنیم، بنابراین من
261
00:10:14,690 –> 00:10:16,819
فقط می خواهم درست را در مقادیر یک چهارم تنظیم کنید،
262
00:10:16,819 –> 00:10:19,639
پس با گفتن این موضوع، اگر من ادامه دهم
263
00:10:19,639 –> 00:10:23,110
و مجموعه داده را زیرخط چاپ کنم
264
00:10:23,110 –> 00:10:27,440
و آن را نگه دارم، خواهید دید که
265
00:10:27,440 –> 00:10:29,560
ما فوراً توانستیم
266
00:10:29,560 –> 00:10:32,600
در اعداد ادغام کنیم، بنابراین
267
00:10:32,600 –> 00:10:36,110
همین الان مثل یک تن کار می کند. چرا
268
00:10:36,110 –> 00:10:38,080
در واقع من مجموعه دادهها را جدا نگه داشتم،
269
00:10:38,080 –> 00:10:40,700
بنابراین اکنون میتوانیم
270
00:10:40,700 –> 00:10:43,780
ببینیم چه چیزی گفته شده است.
271
00:10:43,780 –> 00:10:45,610
272
00:10:45,610 –> 00:10:47,500
273
00:10:47,500 –> 00:10:52,180
274
00:10:52,180 –> 00:10:54,850
بنابراین در رمزگذاری شده به صفر بارانی به این معنی است که یک بار
275
00:10:54,850 –> 00:10:58,450
آن را به رمزگذاری شده است به یک و دو به معنای
276
00:10:58,450 –> 00:11:00,130
آفتابی است، بنابراین دقیقاً همان چیزی است که در
277
00:11:00,130 –> 00:11:01,510
اینجا اتفاق میافتد و سپس
278
00:11:01,510 –> 00:11:03,190
دما فقط سه ویژگی داشت که
279
00:11:03,190 –> 00:11:05,140
روی صفر یک و دو و همچنین
280
00:11:05,140 –> 00:11:07,240
رطوبت فقط دو ویژگی داشت،
281
00:11:07,240 –> 00:11:11,620
بنابراین شامل صفر و
282
00:11:11,620 –> 00:11:12,970
فقط یک میشود تا فقط یک ویژگی باینری ب