در این مطلب، ویدئو آموزش پایتون: انتخاب ویژگی در مقابل استخراج ویژگی با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:03:27
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,829 –> 00:00:02,790
کاهش تعداد ابعاد در
2
00:00:02,790 –> 00:00:05,610
مجموعه دادههای شما دارای مزایای متعددی است
3
00:00:05,610 –> 00:00:07,230
که مجموعه دادههای شما سادهتر میشود و در نتیجه
4
00:00:07,230 –> 00:00:09,329
کار با آن آسانتر میشود و به فضای دیسک کمتری
5
00:00:09,329 –> 00:00:11,519
برای ذخیره نیاز دارد و محاسبات برای اجرای
6
00:00:11,519 –> 00:00:14,699
سریعتر، به علاوه
7
00:00:14,699 –> 00:00:16,410
احتمال کمتری دارد که مدلها در مجموعه دادهای با تعداد کمتری بیش از حد مناسب شوند.
8
00:00:16,410 –> 00:00:20,010
ابعاد سادهترین راه برای کاهش
9
00:00:20,010 –> 00:00:21,900
ابعاد این است که فقط
10
00:00:21,900 –> 00:00:23,700
ویژگیها یا ستونهایی را که
11
00:00:23,700 –> 00:00:26,430
برای شما مهم هستند از میان مجموعه دادههای بزرگتر انتخاب کنید، قسمت سخت
12
00:00:26,430 –> 00:00:28,530
اینجا این است که تصمیم بگیرید که کدام ویژگیها
13
00:00:28,530 –> 00:00:30,660
مهم هستند، اگر در
14
00:00:30,660 –> 00:00:32,520
مورد دادههای مربوط به شما متخصص هستید. توجه داشته
15
00:00:32,520 –> 00:00:34,050
16
00:00:34,050 –> 00:00:36,000
باشید که به عنوان مثال
17
00:00:36,000 –> 00:00:38,220
، اگر
18
00:00:38,220 –> 00:00:39,540
می خواهید پیش بینی کنید که آیا
19
00:00:39,540 –> 00:00:41,879
Fulton به تنهایی است یا خیر، می دانید که رنگ مورد علاقه یک فرد بی ربط است و با
20
00:00:41,879 –> 00:00:44,399
روش drop dataframe pandas می توانید
21
00:00:44,399 –> 00:00:46,860
آن ویژگی را به راحتی حذف کنید، فقط مطمئن شوید که
22
00:00:46,860 –> 00:00:49,949
از آرگومان محور یک به گذشته عبور کرده است.
23
00:00:49,949 –> 00:00:51,720
با مالش یک ستون به جای ردیف مشخص
24
00:00:51,720 –> 00:00:55,019
کنید اگر در آن تازه کار هستید،
25
00:00:55,019 –> 00:00:56,519
گفته می شود قبل از اینکه
26
00:00:56,519 –> 00:00:58,019
تصمیم بگیرد که کدام ویژگی را می توان
27
00:00:58,019 –> 00:00:58,790
حذف کرد، باید کمی کاوش کنید.
28
00:00:58,790 –> 00:01:01,230
نمودار یدکی Seabourn از
29
00:01:01,230 –> 00:01:03,149
نظر بصری عالی است مجموعه دادههای کوچک تا متوسط را بررسی میکند و یک
30
00:01:03,149 –> 00:01:05,909
قایسه یک به یک از
31
00:01:05,909 –> 00:01:08,039
ر عددی را ارائه میکند که مج
32
00:01:08,039 –> 00:01:10,759
وعه داده را در قالب یک نمودار پراکنده به
33
00:01:10,759 –> 00:01:14,250
علاوه نمای مورب تو
34
00:01:14,250 –> 00:01:17,390
یع هر ویژگی ارائه میکند، مثال نشان داده شده در اینجا نم
35
00:01:17,390 –> 00:01:19,800
نهای از آن را به تصویر میکشد. ایالات متحده آمریکا.
36
00:01:19,800 –> 00:01:21,840
مجموعه دادههای اندازهگیری بدن ارتش که پاسخ نامیده میشود
37
00:01:21,840 –> 00:01:24,000
و نوع نموداری را برای نشان
38
00:01:24,000 –> 00:01:27,490
دادن مورب به هیستوگرام تنظیم
39
00:01:27,490 –> 00:01:29,530
کردهایم، میتوانیم متوجه شویم که تعادل انتظار
40
00:01:29,530 –> 00:01:31,060
کاملاً با وزن بر حسب کیلوگرم همبستگی دارد،
41
00:01:31,060 –> 00:01:33,549
زیرا همه نقاط روی یک
42
00:01:33,549 –> 00:01:36,820
خط مورب قرار میگیرند، زیرا هر دو ویژگیها
43
00:01:36,820 –> 00:01:38,830
اطلاعات یکسانی را در خود نگه میدارند،
44
00:01:38,830 –> 00:01:40,860
حذف یکی از آنها کاملا منطقی است
45
00:01:40,860 –> 00:01:42,960
اگر آمریکا وجود داشت که
4