در این مطلب، ویدئو یادگیری ماشین و تجزیه و تحلیل داده ها با پایتون، مجموعه داده تایتانیک: قسمت 1، تجسم با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:42
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,520 –> 00:00:03,320
خوش آمدید این قسمت 1 از مجموعه
2
00:00:03,320 –> 00:00:05,779
یادگیری ماشینی و تجزیه و تحلیل
3
00:00:05,779 –> 00:00:08,269
داده ها در مجموعه داده های تایتانیک در این آموزش است
4
00:00:08,269 –> 00:00:09,920
که سعی می کنیم داده ها را درک کنیم و
5
00:00:09,920 –> 00:00:12,349
ببینیم با چه چیزی باید کار
6
00:00:12,349 –> 00:00:14,509
کنیم تا بتوانیم پیش بینی کنیم که زنده می مانیم و چه کسی به این کار
7
00:00:14,509 –> 00:00:18,230
پایان نداده است. فاجعه تایتانیک هر زمان
8
00:00:18,230 –> 00:00:19,849
که با مشکل یادگیری ماشینی
9
00:00:19,849 –> 00:00:22,160
مانند این روبرو شدیم، میخواهیم بفهمیم
10
00:00:22,160 –> 00:00:25,400
که X و Y ما چگونه با هم
11
00:00:25,400 –> 00:00:27,439
مرتبط هستند، بعداً نگاهی دقیقتر
12
00:00:27,439 –> 00:00:29,750
به این خواهیم داشت که بعداً X در این
13
00:00:29,750 –> 00:00:32,180
مورد ویژگیهایی است که ما داریم. به
14
00:00:32,180 –> 00:00:35,030
عنوان مثال برای کار با هر نقطه داده ای،
15
00:00:35,030 –> 00:00:37,070
تمام این ویژگی ها را دارد که آن را توصیف می کند
16
00:00:37,070 –> 00:00:40,670
که ما آن را X X می نامیم، اساساً ماتریسی است
17
00:00:40,670 –> 00:00:43,760
که از بردارهایی تشکیل شده است که یک مجموعه داده را توصیف می کند
18
00:00:43,760 –> 00:00:46,670
و مربوط به هر بردار و
19
00:00:46,670 –> 00:00:49,460
ماتریس X است، برچسبی وجود دارد که ما آن را
20
00:00:49,460 –> 00:00:52,010
می نامیم. Y برچسب ما در این مورد
21
00:00:52,010 –> 00:00:55,010
یا 0 یا 1 0 است به این معنی که این شخص
22
00:00:55,010 –> 00:00:57,440
زنده نمانده است و یکی از معنی هایی که این شخص
23
00:00:57,440 –> 00:01:00,230
در حال تلاش برای یافتن آن هستیم این است که چه نوع
24
00:01:00,230 –> 00:01:03,320
ویژگی هایی در مجموعه داده X
25
00:01:03,320 –> 00:01:06,860
با بقای برچسب مطابقت دارد وقتی نگاه می کنیم.
26
00:01:06,860 –> 00:01:09,350
در X اغلب اوقات این ویژگی ها دارای
27
00:01:09,350 –> 00:01:11,750
توضیحاتی هستند، بنابراین برای مثال در
28
00:01:11,750 –> 00:01:13,820
این مجموعه داده، ما ویژگی هایی داریم
29
00:01:13,820 –> 00:01:16,580
مانند اینکه آیا اکنون مرد یا زن است
30
00:01:16,580 –> 00:01:18,410
که مشخص می شود ویژگی بسیار مهمی
31
00:01:18,410 –> 00:01:20,540
است زیرا ما اکثر افرادی را
32
00:01:20,540 –> 00:01:22,640
که در آن زنده مانده اند می شناسیم. یک تایتانیک یا زنان و
33
00:01:22,640 –> 00:01:25,670
کودکان سوم میخواهیم ببینیم که
34
00:01:25,670 –> 00:01:27,710
آیا ویژگیهای جدیدی وجود دارد یا نه، سپس میخواهیم
35
00:01:27,710 –> 00:01:29,570
ببینیم که آیا مجموعه دادههای من
36
00:01:29,570 –> 00:01:31,820
اصلاً مفید نیست، ما میخواهیم به
37
00:01:31,820 –> 00:01:34,520
آن نقاط
38
00:01:34,520 –> 00:01:36,200
داده نگاه کنیم. هنگامی که به
39
00:01:36,200 –> 00:01:39,080
تجزیه و تحلیل دادههای واقعی میپریم، واضحتر میشود، فقط یک جمعبندی سریع
40
00:01:39,080 –> 00:01:41,240
از آخرین باری که نصب شد،
41
00:01:41,240 –> 00:01:43,700
نوتبوک پایتون و برخی از کتابخانههایی که
42
00:01:43,700 –> 00:01:45,860
اکنون با آنها کار میکنیم،
43
00:01:45,860 –> 00:01:47,750
مطمئن شوید که آن کتابخانهها به درستی
44
00:01:47,750 –> 00:01:49,640
نصب شدهاند، اگر این کار را انجام ندادهاید.
45
00:01:49,640 –> 00:01:52,220
می توانید ابتدا قسمت 0 مجموعه را بررسی کنید،
46
00:01:52,220 –> 00:01:54,170
من قصد دارم تمام نکات کلیدی پاورپوینت را کپی و پیست
47
00:01:54,170 –> 00:01:56,570
کنم، یکی از مواردی
48
00:01:56,570 –> 00:01:58,220
که در مورد اجرا روی هسته نوت بوک شما بسیار دوست دارم در
49
00:01:58,220 –> 00:02:00,350
مقابل نوشتن یک
50
00:02:00,350 –> 00:02:01,910
اسکریپت پایتون و اجرای آن در
51
00:02:01,910 –> 00:02:04,070
ترمینال که میتوانید در حین
52
00:02:04,070 –> 00:02:05,930
نوشتن کد، نوع سلول را به علامتگذاری تغییر دهید،
53
00:02:05,930 –> 00:02:08,090
تمام این نکاتی
54
00:02:08,090 –> 00:02:10,399
را که قبل
55
00:02:10,399 –> 00:02:12,680
از دو مورد آخر داشتیم، احتمالاً در
56
00:02:12,680 –> 00:02:15,260
همان بخش باقی بمانند، کپی و جایگذاری کنید. ابتدا آنها را یکی یکی
57
00:02:15,260 –> 00:02:17,080
مرور
58
00:02:17,080 –> 00:02:19,390
میکنیم. کتابخانه
59
00:02:19,390 –> 00:02:21,310
ای را وارد کنید که قرار است برای این نوع تجزیه و تحلیل
60
00:02:21,310 –> 00:02:24,600
در پانل های وارداتی و یک شالینی
61
00:02:24,600 –> 00:02:27,340
استفاده کنیم، سپس از پانداها برای خواندن
62
00:02:27,340 –> 00:02:31,410
فایل داده ای که از گاو دانلود کرده ایم استفاده می کنیم،
63
00:02:32,340 –> 00:02:36,310
بنابراین چگونه می خواهیم CSV هفته PD دالاس را انجام دهیم.
64
00:02:36,310 –> 00:02:41,110
مقدار رشته و در اینجا
65
00:02:41,110 –> 00:02:43,060
شما در پوشه به فایلی که ما
66
00:02:43,060 –> 00:02:45,610
برای من دانلود کردیم تایپ می کنید، این در
67
00:02:45,610 –> 00:02:47,260
همان دایرکتوری است که فایل نوت بوک droopier
68
00:02:47,260 –> 00:02:49,960
در آن قرار دارد، بنابراین من فکر کردم دکمه فعلی
69
00:02:49,960 –> 00:02:50,620
دایرکتوری را
70
00:02:50,620 –> 00:02:53,710
فشار دهید که همه
71
00:02:53,710 –> 00:02:55,300
فایل های موجود در دایرکتوری را مانند شما به شما نشان می دهد. “در حال
72
00:02:55,300 –> 00:03:01,360
نگاه کردن به یک تغییر واقعاً Trey نه CSV را فشار دهید
73
00:03:01,360 –> 00:03:05,230
و سپس بازگشت را فشار دهید، این
74
00:03:05,230 –> 00:03:06,790
دادهای است که ما در مجموعه آموزشی با آن کار میکنیم،
75
00:03:06,790 –> 00:03:08,680
اجازه دهید در مورد تست صحبت کنیم
76
00:03:08,680 –> 00:03:14,800
که به نظر میرسد متوجه میشویم که مجموعه تست
77
00:03:14,800 –> 00:03:16,960
تقریباً دقیقاً مشابه است.
78
00:03:16,960 –> 00:03:17,500
مجموعه آموزشی
79
00:03:17,500 –> 00:03:20,770
آن را دارم pa ssenger ID کلاس p
80
00:03:20,770 –> 00:03:22,840
که کلاسی است که گیاهان مسافربری برای
81
00:03:22,840 –> 00:03:26,800
نام بردن سن جنسیت تعداد خواهر و برادرها هستند که آیا
82
00:03:26,800 –> 00:03:28,870
این جفت بچه اسکات مسافری
83
00:03:28,870 –> 00:03:32,770
یک کابین کرایه را می گیرند و
84
00:03:32,770 –> 00:03:34,810
تنها چیزی که گم شده است این
85
00:03:34,810 –> 00:03:37,360
مقدار برچسب است زیرا این همان چیزی است که ما سعی
86
00:03:37,360 –> 00:03:39,780
داریم پیش بینی کنیم.
87
00:03:40,010 –> 00:03:43,159
اکنون که میدانیم X و Y میتوانند
88
00:03:43,159 –> 00:03:46,280
CSV را در متغیر پایتون ذخیره کنند، آن را
89
00:03:46,280 –> 00:03:55,400
es DF برابر با P نقطه CSV میدانیم چیزی شبیه به
90
00:03:55,400 –> 00:03:57,650
این در پانداها چارچوب داده نامیده میشود
91
00:03:57,650 –> 00:03:59,690
که در آن میتوانید یک متغیر پایتون را برای ما ذخیره کنید
92
00:03:59,690 –> 00:04:01,400
و کارهای زیادی وجود دارد که میتوانید با آن انجام دهید.
93
00:04:01,400 –> 00:04:03,500
این قاب داده در این ویدیو ما
94
00:04:03,500 –> 00:04:05,209
از آن برای انجام برخی تجسمهای تحلیل اولیه استفاده میکنیم
95
00:04:05,209 –> 00:04:07,730
و میبینیم که
96
00:04:07,730 –> 00:04:09,739
واقعاً چه ارتباطی بین همه
97
00:04:09,739 –> 00:04:14,450
این ویژگیها و برچسب پانداها وجود دارد، یک
98
00:04:14,450 –> 00:04:16,789
کتابخانه بسیار قدرتمند است که در اکثر
99
00:04:16,789 –> 00:04:18,529
مواقع اگر سعی میکنید
100
00:04:18,529 –> 00:04:20,539
با آن کاری انجام دهید به عنوان مثال داده
101
00:04:20,539 –> 00:04:23,060
هایی را که توابع داخلی برای آن دارد
102
00:04:23,060 –> 00:04:25,580
تجسم کنید، به عنوان مثال اگر من بخواهم تجسم کنم که چند
103
00:04:25,580 –> 00:04:30,940
نفر زنده مانده اند در مقابل یک کلید نیست بله
104
00:04:31,539 –> 00:04:36,729
نام ستون را
105
00:04:36,729 –> 00:04:39,139
ارسال کنید. شمارشهای نهایی به شما میگویند
106
00:04:39,139 –> 00:04:41,630
که چند برچسب موجود است در مقابل
107
00:04:41,630 –> 00:04:46,490
صفرهای برچسب در اینجا، میتوانید ببینید که 342
108
00:04:46,490 –> 00:04:50,360
زنده مانده در مقابل 549 مرده وجود دارد، اگر میخواهید
109
00:04:50,360 –> 00:04:54,010
این را در قالب نمودار ببینید،
110
00:05:00,050 –> 00:05:02,509
فقط دانستن اینکه چند نفر زنده ماندهاند در مقابل
111
00:05:02,509 –> 00:05:04,550
نه چندان جالب نیست.
112
00:05:04,550 –> 00:05:06,500
نگاه کنید به این است که آن افرادی
113
00:05:06,500 –> 00:05:08,659
که به خوبی تقسیم شده اند شما می توانید با درد انجام دهید، این کار
114
00:05:08,659 –> 00:05:10,849
بدون قید و شرط در قاب داده ها گذشته است.
115
00:05:10,849 –> 00:05:12,949
116
00:05:12,949 –> 00:05:15,169
117
00:05:15,169 –> 00:05:17,210
118
00:05:17,210 –> 00:05:18,830
چند زن
119
00:05:18,830 –> 00:05:21,220
جان سالم به در بردند
120
00:05:27,710 –> 00:05:29,840
این نیز یک قاب داده خواهد بود،
121
00:05:29,840 –> 00:05:31,460
اما تمام
122
00:05:31,460 –> 00:05:33,740
نقاطی را که X برابر با مرد است، فیلتر
123
00:05:33,740 –> 00:05:37,150
124
00:05:37,150 –> 00:05:49,100
125
00:05:49,100