در این مطلب، ویدئو تجسم داده ها با Python Altair با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:14:19
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,640 –> 00:00:02,879
سلام نام من دارن توماس است و
2
00:00:02,879 –> 00:00:04,560
من مدیر تکنیک های تحقیق آموزشی
3
00:00:04,560 –> 00:00:06,879
در این ویدیوی خاص هستم،
4
00:00:06,879 –> 00:00:08,320
ما در
5
00:00:08,320 –> 00:00:11,840
مورد تجسم داده ها بدون پاره کردن یک
6
00:00:11,840 –> 00:00:14,880
ماژول که برای پایتون در دسترس است کمی
7
00:00:14,880 –> 00:00:17,920
یاد می گیریم، بنابراین بیایید ببینیم چه چیزی می توانیم یاد بگیریم
8
00:00:19,199 –> 00:00:22,240
تا ما اینجا در داخل نوت بوک مشتری
9
00:00:22,240 –> 00:00:24,800
هستیم و همانطور که قبلاً ذکر کردم کمی در مورد altair یاد می گیریم
10
00:00:24,800 –> 00:00:27,119
11
00:00:27,119 –> 00:00:29,279
و همانطور که قبلاً ذکر کردم
12
00:00:29,279 –> 00:00:31,679
altair یک ماژول یا
13
00:00:31,679 –> 00:00:34,399
کتابخانه تجسم داده است که در پایتون موجود است
14
00:00:34,399 –> 00:00:36,320
و هیچ چیز منحصر به فردی در مورد آن وجود ندارد به
15
00:00:36,320 –> 00:00:37,840
جز دو چیز.
16
00:00:37,840 –> 00:00:41,120
استفاده از یکی به طرز شگفتآوری آسان است و ابزارها یا تجسمهای
17
00:00:41,120 –> 00:00:43,120
نسبتاً پیچیدهای ایجاد میکند
18
00:00:43,120 –> 00:00:46,960
و همچنین
19
00:00:46,960 –> 00:00:50,160
میتوانید تعامل را
20
00:00:50,160 –> 00:00:51,680
در طرح بگنجانید، بنابراین
21
00:00:51,680 –> 00:00:53,039
کاری که ما در اینجا انجام میدهیم این است
22
00:00:53,039 –> 00:00:55,120
که
23
00:00:55,120 –> 00:00:57,120
برخی از دادهها را تنظیم کنیم. من قصد دارم از
24
00:00:57,120 –> 00:00:59,039
برخی دادهها به نام دانکین استفاده کنم، بنابراین این
25
00:00:59,039 –> 00:01:01,280
اولین خط کد من در اینجاست و بنابراین
26
00:01:01,280 –> 00:01:03,120
میخواهم پانداهایی را وارد کنم که
27
00:01:03,120 –> 00:01:04,559
بعداً مهم میشوند
28
00:01:04,559 –> 00:01:06,560
و ما چیزی را
29
00:01:06,560 –> 00:01:08,880
از یک مدول میگیریم. مجموعه داده پی نامیده می شود و
30
00:01:08,880 –> 00:01:10,479
داده ها را وارد می کند و سپس از آنجا
31
00:01:10,479 –> 00:01:12,479
مجموعه داده های خود را به نام دانکین می
32
00:01:12,479 –> 00:01:14,240
گیریم، آن را به صورت df ذخیره می کنیم، این
33
00:01:14,240 –> 00:01:16,080
دقیقاً در اینجا در خط سه است و ما فقط می
34
00:01:16,080 –> 00:01:19,119
خواهیم آن را در اینجا در خط نمایش دهیم. چهار،
35
00:01:19,119 –> 00:01:21,759
بنابراین این اطلاعات من است، بنابراین اساساً این داده
36
00:01:21,759 –> 00:01:24,840
ها به شغل افراد نگاه می کنند،
37
00:01:24,840 –> 00:01:27,280
بنابراین ممکن است
38
00:01:27,280 –> 00:01:29,280
طبقه کارگر حرفه ای یا یقه آبی
39
00:01:29,280 –> 00:01:30,560
40
00:01:30,560 –> 00:01:32,240
لخته سفید یقه سفید یا یقه آبی باشد.
41
00:01:32,240 –> 00:01:33,360
42
00:01:33,360 –> 00:01:36,240
43
00:01:36,240 –> 00:01:38,000
44
00:01:38,000 –> 00:01:41,280
مقیاس 1 تا 100 در اینجا، بنابراین
45
00:01:41,280 –> 00:01:43,040
قبل از اینکه وارد نمودارهای اصلی خود
46
00:01:43,040 –> 00:01:46,240
شویم، یک نمودار پراکندگی و
47
00:01:46,240 –> 00:01:48,000
یک نمودار پراکنده و یک نمودار میله ای ایجاد
48
00:01:48,000 –> 00:01:49,040
می کنیم.
49
00:01:49,040 –> 00:01:52,000
50
00:01:52,000 –> 00:01:54,399
برخی از ایدهها در مورد گرامر گرافیک و
51
00:01:54,399 –> 00:01:55,200
بنابراین
52
00:01:55,200 –> 00:01:57,360
کاری که altair انجام میدهد این است که
53
00:01:57,360 –> 00:01:59,280
آن را حفظ میکند
54
00:01:59,280 –> 00:02:01,360
ایدهآلهای گرافیک گرامر را در نظر میگیرد، جایی که
55
00:02:01,360 –> 00:02:03,920
باید با دادههای شما مقابله
56
00:02:03,920 –> 00:02:05,840
57
00:02:05,840 –> 00:02:07,360
کنید. رفتن
58
00:02:07,360 –> 00:02:09,360
به استفاده
59
00:02:09,360 –> 00:02:11,200
تبدیل آماری مقیاس مانند
60
00:02:11,200 –> 00:02:13,280
رگرسیون به عنوان مثال نوع
61
00:02:13,280 –> 00:02:14,480
اشیایی که قرار است از آن استفاده کنید خواه یک نقطه باشد
62
00:02:14,480 –> 00:02:16,239
یا یک دایره یا یک مربع یا مثلث با
63
00:02:16,239 –> 00:02:18,000
هر وجهی و البته
64
00:02:18,000 –> 00:02:19,599
سیستم مختصات خواه x y
65
00:02:19,599 –> 00:02:22,160
یا سیستم مختصات دیگری
66
00:02:22,160 –> 00:02:25,200
باشد. ما در نهایت اولین طرح خود را
67
00:02:25,200 –> 00:02:27,760
با در نظر گرفتن این ایده ها داریم و بنابراین
68
00:02:27,760 –> 00:02:30,000
باید ماژول altair را وارد
69
00:02:30,000 –> 00:02:31,200
کنید
70
00:02:31,200 –> 00:02:33,120
که ممکن است قبلاً روی سیستم
71
00:02:33,120 –> 00:02:34,800
شما نباشد، بنابراین باید آن را نصب کنید، چه
72
00:02:34,800 –> 00:02:36,879
از طریق
73
00:02:36,879 –> 00:02:38,800
رابط کاربری گرافیکی در ویندوز یا
74
00:02:38,800 –> 00:02:40,800
با استفاده از پیپ، اگر می خواهید. دوست دارم از لینوکس یا
75
00:02:40,800 –> 00:02:43,120
هر چیز دیگری استفاده کنم و بنابراین altair را وارد می کنیم، ما
76
00:02:43,120 –> 00:02:44,400
77
00:02:44,400 –> 00:02:46,879
آن را به عنوان alt وارد می کنیم و می توانید
78
00:02:46,879 –> 00:02:48,640
در اینجا در خط دوم ببینید اینجا جایی است که سرگرمی
79
00:02:48,640 –> 00:02:51,599
شروع می شود، بنابراین من البته
80
00:02:51,599 –> 00:02:54,160
ماژول واقعی شما را که می دانید در اینجا استفاده می کنم تماس می گیرم. alt
81
00:02:54,160 –> 00:02:56,080
و اولین چیز دادههای من است، بنابراین
82
00:02:56,080 –> 00:02:58,640
نموداری از دادههای من است، من آن را به صورت df ذخیره کردم، این
83
00:02:58,640 –> 00:03:00,800
کاری است که انجام دادم و سپس اینجا
84
00:03:00,800 –> 00:03:02,000
زیباییشناسی است.
85
00:03:02,000 –> 00:03:02,879
86
00:03:02,879 –> 00:03:05,120
87
00:03:05,120 –> 00:03:06,720
یک نمودار میله ای
88
00:03:06,720 –> 00:03:08,640
و سپس رمزگذاری جایی است که من به آن
89
00:03:08,640 –> 00:03:10,480
می گویم که متغیرهای x و y من چه خواهند
90
00:03:10,480 –> 00:03:13,120
بود، به عنوان مثال در اینجا،
91
00:03:13,120 –> 00:03:15,200
بنابراین ما از type استفاده می کنیم تا
92
00:03:15,200 –> 00:03:16,840
آنها بتوانند به خاطر بسپارند
93
00:03:16,840 –> 00:03:19,360
که نوع می تواند کلاس کاری باشد،
94
00:03:19,360 –> 00:03:20,959
ممکن است
95
00:03:20,959 –> 00:03:24,000
رنگ سفید باشد. می تواند رنگ آبی باشد یا
96
00:03:24,000 –> 00:03:25,360
می
97
00:03:25,360 –> 00:03:26,799
تواند حرفه ای باشد
98
00:03:26,799 –> 00:03:29,760
و بنابراین x من این یک متغیر طبقه بندی
99
00:03:29,760 –> 00:03:32,000
است و سپس در محور y y من
100
00:03:32,000 –> 00:03:34,080
سطح اعتبار کار است
101
00:03:34,080 –> 00:03:36,400
بنابراین اگر ctrl را فشار دهم وارد شوید
102
00:03:36,400 –> 00:03:38,400
و متوجه شوید که چگونه همه چیز را ضبط می کنم
103
00:03:38,400 –> 00:03:40,720
در داخل این پرانتز درست در اینجا برای
104
00:03:40,720 –> 00:03:42,560
قسمت رمزگذاری،
105
00:03:42,560 –> 00:03:44,480
ctrl enter را فشار میدهم
106
00:03:44,480 –> 00:03:47,120
و به وضوح میبینید
107
00:03:47,120 –> 00:03:50,720
که اکنون یک نمودار نواری باریک خوب داریم،
108
00:03:50,720 –> 00:03:52,560
البته گزینههایی برای
109
00:03:52,560 –> 00:03:53,920
بزرگتر کردن آن وجود دارد، در
110
00:03:53,920 –> 00:03:55,519
حال حاضر به نوعی باریک است، اما واقعاً اینطور نیست.
111
00:03:55,519 –> 00:03:57,680
هدف از این ویدئو و بنابراین می توانید
112
00:03:57,680 –> 00:04:00,799
ببینید که ما این نمودارهای نواری زیبا را داریم که
113
00:04:00,799 –> 00:04:03,120
استفاده از آنها برای مبتدیان بسیار ساده است،
114
00:04:03,120 –> 00:04:05,680
در واقع به نظر من
115
00:04:05,680 –> 00:04:07,120
و البته ما می توانیم نوارها را با
116
00:04:07,120 –> 00:04:09,120
رنگ های مختلف بسازیم، می توانیم آن را بسیار گسترده تر کنیم،
117
00:04:09,120 –> 00:04:10,799
اما دوباره اینها گزینه هایی هستند که می توانید
118
00:04:10,799 –> 00:04:12,720
119
00:04:12,720 –> 00:04:14,560
برای حلقه بعدی خود به تنهایی در اینجا کاوش کنید،
120
00:04:14,560 –> 00:04:16,160
ما
121
00:04:16,160 –> 00:04:18,320
از چند حلقه در اینجا استفاده می کنیم، بنابراین این بار
122
00:04:18,320 –> 00:04:19,440
به نظر می رسد که ما یک طرح پراکنده ایجاد می کنیم،
123
00:04:19,440 –> 00:04:21,040
و معتقدم که
124
00:04:21,040 –> 00:04:23,919
تحصیلات و اعتبار را با هم مقایسه می کنیم، بنابراین
125
00:04:23,919 –> 00:04:25,759
از همان مسیر عبور می کنیم
126
00:04:25,759 –> 00:04:27,680
اینجا را پردازش کنید، اما توجه کنید که چگونه به جای
127
00:04:27,680 –> 00:04:29,680
استفاده از نوار، از دایره علامت نقطه استفاده می
128
00:04:29,680 –> 00:04:32,080
کنیم، این تفاوت در اینجاست و
129
00:04:32,080 –> 00:04:34,000
بنابراین ctrl enter را فشار می دهیم
130
00:04:34,000 –> 00:04:36,000
و می بینید که
131
00:04:36,000 –> 00:04:38,400
دوباره در اینجا یک نمودار پراکندگی خوب داریم، بله، می
132
00:04:38,400 –> 00:04:40,479
توانید یک عنوان اضافه کنید و می توانید
133
00:04:40,479 –> 00:04:42,320
میدانید در صورت تمایل افسانه بسازید و میتوانید
134
00:04:42,320 –> 00:04:44,400
چیزهای دیگر را دستکاری کنید، اما ما فقط
135
00:04:44,400 –> 00:04:46,400
سعی میکنیم یک
136
00:04:46,400 –> 00:04:48,479
تجربه اولیه از آنچه در اینجا اتفاق میافتد به شما ارائه دهیم و
137
00:04:48,479 –> 00:04:50,240
بنابراین میتوانید ببینید که
138
00:04:50,240 –> 00:04:52,400
ارتباط قوی بین تحصیلات
139
00:04:52,400 –> 00:04:55,040
و اعتبار وجود دارد زیرا تحصیلات باعث افزایش
140
00:04:55,040 –> 00:04:57,360
اعتبار میشود. به طور کلی با سرعت مشابهی افزایش می یابد،
141
00:04:57,360 –> 00:05:00,560
اگر ادامه دهید،
142
00:05:00,560 –> 00:05:01,919
143
00:05:01,919 –> 00:05:03,199
ما در مورد چگونگی
144
00:05:03,199 –> 00:05:06,560
اضافه کردن رنگ صحبت خواهیم کرد و بنابراین در این نقطه خاص
145
00:05:06,560 –> 00:05:08,479
در اینجا همه چیز عمدتاً همان است
146
00:05:08,479 –> 00:05:10,479
که شما این اطلاعات را در خطوط
147
00:05:10,479 –> 00:05:11,840
یک تا t مشاهده کرده اید. hree
148
00:05:11,840 –> 00:05:13,360
اما آنچه در اینجا جدید است
149
00:05:13,360 –> 00:05:15,520
ببخشید آنچه در اینجا جدید است اینجا
150
00:05:15,520 –> 00:05:17,840
در خط چهار است آنچه اکنون اتفاق می افتد این است
151
00:05:17,840 –> 00:05:20,320
که همانطور که نقطه های خود را می سازیم
152
00:05:20,320 –> 00:05:22,720
آنها را با متغیر طبقه
153
00:05:22,720 –> 00:05:24,880
بندی نوع رنگ می کنیم، بنابراین به یاد داشته باشید که ما رنگ سفید
154
00:05:24,880 –> 00:05:27,360
آبی رنگ و حرفه ای و حرفه ای داشتیم. بنابراین این
155
00:05:27,360 –> 00:05:29,520
تبلیغ به شما امکان می دهد
156
00:05:29,520 –> 00:05:30,720
157
00:05:30,720 –> 00:05:31,440
158
00:05:31,440 –> 00:05:33,360
برای برقراری ارتباط با مخاطبان خود یک بعد اضافی به طرح پراکندگی
159
00:05:33,360 –> 00:05:34,479
خود اضافه کنید،
160
00:05:34,479 –> 00:05:36,800
بنابراین من کلید ctrl را در اینجا فشار می دهم و می
161
00:05:36,800 –> 00:05:39,120
توانید ببینید که این همان نمودار پراکندگی
162
00:05:39,120 –> 00:05:41,840
قبلی است، اما اکنون ما
163
00:05:41,840 –> 00:05:44,560
اطلاعات اضافی از نوع را داریم. می
164
00:05:44,560 –> 00:05:46,800
توانید مشاغل یقه آبی را ببینید که آنها
165
00:05:46,800 –> 00:05:49,840
تحصیلات کمتری دارند و همچنین اعتبار کمتری دارند،
166
00:05:49,840 –> 00:05:51,520
اما پس از آن که بالاتر و بالاتر
167
00:05:51,520 –> 00:05:53,199
می روید، بیشتر به سطوح حرفه ای می
168
00:05:53,199 –> 00:05:55,120
رسید و می توانید ببینید که
169
00:05:55,120 –> 00:05:57,360
با بالا رفتن سطح تحصیلات و اعتبار، تغییری قطعی
170
00:05:57,360 –> 00:05:58,400
171
00:05:58,400 –> 00:05:59,120
172
00:05:59,120 –> 00:06:02,080
در نوع شغلی که یک فرد کار می کند،
173
00:06:02,080 –> 00:06:04,319
اما همپوشانی های زیادی بین
174
00:06:04,319 –> 00:06:07,039
حرفه ای و طبقه کارگر وجود دارد. ببخشید
175
00:06:07,039 –> 00:06:08,800
یقه سفید برای
176
00:06:08,800 –> 00:06:11,919
مدتی طولانی در
177
00:06:11,919 –> 00:06:15,440
اینجا اکنون به سراغ مثال بعدی می
178
00:06:15,440 –> 00:06:18,400
رویم. ime دوباره همه این کدها
179
00:06:18,400 –> 00:06:20,319
اکثراً همان است که خطوط یک
180
00:06:20,319 –> 00:06:22,560
تا چهار را قبلاً مشاهده کرده اید نمودار تمام نقطه
181
00:06:22,560 –> 00:06:25,120
، به این ترتیب شما دایره علامت نقطه داده های خود را قرار می دهید،
182
00:06:25,120 –> 00:06:26,960
بنابراین ما از دایره ها استفاده می کنیم، سپس
183
00:06:26,960 –> 00:06:29,680
در کد x y
184
00:06:29,680 –> 00:06:31,759
رنگ آموزشی و پرستیژ خواهد بود. نوع خواهد بود،
185
00:06:31,759 –> 00:06:33,840
بنابراین ما می دانیم که نوع آن چیست، اما
186
00:06:33,840 –> 00:06:36,319
اکنون اندازه درآمد را اضافه می کنیم، به
187
00:06:36,319 –> 00:06:39,680
عبارت دیگر، هر چه درآمد یک
188
00:06:39,680 –> 00:06:41,759
فرد بیشتر باشد، حباب او دوباره بزرگتر خواهد شد،
189
00:06:41,759 –> 00:06:44,080
این فقط راه دیگری برای گرفتن
190
00:06:44,080 –> 00:06:45,440
اطلاعاتی است
191
00:06:45,440 –> 00:06:48,560
که ممکن است شما داشته باشید. در نمودار خود نیاز دارید،
192
00:06:48,560 –> 00:06:50,080
زیرا در حال نمایش چیزهایی هستید،
193
00:06:50,080 –> 00:06:52,800
بنابراین ctrl enter را فشار میدهم
194
00:06:52,800 –> 00:06:54,880
و میتوانید
195
00:06:54,880 –> 00:06:57,120
ببینید هر چه پول بیشتر باشد حباب بزرگتر است،
196
00:06:57,120 –> 00:06:59,039
به عنوان مثال این
197
00:06:59,039 –> 00:07:01,520
شخص در اینجا اگر میتوانید من را ببینید
198
00:07:01,520 –> 00:07:04,319
، او یک شغل یقه آبی دارد. بدانید که
199
00:07:04,319 –> 00:07:06,000
آنها دارای درجه بالایی از اعتبار هستند
200
00:07:06,000 –> 00:07:08,000
اما درآمد محدودی دارند و همچنین می توانید ببینید
201
00:07:08,000 –> 00:07:11,199
که آنها بسیار بیشتر
202
00:07:11,199 –> 00:07:13,039
از برخی از همتایان خود در آن