در این مطلب، ویدئو گرگ لامپ – ggplot برای پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:07,490 –> 00:00:11,090
من می خواهم Greg lap را معرفی کنم که او
2
00:00:11,090 –> 00:00:13,789
از Y hat است و او از نیویورک به اینجا پرواز کرده است
3
00:00:13,789 –> 00:00:15,469
تا یک سخنرانی عالی در مورد
4
00:00:15,469 –> 00:00:18,320
ggplot با ما داشته باشد، بنابراین لطفاً توجه خود را به او معطوف کنید،
5
00:00:18,320 –> 00:00:20,570
بیایید از این موضوع عبور کنیم
6
00:00:20,570 –> 00:00:21,590
و سعی می کنیم فضای کمی برای
7
00:00:21,590 –> 00:00:25,359
سؤالات بگذاریم. در پایان پس ادامه بده، خوب، من
8
00:00:25,359 –> 00:00:29,210
می توانم صدایم را بشنوم، خوب، بسیار عالی، بنابراین
9
00:00:29,210 –> 00:00:32,750
من گرگ اینجا هستم تا در مورد ggplot امروز صحبت کنم،
10
00:00:32,750 –> 00:00:38,239
اوه من اینجا هستم، بنابراین
11
00:00:38,239 –> 00:00:39,949
اگر با آن آشنا نیستید، به آنچه ggplot است توجه کنید
12
00:00:39,949 –> 00:00:41,659
. کمی در مورد
13
00:00:41,659 –> 00:00:44,780
برخی از کتابخانه های دیگر صحبت
14
00:00:44,780 –> 00:00:48,080
خواهم کرد که چگونه با مواردی مانند matplotlib یا d3 مقایسه می شود،
15
00:00:48,080 –> 00:00:49,940
توضیح خواهم داد که چگونه کار می کند،
16
00:00:49,940 –> 00:00:53,000
بهترین روش ها در مورد استفاده از آن شما را در
17
00:00:53,000 –> 00:00:55,100
موارد استفاده راهنمایی می کند و سپس
18
00:00:55,100 –> 00:00:59,320
به یک آموزش می رویم. نوت بوک ipython
19
00:00:59,320 –> 00:01:04,670
بنابراین گفتم من گرگ هستم. من مدیر ارشد فناوری و
20
00:01:04,670 –> 00:01:08,450
یکی از بنیانگذاران Y hat Y hat استارت آپی است که
21
00:01:08,450 –> 00:01:12,259
ما در نیویورک هستیم و به شرکت ها کمک می کنیم تا
22
00:01:12,259 –> 00:01:14,390
23
00:01:14,390 –> 00:01:17,539
تجزیه و تحلیل های پیش بینی خود را مدیریت و اجرا کنند و من آن را وصل نمی کنم دیگر
24
00:01:17,539 –> 00:01:23,960
به نقطه gb خوش آمدید خوب، بنابراین آنچه که
25
00:01:23,960 –> 00:01:28,039
digi plot well ggplot است در ابتدا
26
00:01:28,039 –> 00:01:31,579
در bi ما پیاده سازی شد گان کلاه هدلی
27
00:01:31,579 –> 00:01:34,549
وایکامب که اصلاً با ما آشناست،
28
00:01:34,549 –> 00:01:36,560
بستههای بسیار عالی ساخته است
29
00:01:36,560 –> 00:01:40,100
که برای انجام
30
00:01:40,100 –> 00:01:42,649
برخی از کارهای معمولی و پیش پا افتاده در
31
00:01:42,649 –> 00:01:46,579
تجزیه و تحلیل دادهها و ggplot بسیار مفید هستند، بر اساس
32
00:01:46,579 –> 00:01:48,909
کتابی به نام گرامر گرافیک و
33
00:01:48,909 –> 00:01:51,670
آنچه در آن نوشته شده است. این است که اساساً یک
34
00:01:51,670 –> 00:01:55,240
زبان دامنه خاص برای تولید
35
00:01:55,240 –> 00:01:58,399
تجسم ها به ویژه برای تجزیه و تحلیل داده ها است،
36
00:01:58,399 –> 00:02:01,280
بنابراین به تمام کارهایی که
37
00:02:01,280 –> 00:02:03,799
در هنگام ساختن یک نمودار انجام داده
38
00:02:03,799 –> 00:02:05,689
اید یا در حال تجزیه و تحلیل داده هایی هستید که می دانید
39
00:02:05,689 –> 00:02:07,789
چیزهایی مانند ساختن نمودارهای پراکنده به
40
00:02:07,789 –> 00:02:09,889
هیستوگرام اختصاص داده شده فکر کنید. رنگها به
41
00:02:09,889 –> 00:02:12,830
متغیرهای خاص سفارشی کردن عناوین
42
00:02:12,830 –> 00:02:14,990
برچسبها همه این کارها را میدانید که
43
00:02:14,990 –> 00:02:16,580
دارید آنها را انجام میدهید،
44
00:02:16,580 –> 00:02:19,160
کدهای زیادی برای آن مینویسید، معمولاً نوعی
45
00:02:19,160 –> 00:02:19,910
کد است که
46
00:02:19,910 –> 00:02:21,980
بارها و بارها از آن استفاده میکنید و بنابراین
47
00:02:21,980 –> 00:02:25,850
به جای تکرار این تلاش
48
00:02:25,850 –> 00:02:28,730
ggplot این کار را انجام می دهد این است که همه چیز
49
00:02:28,730 –> 00:02:33,020
را در یک کتابخانه خاص خود متراکم می
50
00:02:33,020 –> 00:02:36,080
کند که در آن شما می توانید مواردی را که دارای
51
00:02:36,080 –> 00:02:38,360
عملکرد هستند و آن را انتزاع کنید و
52
00:02:38,360 –> 00:02:41,290
بسیار آسان تر و سریع تر به دست آورید. rk با
53
00:02:41,290 –> 00:02:45,800
سوالات زیادی که ممکن است بپرسید
54
00:02:45,800 –> 00:02:47,510
این است که در مورد matplotlib مانند
55
00:02:47,510 –> 00:02:48,980
Matt plot مدتی است که زندگی می کند
56
00:02:48,980 –> 00:02:51,470
و من موافقم که matplotlib یک
57
00:02:51,470 –> 00:02:53,810
کتابخانه عالی است اما فکر می کنم
58
00:02:53,810 –> 00:02:57,260
کمی قدیمی است مواردی وجود دارد که من
59
00:02:57,260 –> 00:03:00,530
واقعاً در مورد ریاضی lib خیلی دوست دارم، اما برخی
60
00:03:00,530 –> 00:03:02,630
از چیزهایی که من دوست ندارم دقیقاً
61
00:03:02,630 –> 00:03:04,760
مانند نحو و api هستند، به نظر من کمی
62
00:03:04,760 –> 00:03:07,940
دست و پا گیر است، من به حلقه های زیادی نیاز دارم
63
00:03:07,940 –> 00:03:10,910
که گاهی اوقات
64
00:03:10,910 –> 00:03:12,740
زمانی که آنها در حال ساختن طرح ها و نقشه ها هستند کمی ناخوشایند است.
65
00:03:12,740 –> 00:03:15,080
علاوه بر این، یادگیری آن سخت است،
66
00:03:15,080 –> 00:03:16,940
مخصوصاً برای زمانی
67
00:03:16,940 –> 00:03:19,730
که فردی را انتخاب می کنید که از ما می آید یا
68
00:03:19,730 –> 00:03:21,890
کسی که از چیزی مانند
69
00:03:21,890 –> 00:03:24,050
اکسل می آید و سعی می کنید پایتون علمی
70
00:03:24,050 –> 00:03:26,480
71
00:03:26,480 –> 00:03:29,450
را یاد بگیرید، یادگیری matplotlib برای آنها بسیار دشوار و خسته کننده است
72
00:03:29,450 –> 00:03:32,000
و در نتیجه بسیاری از آنها فقط
73
00:03:32,000 –> 00:03:36,260
به ما برمی گردند، بنابراین ما
74
00:03:36,260 –> 00:03:37,910
قسمت هایی در مورد matplotlib داریم که من دیوانه آنها نیستم،
75
00:03:37,910 –> 00:03:40,220
اما چیزهای زیادی وجود دارد
76
00:03:40,220 –> 00:03:42,290
که Matt plot lib واقعاً به
77
00:03:42,290 –> 00:03:44,660
خوبی انجام می دهد، بنابراین مدتی است
78
00:03:44,660 –> 00:03:46,610
که در دسترس بوده است. ely mature برخی از
79
00:03:46,610 –> 00:03:49,130
خطاهای پروژه واقعا عالی وجود دارد و
80
00:03:49,130 –> 00:03:51,050
آنها فقط از نظر
81
00:03:51,050 –> 00:03:54,290
تست و پایداری کار
82
00:03:54,290 –> 00:03:55,910
بسیار خوبی انجام می دهند. ادغام بسیار خوبی با نوت بوک ipython دارد،
83
00:03:55,910 –> 00:04:00,080
فکر می کنم همه برخی
84
00:04:00,080 –> 00:04:02,000
از این ارائه های عالی را دیده اند که در آن
85
00:04:02,000 –> 00:04:03,230
همه از نوت بوک استفاده می کنند و
86
00:04:03,230 –> 00:04:04,970
همه دارند. شما میدانید فهرستهای نمودار را ملاقات کردهاید
87
00:04:04,970 –> 00:04:09,400
و بوکا و همه این کتابخانههای ترسیمی دیگر وجود دارد،
88
00:04:09,400 –> 00:04:12,650
89
00:04:12,650 –> 00:04:15,500
علاوه بر این،
90
00:04:15,500 –> 00:04:17,959
نمودارهای بسیار قابل تنظیمی دارید که میتوانید
91
00:04:17,959 –> 00:04:20,510
مانند برچسبها یا حاشیهنویسیهای خاص یا
92
00:04:20,510 –> 00:04:23,570
چیزهایی را که روی گرافیکهای خود دارید قرار دهید و تمام
93
00:04:23,570 –> 00:04:26,540
کارهایی که میتوانید از طریق آن انجام دهید. API بنابراین
94
00:04:26,540 –> 00:04:27,800
ما خوبی ها را داریم و بدی ها را
95
00:04:27,800 –> 00:04:30,530
پیدا می کنیم راهی برای برداشتن آن
96
00:04:30,530 –> 00:04:33,800
چیزهای خوب و استفاده واقعی از آنها و
97
00:04:33,800 –> 00:04:35,960
بنابراین فقط برای ارائه یک مثال بسیار سریع
98
00:04:35,960 –> 00:04:41,810
از نوعی ملاقات با
99
00:04:41,810 –> 00:04:44,240
قسمت های بد matplotlib با بخش های عالی
100
00:04:44,240 –> 00:04:47,479
G طرح می کند، بنابراین گرگ ریتا، او یک تحلیلگر
101
00:04:47,479 –> 00:04:50,060
در grubhub است، او یک مرد واقعاً باحال است
102
00:04:50,060 –> 00:04:52,159
که چند بار با او صحبت می کند، اما در وبلاگش
103
00:04:52,159 –> 00:04:55,240
escuela او می گوید سریع در همه چیز و
104
00:04:55,240 –> 00:04:58,729
چهره به شما این امکان را می دهد که
105
00:04:58,729 –> 00:05:01,400
متغیرها یا اجزای مختلف یک
106
00:05:01,400 –> 00:05:05,990
مجموعه داده را تجزیه کنید و واقعاً آنها
107
00:05:05,990 –> 00:05:08,479
را به انواع نمودارهای جداگانه
108
00:05:08,479 –> 00:05:10,900
در اینجا تقسیم کنید و واقعاً درک خوبی از
109
00:05:10,900 –> 00:05:13,729
ظاهر مجموعه داده های خود بدون
110
00:05:13,729 –> 00:05:17,810
نیاز به بررسی واقعی پیدا
111
00:05:17,810 –> 00:05:19,879
کنید این مانند 30 نمودار جداگانه است
112
00:05:19,879 –> 00:05:22,580
و بنابراین روش بسیار خوبی است، یک
113
00:05:22,580 –> 00:05:24,319
تکنیک عالی برای تجزیه و تحلیل داده ها است که این کار را
114
00:05:24,319 –> 00:05:26,180
کمی بعد در قسمت آموزشی
115
00:05:26,180 –> 00:05:29,629
انجام می دهد، اما انجام این کار در ggplot دو
116
00:05:29,629 –> 00:05:32,629
خط کد است، واقعاً آسان است در حالی که انجام
117
00:05:32,629 –> 00:05:34,370
این کار در matplotlib درست متوجه شدی
118
00:05:34,370 –> 00:05:36,560
یکسری حلقهها مانند اضافه کردن
119
00:05:36,560 –> 00:05:39,560
برچسبها با حذف برچسبها، اتفاقات زیادی
120
00:05:39,560 –> 00:05:45,860
در حال انجام است اوه، بنابراین شما man Paul lib را دارید
121
00:05:45,860 –> 00:05:49,520
و همچنین d3 و d3 عالی است،
122
00:05:49,520 –> 00:05:50,990
مطمئنم همه شما درباره آن شنیدهاید و دیدهاید.
123
00:05:50,990 –> 00:05:53,509
این تجسمهای باکیفیت عالی تولید میکند
124
00:05:53,509 –> 00:05:55,370
که در بسیاری از مواقع
125
00:05:55,370 –> 00:05:57,440
تعاملی هستند و این همان
126
00:05:57,440 –> 00:05:59,240
چیزهایی است که در روزهای نیویورک میبینید
127
00:05:59,240 –> 00:06:01,490
که مادرم با من تماس میگیرد و
128
00:06:01,490 –> 00:06:03,349
اینطور است که چگونه آن نمودار را میبینید.
129
00:06:03,349 –> 00:06:06,289
امید به زندگی y و تگزاس یا
130
00:06:06,289 –> 00:06:11,240
هر چیز دیگری و ما به مردم ggplot jeje فکر می کنیم،
131
00:06:11,240 –> 00:06:12,440
این به نوعی در
132
00:06:12,440 –> 00:06:14,419
انتهای طیف قرار دارد، در حالی که شما در d3
133
00:06:14,419 –> 00:06:15,740
احساس می کنید که در آن قرار
134
00:06:15,740 –> 00:06:18,620
است یک هفته تمام روی ساخت این
135
00:06:18,620 –> 00:06:21,319
تجسم واقعا قاتل کار کنید.
136
00:06:21,319 –> 00:06:22,490
قرار است برای همه دوستان خود بفرستید قرار است
137
00:06:22,490 –> 00:06:23,930
به صورت اتمی در معرض خطر
138
00:06:23,930 –> 00:06:25,250
قرار بگیرد اخبار هکرها همه
139
00:06:25,250 –> 00:06:28,069
در مورد آن
140
00:06:28,069 –> 00:06:30,169
141
00:06:30,169 –> 00:06:31,699
صحبت خواهند کرد.
142
00:06:31,699 –> 00:06:33,979
همه آنها را کنار بگذارید و شاید یکی از آنها وجود داشته
143
00:06:33,979 –> 00:06:36,560
باشد که شما آن را انتخاب کنید و آن را
144
00:06:36,560 –> 00:06:38,960
در یک ایمیل ارسال کنید و آن را برای
145
00:06:38,960 –> 00:06:41,360
تیم بازاریابی و مدیر
146
00:06:41,360 –> 00:06:43,339
بازاریابی بفرستید، بنابراین روند جالبی به نظر می رسد
147
00:06:43,339 –> 00:06:45,710
اما آن را
148
00:06:45,710 –> 00:06:47,960
مانند ggplot در نظر بگیرید.
149
00:06:47,960 –> 00:06:51,500
یکبار مصرف بسیار سریع استفاده می شود، اما
150
00:06:51,500 –> 00:06:54,380
هنوز هم بسیار ارزشمند است d3 بیشتر شبیه
151
00:06:54,380 –> 00:06:55,910
نقاشی ساختمان شما است که
152
00:06:55,910 –> 00:07:00,440
واقعاً می خواهید آن را به خوبی نشان دهید،
153
00:07:00,440 –> 00:07:02,900
بنابراین امیدوارم با استفاده از ggplot فروخته شده
154
00:07:02,900 –> 00:07:05,830
باشید، کمی در مورد نحوه عملکرد آن به شما بگویم.
155
00:07:05,830 –> 00:07:09,770
یو شما به این فکر کنید که من
156
00:07:09,770 –> 00:07:10,789
به شما می گویم همه این ویژگی های عالی
157
00:07:10,789 –> 00:07:12,710
را که قرار است در یک ggplot به دست آوریم، بنابراین باید نوعی مبادله وجود
158
00:07:12,710 –> 00:07:15,020
داشته باشد و در
159
00:07:15,020 –> 00:07:17,330
این مورد مبادله
160
00:07:17,330 –> 00:07:20,810
فرمت داده شما است، شما واقعاً باید از پانداس استفاده کنید. اگر
161
00:07:20,810 –> 00:07:23,870
میخواهید از تمام ویژگیهای
162
00:07:23,870 –> 00:07:25,610
ggplot استفاده کنید که فکر میکنم برای اکثر افراد در
163
00:07:25,610 –> 00:07:29,240
این اتاق خوب است صبر کنید، میدانید که
164
00:07:29,240 –> 00:07:32,060
همه از پانداس به عنوان یک API عالی استفاده میکنند که
165
00:07:32,060 –> 00:07:33,940
باعث میشود آنها واقعاً به راحتی دادههای شما را مدیریت کنند،
166
00:07:33,940 –> 00:07:37,039
بنابراین باید از پانداس استفاده کنید راههایی وجود دارد.
167
00:07:37,039 –> 00:07:40,099
که میتوانید از آرایهها و لیستهای بیحساب استفاده کنید،
168
00:07:40,099 –> 00:07:42,020
اما صادقانه بگویم، من حتی حوصله نمیکنم که
169
00:07:42,020 –> 00:07:45,590
آن را به آلت تناسلی بچسبانم و به نظر
170
00:07:45,590 –> 00:07:48,770
میرسد این است که شما یک ggplot اولیه شیء بسیار ساده ایجاد میکنید،
171
00:07:48,770 –> 00:07:53,060
در اینجا قاب داده خود را
172
00:07:53,060 –> 00:07:55,430
در این مورد قرار دهید، من فقط از یک
173
00:07:55,430 –> 00:07:58,430
یک ساخته شده در اینجا و سپس شما
174
00:07:58,430 –> 00:08:01,789
آن را با زیباییشناسی همراه میکنید و ما پیشنمایش میکنیم، اما
175
00:08:01,789 –> 00:08:06,020
به اختصار میگوییم که در aes و بنابراین
176
00:08:06,020 –> 00:08:11,240
زیباییشناسی چگونه است که طرح شما چگونه به نظر میرسد و راهی را توصیف میکند
177
00:08:11,240 –> 00:08:15,169
که اساساً
178
00:08:15,169 –> 00:08:18,469
دستورالعملهای ggplot را برای نحوه ساخت و ایجاد
179
00:08:18,469 –> 00:08:21,139
طرح خود که میدانید تعریف کنید، توضیح میدهد. محور x
180
00:08:21,139 –> 00:08:23,509
به محور y را پیدا کنید،
181
00:08:23,509 –> 00:08:27,759
به عنوان مثال، مجموعه داده ای داریم که
182
00:08:27,759 –> 00:08:31,729
ما را به تولید در طول زمان می رساند، اما می توانید
183
00:08:31,729 –> 00:08:33,979
ببینید که محور x تاریخ است و
184
00:08:33,979 –> 00:08:36,409
به آنجا می رود و سپس
185
00:08:36,409 –> 00:08:40,570
Y ما است. B برای تولید گوشت گاو و
186
00:08:40,570 –> 00:08:43,309
همه چیزهایی که توسط ggplot استخراج می شود
187
00:08:43,309 –> 00:08:45,740
و این
188
00:08:45,740 –> 00:08:47,540
مگس عالی به نظر می رسد و بنابراین چیزهای دیگری وجود دارد
189
00:08:47,540 –> 00:08:50,060
که می توانید یا زیبایی های دیگری که
190
00:08:50,060 –> 00:08:52,510
می توانید از آنها نیز استفاده کنید می توانید
191
00:08:52,510 –> 00:08:57,040
اندازه شکل رنگ داشته باشید. واقعاً موارد زیادی وجود دارد.
192
00:08:57,040 –> 00:09:00,110
آنها بین انواع مختلف طرحها به اشتراک گذاشته میشوند که
193
00:09:00,110 –> 00:09:01,610
194
00:09:01,610 –> 00:09:05,000
دیگران سفارشیتر هستند و ما میتوانیم
195
00:09:05,000 –> 00:09:07,070
کمی بیشتر در نوتبوک به آن بپردازیم،
196
00:09:07,070 –> 00:09:12,410
بنابراین G آمار و مقیاسهای خود را دارد،
197
00:09:12,410 –> 00:09:16,640
اینها بلوکهای سازنده
198
00:09:16,640 –> 00:09:19,579
طرحها یا تجسمهای شما هستند و
199
00:09:19,579 –> 00:09:22,070
منظور من از آن است. یعنی شما چیزی
200
00:09:22,070 –> 00:09:25,550
شبیه یک ggplot پراکنده می گیرید که
201
00:09:25,550 –> 00:09:27,350
به عنوان چیزی به نام نقطه ژنوم نشان داده
202
00:09:27,350 –> 00:09:30,740
می شود و بنابراین وقتی یک نقطه پرش
203
00:09:30,740 –> 00:09:33,019
به ggplot خود اضافه می کنید،
204
00:09:33,019 –> 00:09:35,300
چیزی شبیه به این می گیرید و دوباره
205
00:09:35,300 –> 00:09:36,680
چیزهای زیادی وجود دارد. انواع
206
00:09:36,680 –> 00:09:39,470
ژنومها من در حال حاضر قصد ورود به
207
00:09:39,470 –> 00:09:41,779
مرکز خرید را ندارم، اما فقط میدانم که
208
00:09:41,779 –> 00:09:45,970
دوباره چیزهای مشابه زیادی وجود دارد،
209
00:09:45,970 –> 00:09:50,480
اما به جای
210
00:09:50,480 –> 00:09:53,000
هیستوگرام نمودار نواری معمولی شما،
211
00:09:53,000 –> 00:09:56,660
مفهوم دیگری به نام آمار
212
00:09:56,660 –> 00:09:58,190
آماری وجود دارد که آمار سادهای است. معمولاً
213
00:09:58,190 –> 00:10:01,459
روی مجموعه دادههای شما انجام میشود رایجترین موردی که من
214
00:10:01,459 –> 00:10:03,320
از آن استفاده میکنم، فقط stat smooth است که در آن شما
215
00:10:03,320 –> 00:10:06,170
یک خط روند را روی دادههای خود اعمال میکنید و
216
00:10:06,170 –> 00:10:08,000
چند مورد دیگر وجود دارد که به کار میآیند، در واقع میتوانید
217
00:10:08,000 –> 00:10:10,339
یک سفارشی خود را فقط
218
00:10:10,339 –> 00:10:14,630
با استفاده از تابع stat تعریف کنید و سپس در آخر ما
219
00:10:14,630 –> 00:10:17,240
دادههای شما را مقیاسبندی کردهایم، بنابراین میدانید که
220
00:10:17,240 –> 00:10:19,640
ایجاد این نمودارها فقط کافی نیست،
221
00:10:19,640 –> 00:10:22,070
بلکه میخواهید
222
00:10:22,070 –> 00:10:24,760
ظاهر و احساس را سفارشی کنید، رنگهای مختلف را اضافه کنید
223
00:10:24,760 –> 00:10:27,230
، شاید یک مقیاس گزارش بخواهید،
224
00:10:27,230 –> 00:10:30,440
شاید یک برچسب
225
00:10:30,440 –> 00:10:32,890
دیگر یا رنگ دیگری میخواهید. نقشه برداری برای
226
00:10:32,890 –> 00:10:37,220
مقیاس های داده به شما امکان می دهد این کار را به درستی انجام دهید، بنابراین
227
00:10:37,220 –> 00:10:39,529
ما نقشه های GG را داریم،
228
00:10:39,529 –> 00:10:42,880
زیبایی شناسی را داریم، ژنوم ها و آمارها را داریم
229
00:10:42,880 –> 00:10:46,640
آخرین مفهومی که کلیدی است و واقعا
230
00:10:46,640 –> 00:10:48,980
همه چیز را با هم جمع می کند. لایههای ur
231
00:10:48,980 –> 00:10:53,029
و بنابراین لایهها چیست،
232
00:10:53,029 –> 00:10:57,709
میتوانید وقتی برای اولین بار آن شی ggplot را ایجاد میکنید به یک
233
00:10:57,709 –> 00:11:00,769
فکر
234
00:11:00,769 –> 00:11:05,360
235
00:11:05,360 –> 00:11:07,640
236
00:11:07,640 –> 00:11:09,980
کنید. لایه پایه و تنها چیزی که هست این
237
00:11:09,980 –> 00:11:13,040
است که شما فقط یک شبکه مختصات را تعریف
238
00:11:13,040 –> 00:11:15,200
می کنید، چیزی شبیه به این است
239
00:11:15,200 –> 00:11:18,110
و از آنجا شروع می کنید و به تدریج
240
00:11:18,110 –> 00:11:20,810
ویژگی های اضافی یا
241
00:11:20,810 –> 00:11:23,540
عملکردهای اضافی را به تجسم های خود اضافه می کنید،
242
00:11:23,540 –> 00:11:26,030
بنابراین ممکن است بخواهید نکاتی را به آن اضافه کنید
243
00:11:26,030 –> 00:11:27,320
و سپس شما ممکن است بخواهید آن را انتخاب
244
00:11:27,320 –> 00:11:31,160
کنید و یک خط روند اضافه کنید و بخش بزرگی
245
00:11:31,160 –> 00:11:34,010
در مورد ggplot یا حداقل چیزی که من
246
00:11:34,010 –> 00:11:36,110
واقعاً در مورد آن دوست دارم این است که
247
00:11:36,110 –> 00:11:39,530
واقعاً در نحو بیان می شود، بنابراین
248
00:11:39,530 –> 00:11:41,480
نحو شما به معنای واقعی کلمه
249
00:11:41,480 –> 00:11:44,390
این مؤلفه ها را با هم اضافه می کنید
250
00:11:44,390 –> 00:11:47,570
که دقیقاً همین است. چگونه در کد شما پخش می شود
251
00:11:47,570 –> 00:11:50,240
و بنابراین وقتی همه اینها را
252
00:11:50,240 –> 00:11:52,340
با هم جمع می کنید، می خواهید نمودار
253
00:11:52,340 –> 00:11:57,440
آن نقاطی داشته باشد، منحنی صافی
254
00:11:57,440 –> 00:11:59,660
روی آن نقاط پوشانده شده است و می توانید از
255
00:11:59,660 –> 00:12:04,120
آنجا به دست بیاورید، بنابراین چرا می دانید چرا این همه
256
00:12:04,120 –> 00:12:12,110
خوب است شما می دانید یکی از چیزهایی
257
00:12:12,110 –> 00:12:14,420
که من واقعاً از چیزی که از ggplot استفاده می کنم دوست دارم این
258
00:12:14,420 –> 00:12:16,490
است که
259
00:12:16,490 –> 00:12:21,020
فرضیات معقولی برای شما ایجاد می کند بنابراین مواردی مانند
260
00:12:21,020 –> 00:12:24,050
این فیلد را داریم، این دو
261
00:12:24,050 –> 00:12:26,170
متغیر طبقه بندی شده است پروژه های آلفا
262
00:12:26,170 –> 00:12:28,820
پروژه های آلفا شما این را در
263
00:12:28,820 –> 00:12:31,130
matplotlib و رنگ اختصاص داده شده است. به این
264
00:12:31,130 –> 00:12:34,580
فیلد باز می شود و این ردپای ناخوشایند پشته را به شما می دهد
265
00:12:34,580 –> 00:12:37,910
و واقعاً شما واقعاً تنها چیزی
266
00:12:37,910 –> 00:12:41,570
که می خواهید این است که فقط دو
267
00:12:41,570 –> 00:12:44,240
رنگ مختلف داشته باشید و شروع به ggplot یک
268
00:12:44,240 –> 00:12:48,200
چیزهایی کنید که این طرح را تعریف می کند
269
00:12:48,200 –> 00:12:52,250
و در آن فیلد رنگ ها اضافه می شود.
270
00:12:52,250 –> 00:12:54,710
نوعی بن میداند که مشخص میکند
271
00:12:54,710 –> 00:12:57,550
متغیر طبقهبندی است، به
272
00:12:57,550 –> 00:13:01,250
صراحت رنگی مانند قرمز یا آبی نیست،
273
00:13:01,250 –> 00:13:03,500
اما احتمالاً معنایش این است
274
00:13:03,500 –> 00:13:05,300
که ما دو رنگ مختلف
275
00:13:05,300 –> 00:13:10,880
برای هر دسته میخواهیم، یکی دیگر از چی
276
00:13:10,880 –> 00:13:13,220
های عالی در مورد ggplot این است که می
277
00:13:13,220 –> 00:13:16,360
توانید بسیاری از ویژگی ها را دریافت کنید و
278
00:13:16,360 –> 00:13:18,590
در مورد آنچه که قرار است
279
00:13:18,590 –> 00:13:20,090
در طرح شما اتفاق بیفتد، بدون نیاز به نوشتن
280
00:13:20,090 –> 00:13:24,220
کدهای زیادی بسیار خاص باشید، به عنوان مثال در این
281
00:13:24,220 –> 00:13:27,889
قطعه کوچک در اینجا ما در حال تعریف هستیم
282
00:13:27,889 –> 00:13:30,799
پارامتر X y ما در واقع یک
283
00:13:30,799 –> 00:13:33,319
فرمول در فیلد رنگ ایجاد می
284
00:13:33,319 –> 00:13:37,790
کنیم تا استوانه یا فیلد استوانه ای را
285
00:13:37,790 –> 00:13:40,249
از یک نوع عددی به یک نوع طبقه بندی
286
00:13:40,249 –> 00:13:43,009
کنیم و یک
287
00:13:43,009 –> 00:13:47,689
نمودار پراکندگی به آن اضافه کنیم و به نظر برسد. به این صورت، اگر
288
00:13:47,689 –> 00:13:48,769
میخواهیم همین کار را در
289
00:13:48,769 –> 00:13:50,899
matplotlib انجام دهیم، حلقههای زیادی
290
00:13:50,899 –> 00:13:53,329
در جریان است، باید
291
00:13:53,329 –> 00:13:57,679
عنوان برچسبها را به صورت دستی تعریف کنید،
292
00:13:57,679 –> 00:13:59,779
باید چند بار دستور scatter را فراخوانی کنید.
293
00:13:59,779 –> 00:14:02,299
به طور کلی،
294
00:14:02,299 –> 00:14:04,519
295
00:14:04,519 –> 00:14:06,350
برای ایجاد آنچه به نظر من یک
296
00:14:06,350 –> 00:14:11,149
گرافیک بسیار ساده است، به کدهای بسیار بیشتری نیاز دارید و آخرین مورد این
297
00:14:11,149 –> 00:14:13,189
است که فکر می کنم بسیار خوب به نظر می رسد، بنابراین
298
00:14:13,189 –> 00:14:15,619
منظورم این است که مانند هادلی
299
00:14:15,619 –> 00:14:17,989
ویکهام تمام این سبک ها را به من اعتبار ندهید. من فقط به نوعی آن را
300
00:14:17,989 –> 00:14:20,959
کپی کردم اما فکر می کنم آنها
301
00:14:20,959 –> 00:14:22,459
بسیار زیبا به نظر می رسند، آنها به اندازه کافی خوب هستند که می
302
00:14:22,459 –> 00:14:24,889
توانید آنها را در نشریات قرار دهید و اگر
303
00:14:24,889 –> 00:14:26,689
304
00:14:26,689 –> 00:14:28,480
آن را برای سایر اعضای تیم خود ارسال کنید خجالت نمی
305
00:14:28,480 –> 00:14:32,149
کشید و همچنین بسیار آسان برای سفارشی کردن،
306
00:14:32,149 –> 00:14:35,269
به عنوان مثال من واقعا دوست دارم w بله،
307
00:14:35,269 –> 00:14:38,299
طرحهای Seaborn کار میکنند، فکر میکنم
308
00:14:38,299 –> 00:14:40,790
بعداً صحبتی در مورد آن وجود دارد یا قبلاً
309
00:14:40,790 –> 00:14:43,459
اتفاق افتاده است، مطمئن نیستم، اما این یک
310
00:14:43,459 –> 00:14:46,509
کتابخانه عالی است، باید آن را بررسی کنید و به
311
00:14:46,509 –> 00:14:48,829
هر حال من دیدم و واقعاً
312
00:14:48,829 –> 00:14:51,679
میخواستم بتوانم این کار را از داخل ggplot انجام دهم. بنابراین
313
00:14:51,679 –> 00:14:53,779
حدود 30 دقیقه طول کشید من یک
314
00:14:53,779 –> 00:14:55,129
دسته از کدهای پروژه Seaborn را
315
00:14:55,129 –> 00:14:58,669
کپی کردم فقط به نوعی آن را در
316
00:14:58,669 –> 00:15:01,459
یک فایل قرار دادم و ناگهان می
317
00:15:01,459 –> 00:15:06,499
توانم طرح های Seaborn را از طرح jeanie درست کنم،
318
00:15:06,499 –> 00:15:09,819
بنابراین از آنجایی که این از نظر فنی یک آموزشی است
319
00:15:09,819 –> 00:15:13,399
که می خواهم برای راهاندازی در
320
00:15:13,399 –> 00:15:16,839
نوتبوک ipython برای مدت کوتاهی در اینجا
321
00:15:21,650 –> 00:15:25,110
بسیار خوب است، بنابراین اگر میخواهید آن را دنبال کنید، خیالتان
322
00:15:25,110 –> 00:15:29,070
راحت یک مخزن github وجود دارد، بنابراین آموزش
323
00:15:29,070 –> 00:15:32,790
شخصی من github G لامپ / ggplot
324
00:15:32,790 –> 00:15:37,610
و همچنین میتوانید امروز یک وبلاگ
325
00:15:37,610 –> 00:15:42,240
آن را در کلاه Y ما منتشر کنید. وبلاگی
326
00:15:42,240 –> 00:15:45,390
که به پیوندهای شما برای همه این نوت بوک ها حسادت می کند
327
00:15:45,390 –> 00:15:49,050
و همچنین پیوندی به
328
00:15:49,050 –> 00:15:59,460
مخزن github بسیار خوب است، بنابراین از آنجایی که
329
00:15:59,460 –> 00:16:02,850
این بحث در مورد پانداس نیست، من قصد ندارم
330
00:16:02,850 –> 00:16:06,450
به تمیز کردن و قالب بندی تمام
331
00:16:06,450 –> 00:16:08,580
داده هایی که داریم بپردازم. قرار است استفاده کنیم فقط بدانید
332
00:16:08,580 –> 00:16:12,120
که ما «از مجموعه دادهای استفاده میکنم که
333
00:16:12,120 –> 00:16:13,770
از لیگ اصلی بیسبال میآید، به نام
334
00:16:13,770 –> 00:16:18,000
pitch f/x، واقعاً عالی است، همه چیز
335
00:16:18,000 –> 00:16:21,480
عالی است، من واقعاً بیسبال را دوست دارم، اما
336
00:16:21,480 –> 00:16:24,600
فکر میکنم اکثر افرادی که آن را به آنها نشان میدهم،
337
00:16:24,600 –> 00:16:25,950
حتی کسانی که ورزش را دوست ندارند، فکر میکنند که
338
00:16:25,950 –> 00:16:30,240
جالب است. همه اینها عمومی است و خیلی منظم به روز
339
00:16:30,240 –> 00:16:33,780
می شود، مطمئن
340
00:16:33,780 –> 00:16:36,000
نیستم در زمان واقعی یا نزدیک به زمان واقعی باشد،
341
00:16:36,000 –> 00:16:38,550
اما به نوعی خنده دار است که فقط می توانید
342
00:16:38,550 –> 00:16:41,610
به mlb.com بروید و اگر
343
00:16:41,610 –> 00:16:46,170
ساختار پیوند را در اینجا پیدا کنید اساساً این است. فقط
344
00:16:46,170 –> 00:16:50,070
یک آپاچی بزرگ یا چیزی یا دسته دیگری
345
00:16:50,070 –> 00:16:52,620
از فایلهای xml و حاوی
346
00:16:52,620 –> 00:16:58,380
اطلاعاتی در مورد زمین
347
00:16:58,380 –> 00:17:03,060
بازیهای لیگ برتر بیسبال هستند و
348
00:17:03,060 –> 00:17:05,069
از این طریق نمیگذرد، به قسمتی میرود
349
00:17:05,069 –> 00:17:07,730
که همه آنها را با فرمت خوب تمیز کردیم،
350
00:17:07,730 –> 00:17:10,140
اما آن را بررسی کنید. چند
351
00:17:10,140 –> 00:17:12,510
بسته ما واقعاً خوب است و همچنین یک
352
00:17:12,510 –> 00:17:15,230
کلاینت یاقوت برای استخراج داده ها وجود دارد
353
00:17:15,230 –> 00:17:19,400
و کار می کنند بسیار خوب کار می کنند.
354
00:17:23,160 –> 00:17:27,089
355
00:17:27,089 –> 00:17:35,520
356
00:17:35,520 –> 00:17:38,390
357
00:17:38,390 –> 00:17:41,220
فقط واردات e خیلی چیزها برای در
358
00:17:41,220 –> 00:17:44,220
فضای نام جهانی، من برخی از افراد را دیده ام که
359
00:17:44,220 –> 00:17:45,660
از آن استفاده می کنند، جایی که می خواهند
360
00:17:45,660 –> 00:17:51,150
نمودار GG را به عنوان GG وارد کنند، اما ما هنوز
361
00:17:51,150 –> 00:17:53,730
به وضعیت داده PI نرسیده ایم، جایی که
362
00:17:53,730 –> 00:17:55,680
شما مانند قراردادی دارید که
363
00:17:55,680 –> 00:17:58,980
به نظر می رسد همه از آن پیروی می کنند، بنابراین در حال حاضر من به وضعیت داده PI نرسیده ایم. توصیه می
364
00:17:58,980 –> 00:18:01,370
کنم فقط از ggplot import همه
365
00:18:01,370 –> 00:18:04,350
چیز را انجام دهید، چند مجموعه داده که همراه
366
00:18:04,350 –> 00:18:10,140
با بسته ارسال می شود، یکی از موارد مورد علاقه شخصی من است،
367
00:18:10,140 –> 00:18:13,650
بنابراین مجموعه داده را ملاقات کنید و فقط
368
00:18:13,650 –> 00:18:15,210
تولید گوشت در ایالات متحده
369
00:18:15,210 –> 00:18:18,930
در حدود نیم قرن گذشته است و
370
00:18:18,930 –> 00:18:20,940
برای سری های زمانی عالی است. واقعاً
371
00:18:20,940 –> 00:18:23,550
ساده است تقریباً هر کسی آن را
372
00:18:23,550 –> 00:18:26,270
ببیند و بفهمد که چه اتفاقی میافتد
373
00:18:26,270 –> 00:18:29,400
و سپس تعدادی نیز وجود دارند که
374
00:18:29,400 –> 00:18:31,650
با نسخه ggplot ما ارسال میشوند و همچنین
375
00:18:31,650 –> 00:18:35,370
یکی از آنها فقط یک مجموعه داده غالب است دوباره
376
00:18:35,370 –> 00:18:38,910
بسیار ساده برخی از ویژگیهای اساسی اولیه
377
00:18:38,910 –> 00:18:41,640
در مورد برخی از الماسها و عالی است
378
00:18:41,640 –> 00:18:43,470
زیرا ترکیب خوبی از
379
00:18:43,470 –> 00:18:45,900
ویژگیهای دستهبندی و عددی دارد و آن را برای
380
00:18:45,900 –> 00:18:50,640
انجام دموهای ساخت اسلاید دکها خوب میکند و
381
00:18:50,640 –> 00:18:52,560
سپس چند نفر دیگر که میشناسید با خیال راحت
382
00:18:52,560 –> 00:18:59,220
آنها را بررسی کنید، بنابراین GG را دریافت کردید.
383
00:18:59,220 –> 00:19:02,760
در اینجا روشی را خریدم که معمولاً
384
00:19:02,760 –> 00:19:04,560
با آن تعامل خواهید داشت، این است که از طریق
385
00:19:04,560 –> 00:19:09,480
این کلاس ggplot، این کلاس از نظر فنی یک
386
00:19:09,480 –> 00:19:12,060
کلاس است، اگرچه شما با آن تعامل
387
00:19:12,060 –> 00:19:15,780
بیشتری خواهید داشت مانند یک تابع پایتون که
388
00:19:15,780 –> 00:19:21,090
معمولاً
389
00:19:21,090 –> 00:19:26,520
روشهای نقطهای را از ggplot انجام نمیدهند. و نیاز به دو
390
00:19:26,520 –> 00:19:29,610
استدلال دارد، یکی مثل این است که ما ذکر کردیم که یک
391
00:19:29,610 –> 00:19:32,700
قاب داده بزرگتر برخی از زیباییشناسی است که
392
00:19:32,700 –> 00:19:36,190
میتوانید آنها را در هر یک از موقعیتها قرار دهید،
393
00:19:36,190 –> 00:19:41,730
من معمولاً این کار را انجام میدهم، اگرچه این فقط
394
00:19:41,730 –> 00:19:50,950
ترجیح شخصی من است و به نوعی مانند
395
00:19:50,950 –> 00:19:52,870
آنچه قبلاً در مورد آن صحبت کردم، شما یک
396
00:19:52,870 –> 00:19:55,419
طرح gingy ایجاد میکنید و اگر شما باید سعی
397
00:19:55,419 –> 00:19:58,210
میکردید و ارائه کنید که همانطور که
398
00:19:58,210 –> 00:20:02,649
399
00:20:02,649 –> 00:20:12,179
هست با یک شبکه خالی بزرگ تمام میشوید، بنابراین
400
00:20:12,179 –> 00:20:14,200
زیباییشناسی در مورد آن کمی
401
00:20:14,200 –> 00:20:17,350
در زیباییشناسی ارائه صحبت کرده است به شما اجازه
402
00:20:17,350 –> 00:20:22,000
میدهد واقعاً تعریف کنید. و هماهنگ
403
00:20:22,000 –> 00:20:23,879
کنید که طرحهای شما چگونه به نظر میرسند،
404
00:20:23,879 –> 00:20:25,960
اساساً فقط یک فرهنگ لغت با
405
00:20:25,960 –> 00:20:29,230
چند ویژگی خاص است، لیستی
406
00:20:29,230 –> 00:20:32,379
از زیباییشناسی موجود برای هر دقیقه جغرافیایی در
407
00:20:32,379 –> 00:20:37,659
هر مرحله در اسناد وجود دارد، اما
408
00:20:37,659 –> 00:20:40,570
معمولی از آنجایی که شما x و y دارید، می توانید از
409
00:20:40,570 –> 00:20:43,480
کوتاه نویسی استفاده کنید و فرض کنید که
410
00:20:43,480 –> 00:20:45,009
اولین مرد دونده X است. آرگومان دوم به
411
00:20:45,009 –> 00:20:46,330
این دلیل است که من دو آرگومان
412
00:20:46,330 –> 00:20:50,289
رنگی را که در اینجا می بینید و همچنین
413
00:20:50,289 –> 00:20:52,690
از فرمول های پتسی پشتیبانی می کند، بنابراین نمی دانم
414
00:20:52,690 –> 00:20:54,820
چند است. از شما با پتسی آشنا
415
00:20:54,820 –> 00:20:58,090
هستید اما می توانید کارهایی مانند محاسبات پایه را
416
00:20:58,090 –> 00:21:01,600
انجام دهید و می توانید متغیرهای طبقه بندی را
417
00:21:01,600 –> 00:21:07,210
با استفاده از فاکتور کاملاً درست انتخاب کنید، بنابراین
418
00:21:07,210 –> 00:21:09,929
اجازه دهید در واقع شروع به انجام چند طرح
419
00:21:09,929 –> 00:21:19,419
کنیم که احتمالاً برای همیشه اینجا هستید،
420
00:21:19,419 –> 00:21:20,769
بنابراین ما نمودار پایه خود را در اینجا داریم.
421
00:21:20,769 –> 00:21:25,450
در واقع یک نمودار پراکندگی ایجاد میکنید، شما
422
00:21:25,450 –> 00:21:28,509
میخواهید به معنای واقعی کلمه شی پایه ggplot خود را بگیرید
423
00:21:28,509 –> 00:21:33,220
و یک نقشه جغرافیایی بیشتر اضافه کنید، یک
424
00:21:33,220 –> 00:21:37,570
نمودار پراکنده به آن اضافه کنید و من میتوانم
425
00:21:37,570 –> 00:21:42,230
چیزی شبیه به این را ببینم
426
00:21:42,230 –> 00:21:47,150
خیلی ساده است که میتوانید یکی را درست کنید، اجازه دهید کمی به
427
00:21:47,150 –> 00:21:50,200
عقب برگردیم. در اینجا پیچیده تر
428
00:21:50,200 –> 00:21:59,750
می شویم، بله، خب، بنابراین اکنون
429
00:21:59,750 –> 00:22:01,130
می خواهیم وارد مجموعه داده های بیسبال
430
00:22:01,130 –> 00:22:04,400
شویم که ذکر کردم،
431
00:22:04,400 –> 00:22:08,030
اطلاعات بسیار جالبی در اینجا وجود دارد، بنابراین من
432
00:22:08,030 –> 00:22:10,250
آن را به چند ستون محدود می کنم،
433
00:22:10,250 –> 00:22:12,440
مانند 50 ستون و این نوعی
434
00:22:12,440 –> 00:22:14,419
در اگر نمیدانید چه کاری انجام میدهید، اضافه بار تشکیل میشود،
435
00:22:14,419 –> 00:22:17,210
اما آیا
436
00:22:17,210 –> 00:22:19,309
چیزهای جالبی مانند اطلاعات اولیه
437
00:22:19,309 –> 00:22:22,429
در مورد بازی ضربه زننده بازی میدانید
438
00:22:22,429 –> 00:22:26,660
، این دو مختصات px + pz
439
00:22:26,660 –> 00:22:29,780
مشخص میکنند که زمین در واقع
440
00:22:29,780 –> 00:22:32,870
در منطقه ضربه قرار گرفته است و سپس آنها نیز
441
00:22:32,870 –> 00:22:34,370
دارند. من حدس میزنم که من فقط مانند
442
00:22:34,370 –> 00:22:38,600
ارتشی از افراد واردکننده دادهها را دارم که
443
00:22:38,600 –> 00:22:40,010
همه این زمینها را دستهبندی میکنند که با
444
00:22:40,010 –> 00:22:42,799
تفنگ رادار با چه سرعتی
445
00:22:42,799 –> 00:22:54,640
همه چیز خوب پیش میروند، مطمئنا خوب است، بنابراین
446
00:22:54,640 –> 00:22:57,799
در اینجا از موارد استفاده کنید، میخواهم
447
00:22:57,799 –> 00:22:59,570
این مجموعه داده را مرور کنم و من فقط قصد دارم به
448
00:22:59,570 –> 00:23:03,340
شما نشان دهم که چگونه از مجموعه داده های ggplot2 explore استفاده می کنم
449
00:23:03,340 –> 00:23:05,830
، چند سؤال را که
450
00:23:05,830 –> 00:23:09,880
می دانید ممکن است در نتیجه ایجاد شود را بررسی کنید و به
451
00:23:09,880 –> 00:23:12,380
شما نشان دهم که چگونه می توانید کمی عمیق تر کاوش کنید
452
00:23:12,380 –> 00:23:14,809
و از برخی از
453
00:23:14,809 –> 00:23:17,720
ویژگی های پیشرفته تر نمودارهای GG استفاده کنید. واقعاً
454
00:23:17,720 –> 00:23:20,210
اولین چیزی که میخواهم ببینم این است
455
00:23:20,210 –> 00:23:21,559
که دادههای منطقه ضربهای
456
00:23:21,559 –> 00:23:24,020
جالب به نظر میرسد، تعجب میکنم که میدانی
457
00:23:24,020 –> 00:23:26,600
در واقع چه شکلی است و بنابراین میتوانی
458
00:23:26,600 –> 00:23:30,400
ببینی که این لکه غولپیکر از دادهها را دریافت کردهای و
459
00:23:30,400 –> 00:23:33,110
این یکی از آن نمونههاست. جایی که
460
00:23:33,110 –> 00:23:34,880
میدانید فقط به این دلیل که مجموعه دادهای
461
00:23:34,880 –> 00:23:37,580
دارید که حدود 200000 مشاهدات دارد، این
462
00:23:37,580 –> 00:23:39,110
بدان معنا نیست که شما باید
463
00:23:39,110 –> 00:23:41,929
تک تک آنها را ترسیم کنید، اگر با
464
00:23:41,929 –> 00:23:45,140
این آشفتگی نقاط غولپیکر خاتمه پیدا کردید، خیلی
465
00:23:45,140 –> 00:23:49,910
مفید نیست، بنابراین کاری که میخواهیم انجام دهیم. برای انجام این کار این است که
466
00:23:49,910 –> 00:23:52,250
دوباره برخی از روابط را در
467
00:23:52,250 –> 00:23:55,789
زیر مجموعههای آن داده بررسی کنید
468
00:23:55,789 –> 00:23:58,190
و فقط با نگاه کردن به سرعت دادهها
469
00:23:58,190 –> 00:23:59,840
میتوانید ببینید که این به نوعی این موارد را به
470
00:23:59,840 –> 00:24:02,720
هم ریخته میکند، بنابراین چگونه
471
00:24:02,720 –> 00:24:05,859
میتوانید این مجموعه داده را دریافت کنید و در واقع چه راههایی وجود دارد.
472
00:24:05,859 –> 00:24:09,739
می دانید که از آن استفاده می کنید و
473
00:24:09,739 –> 00:24:12,649
اطلاعات مفیدی از آن دریافت می کنید، بنابراین یکی از این موارد این
474
00:24:12,649 –> 00:24:15,499
است که هیستوگرام ها همیشه تاریخچه را REMS می سازم
475
00:24:15,499 –> 00:24:18,710
، آنها بسیار
476
00:24:18,710 –> 00:24:20,509
مفید هستند، راه بسیار خوبی برای به دست آوردن یک دید سطح بالا
477
00:24:20,509 –> 00:24:22,039
از شما می دانید که با یک
478
00:24:22,039 –> 00:24:24,320
متغیر خاص برای این کار چه می گذرد. یکی
479
00:24:24,320 –> 00:24:25,669
میخواهم به سرعت زمین نگاه کنم که به
480
00:24:25,669 –> 00:24:28,190
آن شروع میشود p، زمانی است که
481
00:24:28,190 –> 00:24:30,109
مانند تفنگ رادار است که وقتی توپ را رها میکند،
482
00:24:30,109 –> 00:24:32,929
میخواند و بنابراین میتوانید ببینید
483
00:24:32,929 –> 00:24:34,820
که دادههای شما از
484
00:24:34,820 –> 00:24:37,940
حدود هفتاد تا صد توزیع شده است.
485
00:24:37,940 –> 00:24:41,409
مایل در ساعت شاید یک یا دو عدد بالای 100 ما باشد و
486
00:24:41,409 –> 00:24:44,570
اکثر آنها دقیقاً در همین حوالی هستند،
487
00:24:44,570 –> 00:24:47,450
چیزی بین 92 93 مایل در
488
00:24:47,450 –> 00:24:49,190
ساعت و بنابراین شما می دانید که
489
00:24:49,190 –> 00:24:54,019
برای من منطقی است و من بررسی کردم شما می دانید
490
00:24:54,019 –> 00:24:55,700
که به نوعی به دنبال تأیید این هستید که
491
00:24:55,700 –> 00:24:59,659
به نظر می رسد منبع همه حکمت یاهو
492
00:24:59,659 –> 00:25:02,419
پاسخ می دهد و می توانید ببینید که
493
00:25:02,419 –> 00:25:04,549
دیگران را با این کار موافق کرده اید و به
494
00:25:04,549 –> 00:25:08,419
نظر منطقی است، اما اگر بخواهیم آن را
495
00:25:08,419 –> 00:25:10,399
بشکنیم و بگوییم خوب است،
496
00:25:10,399 –> 00:25:13,399
پس چهار زمین مختلف که یک
497
00:25:13,399 –> 00:25:15,950
پارچ ممکن است چه چیزی را پرتاب کند چه می شود. توزیعهای سرعت
498
00:25:15,950 –> 00:25:22,309
شبیه به نظر میرسند و راه بدی
499
00:25:22,309 –> 00:25:25,580
برای انجام این کار این است که
500
00:25:25,580 –> 00:25:29,119
گروه پاندا را حلقه بزنید و نتیجه دلخواه را دریافت
501
00:25:29,119 –> 00:25:32,690
کنید و متوجه شوید که
502
00:25:32,690 –> 00:25:34,580
تمام این هیستوگرامها را برای هر یک از
503
00:25:34,580 –> 00:25:38,749
زمینهای خود دریافت میکنید، اما خواندن آن واقعاً سخت است.
504
00:25:38,749 –> 00:25:41,720
راه بسیار بهتر برای انجام این
505
00:25:41,720 –> 00:25:44,749
کار استفاده از چیزی به نام Facet Read است، بنابراین
506
00:25:44,749 –> 00:25:48,080
Facet Wrap واقعا مفید است و به
507
00:25:48,080 –> 00:25:51,019
شما امکان میدهد همان هیستوگرام را که
508
00:25:51,019 –> 00:25:54,919
استفاده میکردید و دو تابع قبل را تعریف کنید و
509
00:25:54,919 –> 00:25:56,869
میتوانید این یک خط را اضافه کنید.
510
00:25:56,869 –> 00:25:58,460
در این صورت، متغیر
511
00:25:58,460 –> 00:26:01,970
pitch name را نامگذاری میکند
512
00:26:01,970 –> 00:26:04,129
و
513
00:26:04,129 –> 00:26:08,400
هیستوگرام جداگانهای را برای هر یک از آنها تقسیم میکند
514
00:26:08,400 –> 00:26:11,130
و بنابراین میتوانید اینجا را ببینید، اوه، ما میرویم.
515
00:26:11,130 –> 00:26:13,080
516
00:26:13,080 –> 00:26:15,590
توزیع های مختلف
517
00:26:15,590 –> 00:26:18,150
و یک نوع جالب در
518
00:26:18,150 –> 00:26:21,930
اینجا وجود دارد به نحوی که زمین
519
00:26:21,930 –> 00:26:24,150
Efus در اینجا
520
00:26:24,150 –> 00:26:28,560
521
00:26:28,560 –> 00:26:30,750
ایجاد
522
00:26:30,750 –> 00:26:33,540
شد. خیلی سریعتر از
523
00:26:33,540 –> 00:26:35,880
تغییر توپ های منحنی، کمی
524
00:26:35,880 –> 00:26:41,250
کندتر حرکت می کنند و لغزنده ها و غیره، و من
525
00:26:41,250 –> 00:26:44,100
آن را در اینجا نشان نمی دهم، اما یک ویدیو وجود دارد که
526
00:26:44,100 –> 00:26:48,870
مطمئنم به نوعی خنده دار است، مانند
527
00:26:48,870 –> 00:26:51,840
Efus اصلی دهه 70، یک
528
00:26:51,840 –> 00:27:00,630
نوع خنده دار است. خجالت آور است که من
529
00:27:00,630 –> 00:27:03,180
بازیکنان بیسبال را دوست دارم قربان، من نتوانستم
530
00:27:03,180 –> 00:27:10,560
خودم را نگه دارم، پس چه چیز دیگری را فراموش کنم، بنابراین اگر
531
00:27:10,560 –> 00:27:11,730
می خواهید متغیرهای طبقه بندی شده را بررسی کنید
532
00:27:11,730 –> 00:27:14,040
، راهی برای ایجاد نمودارهای بیشتر وجود دارد که
533
00:27:14,040 –> 00:27:16,920
فقط نوار GM نامیده می شود، من این
534
00:27:16,920 –> 00:27:19,050
متغیر را به نام نوع زمین دارم که
535
00:27:19,050 –> 00:27:22,770
آیا کسی است. ساعت اثیر یک زمین با
536
00:27:22,770 –> 00:27:25,350
زخمی شدن توپ ضربه ای یا
537
00:27:25,350 –> 00:27:27,600
ضربه ای بود و بنابراین می توانید در اینجا ببینید که
538
00:27:27,600 –> 00:27:31,170
ما X را داریم که نشان دهنده ضربه زدن به توپ s
539
00:27:31,170 –> 00:27:33,330
که یک ضربه بود و B توپی بود
540
00:27:33,330 –> 00:27:35,700
که تقریباً ضربات بیشتری نسبت به توپ دریافت کردید.
541
00:27:35,700 –> 00:27:38,640
پس تقریباً میدانید که آیا
542
00:27:38,640 –> 00:27:40,950
زمینهایی را که
543
00:27:40,950 –> 00:27:43,140
با توپها زده شده است و تقریباً معادل
544
00:27:43,140 –> 00:27:46,020
ضربات است، خلاصه کردهاید و به نظر میرسد که
545
00:27:46,020 –> 00:27:50,940
بسیار معقول و منطقی است، بنابراین مشابه
546
00:27:50,940 –> 00:27:54,990
رپ ناشتا، شبکه وجهی است که
547
00:27:54,990 –> 00:27:58,950
به شما امکان میدهد متغیرها را بخشبندی کنید، اما به جای اینکه فقط
548
00:27:58,950 –> 00:28:02,460
نمودارهای مختلف برای هر یک از
549
00:28:02,460 –> 00:28:04,200
آن متغیرها ایجاد کنید و فقط آنها را
550
00:28:04,200 –> 00:28:06,360
با هم در یک لیست بزرگ قرار دهید،
551
00:28:06,360 –> 00:28:09,780
در واقع یک طرح شبکه ای از هر دوی
552
00:28:09,780 –> 00:28:13,230
آنها ایجاد می شود، این نام است، بنابراین می توانید در اینجا ببینید
553
00:28:13,230 –> 00:28:16,710
که می توانید به ضربه ها و ضربه های توپ نگاه کنید.
554
00:28:16,710 –> 00:28:20,310
در همان محورهای x و y به
555
00:28:20,310 –> 00:28:21,500
نوعی جالب است، زیرا این به
556
00:28:21,500 –> 00:28:24,620
شما احساس خوبی برای
557
00:28:24,620 –> 00:28:26,440
انجام هر کاری میدهد و همه چیز به
558
00:28:26,440 –> 00:28:29,360
بخش جالب دیگری در مورد سرعت و شجاعت میپردازد
559
00:28:29,360 –> 00:28:31,970
که میتوانید چند جهتی بروید
560
00:28:31,970 –> 00:28:38,090
تا مجبور شوید دو متغیرها به
561
00:28:38,090 –> 00:28:40,820
طور همزمان حرکت می