در این مطلب، ویدئو مقدمه ای بر آمار فضایی با پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:40:21
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,879 –> 00:00:03,520
2
00:00:03,520 –> 00:00:06,560
3
00:00:06,560 –> 00:00:09,040
4
00:00:09,040 –> 00:00:10,639
5
00:00:10,639 –> 00:00:12,880
6
00:00:12,880 –> 00:00:14,400
7
00:00:14,400 –> 00:00:16,239
8
00:00:16,239 –> 00:00:18,320
9
00:00:18,320 –> 00:00:18,960
10
00:00:18,960 –> 00:00:22,400
11
00:00:22,400 –> 00:00:24,000
12
00:00:24,000 –> 00:00:28,160
13
00:00:28,160 –> 00:00:31,199
14
00:00:31,199 –> 00:00:32,159
15
00:00:32,159 –> 00:00:34,000
16
00:00:34,000 –> 00:00:36,079
17
00:00:36,079 –> 00:00:39,120
18
00:00:39,120 –> 00:00:41,440
19
00:00:41,440 –> 00:00:42,160
20
00:00:42,160 –> 00:00:45,440
21
00:00:45,440 –> 00:00:47,520
22
00:00:47,520 –> 00:00:56,080
23
00:00:56,080 –> 00:00:59,799
24
00:01:07,760 –> 00:01:10,400
25
00:01:10,400 –> 00:01:11,200
26
00:01:11,200 –> 00:01:14,159
27
00:01:14,159 –> 00:01:15,040
28
00:01:15,040 –> 00:01:18,880
29
00:01:18,880 –> 00:01:20,720
30
00:01:20,720 –> 00:01:22,479
31
00:01:22,479 –> 00:01:25,280
32
00:01:25,280 –> 00:01:27,360
33
00:01:27,360 –> 00:01:30,000
34
00:01:30,000 –> 00:01:31,040
35
00:01:31,040 –> 00:01:33,200
36
00:01:33,200 –> 00:01:34,479
37
00:01:34,479 –> 00:01:37,759
38
00:01:37,759 –> 00:01:39,200
39
00:01:39,200 –> 00:01:41,040
40
00:01:41,040 –> 00:01:43,280
41
00:01:43,280 –> 00:01:45,600
42
00:01:45,600 –> 00:01:49,360
43
00:01:49,360 –> 00:01:52,159
44
00:01:52,159 –> 00:01:53,119
45
00:01:53,119 –> 00:01:55,040
46
00:01:55,040 –> 00:01:56,799
47
00:01:56,799 –> 00:01:58,960
48
00:01:58,960 –> 00:02:00,000
49
00:02:00,000 –> 00:02:02,320
50
00:02:02,320 –> 00:02:04,560
51
00:02:04,560 –> 00:02:08,000
52
00:02:08,000 –> 00:02:10,639
53
00:02:10,639 –> 00:02:11,280
54
00:02:11,280 –> 00:02:13,280
55
00:02:13,280 –> 00:02:15,040
56
00:02:15,040 –> 00:02:17,520
57
00:02:17,520 –> 00:02:19,599
58
00:02:19,599 –> 00:02:21,680
59
00:02:21,680 –> 00:02:23,360
60
00:02:23,360 –> 00:02:26,560
61
00:02:26,560 –> 00:02:28,239
62
00:02:28,239 –> 00:02:30,800
63
00:02:30,800 –> 00:02:33,840
64
00:02:33,840 –> 00:02:35,519
65
00:02:35,519 –> 00:02:37,440
66
00:02:37,440 –> 00:02:41,599
67
00:02:41,599 –> 00:02:44,959
68
00:02:44,959 –> 00:02:45,920
69
00:02:45,920 –> 00:02:49,040
70
00:02:49,040 –> 00:02:50,160
71
00:02:50,160 –> 00:02:51,920
72
00:02:51,920 –> 00:02:54,560
73
00:02:54,560 –> 00:02:57,920
74
00:02:57,920 –> 00:03:00,640
75
00:03:00,640 –> 00:03:02,000
76
00:03:02,000 –> 00:03:04,159
77
00:03:04,159 –> 00:03:06,080
78
00:03:06,080 –> 00:03:09,040
79
00:03:09,040 –> 00:03:10,480
80
00:03:10,480 –> 00:03:11,840
81
00:03:11,840 –> 00:03:13,519
82
00:03:13,519 –> 00:03:16,959
83
00:03:16,959 –> 00:03:20,000
84
00:03:20,000 –> 00:03:22,239
85
00:03:22,239 –> 00:03:23,519
86
00:03:23,519 –> 00:03:25,280
87
00:03:25,280 –> 00:03:26,879
88
00:03:26,879 –> 00:03:29,680
89
00:03:29,680 –> 00:03:32,080
90
00:03:32,080 –> 00:03:32,959
91
00:03:32,959 –> 00:03:35,040
92
00:03:35,040 –> 00:03:38,080
93
00:03:38,080 –> 00:03:41,120
94
00:03:41,120 –> 00:03:44,319
95
00:03:44,319 –> 00:03:47,280
96
00:03:47,280 –> 00:03:48,480
97
00:03:48,480 –> 00:03:51,760
98
00:03:51,760 –> 00:03:53,439
99
00:03:53,439 –> 00:03:55,200
100
00:03:55,200 –> 00:03:58,480
101
00:03:58,480 –> 00:04:00,959
102
00:04:00,959 –> 00:04:02,959
103
00:04:02,959 –> 00:04:06,080
104
00:04:06,080 –> 00:04:07,840
105
00:04:07,840 –> 00:04:10,000
106
00:04:10,000 –> 00:04:11,519
107
00:04:11,519 –> 00:04:13,360
108
00:04:13,360 –> 00:04:16,320
109
00:04:16,320 –> 00:04:18,320
110
00:04:18,320 –> 00:04:20,478
111
00:04:20,478 –> 00:04:22,320
112
00:04:22,320 –> 00:04:23,840
113
00:04:23,840 –> 00:04:26,479
114
00:04:26,479 –> 00:04:28,960
115
00:04:28,960 –> 00:04:31,199
116
00:04:31,199 –> 00:04:35,120
117
00:04:35,120 –> 00:04:38,560
118
00:04:38,560 –> 00:04:40,880
119
00:04:40,880 –> 00:04:42,880
120
00:04:42,880 –> 00:04:44,880
121
00:04:44,880 –> 00:04:47,759
122
00:04:47,759 –> 00:04:48,639
123
00:04:48,639 –> 00:04:50,720
124
00:04:50,720 –> 00:04:52,720
125
00:04:52,720 –> 00:04:55,360
126
00:04:55,360 –> 00:04:56,320
127
00:04:56,320 –> 00:04:59,759
128
00:04:59,759 –> 00:05:00,240
129
00:05:00,240 –> 00:05:03,600
130
00:05:03,600 –> 00:05:06,000
131
00:05:06,000 –> 00:05:06,960
132
00:05:06,960 –> 00:05:09,600
133
00:05:09,600 –> 00:05:10,160
134
00:05:10,160 –> 00:05:12,000
135
00:05:12,000 –> 00:05:13,199
136
00:05:13,199 –> 00:05:16,479
137
00:05:16,479 –> 00:05:19,120
138
00:05:19,120 –> 00:05:20,639
139
00:05:20,639 –> 00:05:23,520
140
00:05:23,520 –> 00:05:24,479
141
00:05:24,479 –> 00:05:26,400
142
00:05:26,400 –> 00:05:28,000
143
00:05:28,000 –> 00:05:30,880
144
00:05:30,880 –> 00:05:31,199
145
00:05:31,199 –> 00:05:34,400
146
00:05:34,400 –> 00:05:37,840
147
00:05:37,840 –> 00:05:38,560
148
00:05:38,560 –> 00:05:39,919
149
00:05:39,919 –> 00:05:42,080
150
00:05:42,080 –> 00:05:43,120
151
00:05:43,120 –> 00:05:45,919
152
00:05:45,919 –> 00:05:47,840
153
00:05:47,840 –> 00:05:51,440
154
00:05:51,440 –> 00:05:52,479
155
00:05:52,479 –> 00:05:57,600
156
00:05:59,440 –> 00:06:01,840
157
00:06:01,840 –> 00:06:03,360
158
00:06:03,360 –> 00:06:06,479
159
00:06:06,479 –> 00:06:08,240
160
00:06:08,240 –> 00:06:11,280
161
00:06:11,280 –> 00:06:12,160
162
00:06:12,160 –> 00:06:15,039
163
00:06:15,039 –> 00:06:15,840
164
00:06:15,840 –> 00:06:19,520
165
00:06:19,520 –> 00:06:22,800
166
00:06:22,800 –> 00:06:24,400
167
00:06:24,400 –> 00:06:27,919
168
00:06:27,919 –> 00:06:30,479
169
00:06:30,479 –> 00:06:33,440
170
00:06:33,440 –> 00:06:36,479
171
00:06:36,479 –> 00:06:38,880
172
00:06:38,880 –> 00:06:40,319
173
00:06:40,319 –> 00:06:42,240
174
00:06:42,240 –> 00:06:44,319
175
00:06:44,319 –> 00:06:45,759
176
00:06:45,759 –> 00:06:49,039
177
00:06:49,039 –> 00:06:50,639
178
00:06:50,639 –> 00:06:53,199
179
00:06:53,199 –> 00:06:56,479
180
00:06:56,479 –> 00:06:57,680
181
00:06:57,680 –> 00:07:00,960
182
00:07:00,960 –> 00:07:04,400
183
00:07:04,400 –> 00:07:06,080
184
00:07:06,080 –> 00:07:07,599
185
00:07:07,599 –> 00:07:10,720
186
00:07:10,720 –> 00:07:11,919
187
00:07:11,919 –> 00:07:14,160
188
00:07:14,160 –> 00:07:15,840
189
00:07:15,840 –> 00:07:17,520
190
00:07:17,520 –> 00:07:21,520
191
00:07:21,520 –> 00:07:23,360
192
00:07:23,360 –> 00:07:27,039
193
00:07:27,039 –> 00:07:28,400
194
00:07:28,400 –> 00:07:31,440
195
00:07:31,440 –> 00:07:34,160
196
00:07:34,160 –> 00:07:35,840
197
00:07:35,840 –> 00:07:38,880
198
00:07:38,880 –> 00:07:41,599
199
00:07:41,599 –> 00:07:42,240
200
00:07:42,240 –> 00:07:45,360
201
00:07:45,360 –> 00:07:47,280
202
00:07:47,280 –> 00:07:49,039
203
00:07:49,039 –> 00:07:51,440
204
00:07:51,440 –> 00:07:52,319
205
00:07:52,319 –> 00:07:55,280
206
00:07:55,280 –> 00:07:58,080
بسیار خوب به همه خوش آمدید مقدمه ای بر آمار فضایی با پایتون ام خیلی خوب است که همه شما را می بینیم متأسفانه ما تقریباً این کار را انجام می دهیم شاید برای بسیاری از شما خوش شانس باشد زیرا مجبور نیستید به محوطه دانشگاه بیایید و مجبور نیستید پیدا کنید من در هر اتاقی که تدریس می کنم، شخصاً دلم برای محیط حضوری تنگ می شود، بنابراین این بهترین محیط برای من نیست، اما می دانید که در سال گذشته این واقعاً خوب کار کرده است، بنابراین من به همه شما خوش آمد می گویم. کارگاه و من می خواهم شروع به اشتراک گذاری صفحه نمایش خود کنم و از لحظه ای که همه چیز در اطراف [موسیقی] حرکت می کند خوب است، بنابراین یک بار دیگر به نام من خوش آمدید، بله، من برای دفتر محاسبات تحقیقاتی پیشرفته در دانشگاه Ucla کار می کنم. هیئت علمی در گروه برنامه ریزی شهری و علوم انسانی دیجیتال و من علوم داده های مکانی و gis را برای کارگاه عمدتا امروزی تدریس می کنم، ما قصد داریم یک نوع مقدمه مقدماتی بر آمار فضایی با استفاده از python my را پوشش دهیم. هدف کارگاه امروز این است که بدانید همانطور که اشاره کردم، من آمارگیر نیستم، من بیشتر یک فرد GIS هستم تا یک فرد تجسم داده ها، کاری که می خواهم در اینجا انجام دهم این است که شما و خودتان را در موقعیتی قرار دهید که بتوانید ابزار و دانش مناسب برای پیشبرد تحقیقات خود با این روشها که کاملاً در جامعه منبع باز هستند، بنابراین ما از ابزارهایی مانند نوتبوکهای پایتون jupyter و همه این کتابخانهها استفاده میکنیم که میتوانید آنها را نصب، دانلود و اجرا کنید. اگرچه کار آسانی نیست اما آنچه امروز اینجا داریم این است که محیطی را برای شما به نام محیط ژوپیتر هاب راه اندازی کرده ایم که رایگان و در دسترس همه دانش آموزان دانشگاه های دانشگاهی است و من نیز چیزی به نام دفترچه یادداشت صحافی راه اندازی کرده ام که همچنین یک محیط نوت بوک مبتنی بر وب ژوپیتر که استفاده از آن برای شما نیز رایگان است، اوم اجازه دهید ببینم از سؤالات استقبال می کنم، حتی اگر در طول کارگاه باشد، من همچنین از وقفه ها استقبال می کنم، دوست دارم صداها را بشنوم، بنابراین می توانید خودتان را بی صدا کنید در هر زمان اگر من خیلی سریع و خیلی آهسته پیش می روم اگر چیزی را فراموش کردم این کار را زیاد انجام می دهم اگر فراموش کنم صفحه نمایشم را به اشتراک بگذارم یا اگر چیزی درست نیست لطفا خود را بی صدا کنید و به من اطلاع دهید که تمام تلاشم را می کنم تا چشمم را به چت نگاه دارم اما همچنین ممکن است چیزی را در چت از دست بدهم، بنابراین واقعاً خودتان را ملاقات نکنید و به من اطلاع دهید خوب است، بنابراین بیایید شروع کنیم. مخزن تا بتوانید هر زمان که بخواهید به اینجا بازگردید ما بیدار خواهیم بود ام اوه می دانید امیدوارم برای همیشه بازگردید و به آن دسترسی داشته باشید ضبط برای شما در دسترس خواهد بود. امیدوارم پیوند این ضبط را ارسال کنم در عرض چند روز و با ثبت نام در کلاس، مستقیماً به ایمیل شما ارسال می شود، بنابراین اگر در طول کارگاه عقب افتادید، با این واقعیت که همیشه می توانید به ویدیو برگردید و دوباره آن را دوباره اجرا کنید، خیالتان راحت باشد. من هم بر اساس نظرسنجی تلاش می کنم، سعی می کنم بروم، نه کاملاً شما سریع یا آهسته، بنابراین سعی میکنم به این رسانه ضربه بزنم، جایی که فرض میکنم شما کمی در مورد نوتبوکهای مشتری و کمی در مورد پایتون میدانید، اما در هیچکدام از این دو خبره نیستید، بنابراین سرعت من این است. و امیدوارم که برای اکثریت شما کارساز باشد و من بعد از آن برای کسانی از شما که سوالی دارید می مانم، بنابراین برای شروع به کار، پایین لینکی که برای شما فرستادم، پیوندی به هاب یوکلا مشتری وجود دارد. اگر میتوانید ادامه دهید و باز کنید یا اگر قبلاً این کار را نکردهاید روی این پیوند کلیک کنید، من سعی میکنم محیط خود را در اینجا تقلید کنم، باید با این دکمه بزرگ نارنجی که میتوانید روی آن کلیک کنید، از شما استقبال میکند و شما را به یک صفحه میبرد. صفحه ورود اگر به ucla وابسته هستید، می توانید you know یا تایپ ucla در واقع در آن کادر جستجو را انتخاب کنید و این اولین گزینه ای است که نشان داده می شود و این شما را به صفحه احراز هویت دو مرحله ای می برد که در آنجا می توانید وارد شوید اطلاعات اینجا و ورود به سیستم خوب است پس همان کاری را انجام دهید که شما بچه ها انجام می دهید، امیدوارم تلفن همراه من را بالا بیاورید و در حالی که من این کار را انجام نمی دهم اگر شما نیستید، می دانم که حدود 10 نفر از شما هستند که بخشی از ucla نیستند، از لینک کلاسور زیر استفاده کنید. در اینجا برای هشدار دادن این لینک کلاسور زمان زیادی می برد، بنابراین وقتی روی آن کلیک می کنید باید تقریباً پنج دقیقه منتظر بمانید تا تمام اجزای ضروری کتابخانه ها را بارگیری کند و شما را آماده کند تا به خوبی پیش بروید، امیدواریم که ما اینجا همه در یک صفحه هستند و اولین دفترچه یادداشت را در مرورگر خود باز میبینید، بنابراین من اینجا مکث میکنم تا مطمئن شوم که همه ما اینجا هستیم حداقل خوب است و اگر دستت را بالا ببری به من اطلاع بده. همچنین باید به اوه بن ویندجمپ اشاره کرد که میتوانید در شرکتکنندگان هم ببینید، و بن فقط یک معرفی سریع اگر مطمئن نیستید سلام به همه، بنابراین من نیز در دفتر برای محاسبات تحقیقاتی پیشرفته با شما کار میکنم، آه، کارهای مختلفی انجام میدهم. چیزهایی که به نوعی زمان من را تقسیم می کنند ب بین محاسبات با کارایی بالا در خوشه هافمن دو و سپس انجام انواع کارهای مرتبط با آموزش به طور خاص با مشتری، بنابراین من مدیر مرکز مشتری هستم که شما از آن استفاده می کنید و به شما کارگاه های آموزشی را در طول مسیر آموزش می دهم. به نوعی مربوط به پایتون است، بنابراین من بیشتر به سمت این پایتون سختگیرانه گرایش دارم تا علوم فضایی، اما اگر در نهایت سؤالی در مورد محیط مرکز مشتری دارید یا می خواهید چیزهای مرتبط با مشتری و پایتون را برای خود تنظیم کنید، بله. شما خوش آمدید به من یک ایمیل بفرستید تا من ایمیلم را فقط در چت قرار می دهم در صورتی که بخواهید از آن استفاده کنید بله می دانید به عنوان محقق دانشگاه کالیفرنیا اوم شما فقط می دانید که ما همه برای مشاوره در دسترس شما هستیم. برای پیگیری و اوه شما می دانید که ما واقعاً اینجا هستیم تا دستور کار تحقیقاتی شما را پیش ببریم و این فقط ما نیستیم، ما یک تیم آمار داریم، ما یک تیم بزرگ از نوع ظاهراً متخصصان در حوزه های مختلف هستیم که در اینجا به کارکنان و اعضای هیئت علمی دانشجویان کمک می کنیم. آ تحقیق
207
00:07:58,080 –> 00:08:01,520
dvance بسیار خوب است، بنابراین من هیچ مشکلی نشنیده ام
208
00:08:01,520 –> 00:08:03,599
که عالی است، بنابراین من
209
00:08:03,599 –> 00:08:05,440
فرض می کنم که ما می توانیم
210
00:08:05,440 –> 00:08:07,599
با این محیط به جلو برویم، محیطی که در اینجا می بینید
211
00:08:07,599 –> 00:08:08,879
یک
212
00:08:08,879 –> 00:08:10,720
دفترچه یادداشت مشتری یک محیط دفترچه یادداشت مشتری کلاسیک
213
00:08:10,720 –> 00:08:13,360
است و بالا و پایین می رود.
214
00:08:13,360 –> 00:08:16,000
از این سلولها تشکیل شده است که
215
00:08:16,000 –> 00:08:16,720
216
00:08:16,720 –> 00:08:19,919
یا حاوی نشانهگذاری متن توصیفی
217
00:08:19,919 –> 00:08:21,759
218
00:08:21,759 –> 00:08:24,639
هستند یا حاوی سلولهای کد هستند، بنابراین سلولهایی در
219
00:08:24,639 –> 00:08:25,199
220
00:08:25,199 –> 00:08:27,599
پایینتر وجود دارند که
221
00:08:27,599 –> 00:08:28,400
کمی خاکستری
222
00:08:28,400 –> 00:08:29,919
هستند، سلولهای کد هستند و ما این سلولها را اجرا میکنیم.
223
00:08:29,919 –> 00:08:32,320
224
00:08:32,320 –> 00:08:35,760
کل سخنرانی من یا
225
00:08:35,760 –> 00:08:37,599
شما ارائه را در اینجا در
226
00:08:37,599 –> 00:08:39,599
دفترچه یادداشت
227
00:08:39,599 –> 00:08:42,479
میدانید، بنابراین با دیدن توضیحات زیادی
228
00:08:42,479 –> 00:08:44,800
که با سلولهای کد ترکیب شدهاند، میدانید
229
00:08:44,800 –> 00:08:46,399
که عالی است
230
00:08:46,399 –> 00:08:48,640
زیرا به این مطالب باز میگردید،
231
00:08:48,640 –> 00:08:52,160
میتوانید اساساً من را بخوانید. سخنرانی همراه با
232
00:08:52,160 –> 00:08:54,000
اجرای کدی که این
233
00:08:54,000 –> 00:08:56,800
محیط را واقعاً قدرتمند میکند،
234
00:08:56,800 –> 00:08:58,800
بنابراین کاری که من میخواهم انجام دهم این است
235
00:08:58,800 –> 00:09:00,800
که به حالت نمایش اسلاید بروم
236
00:09:00,800 –> 00:09:02,160
شما لازم نیست این کار را انجام دهید در
237
00:09:02,160 –> 00:09:04,080
واقع توصیه نمیکنم شما این کار را انجام دهید، من توصیه
238
00:09:04,080 –> 00:09:05,120
می کنم در این حالت
239
00:09:05,120 –> 00:09:07,600
بمانید و فقط بالا و پایین بروید و
240
00:09:07,600 –> 00:09:08,959
موارد را در طول مسیر اجرا کنید،
241
00:09:08,959 –> 00:09:10,640
اما من می خواهم این را در حالت نمایش اسلاید
242
00:09:10,640 –> 00:09:12,399
اجرا کنم که یکی از ویژگی های نوت بوک های
243
00:09:12,399 –> 00:09:13,360
مشتری است.
244
00:09:13,360 –> 00:09:17,200
245
00:09:17,200 –> 00:09:18,160
ببینید روی صفحه نمایش من
246
00:09:18,160 –> 00:09:19,920
با صفحه شما یکسان است، فقط این است که
247
00:09:19,920 –> 00:09:22,480
من در این حالت ارائه هستم،
248
00:09:22,480 –> 00:09:25,839
خوب، بنابراین این فهرست مطالب است امم
249
00:09:25,839 –> 00:09:27,760
فقط یک یادداشت سریع که در حال حاضر
250
00:09:27,760 –> 00:09:28,959
ضبط می شود
251
00:09:28,959 –> 00:09:33,200
خوب است و اوم
252
00:09:33,200 –> 00:09:35,440
بله، پس بیایید شروع کنیم تا
253
00:09:35,440 –> 00:09:37,120
آزمایشگاه امروز در مورد
254
00:09:37,120 –> 00:09:39,920
آمار فضایی ام و من
255
00:09:39,920 –> 00:09:41,040
256
00:09:41,040 –> 00:09:42,959
یک روش بسیار خاص به نام همبستگی خودکار فضایی را پوشش خواهم داد.
257
00:09:42,959 –> 00:09:44,480
258
00:09:44,480 –> 00:09:45,920
خروجی هایی که امروز روی صفحه می بینید
259
00:09:45,920 –> 00:09:47,519
چیزهایی هستند که ما در
260
00:09:47,519 –> 00:09:50,080
واقع تولید خواهیم کرد و اوه ما
261
00:09:50,080 –> 00:09:51,200
262
00:09:51,200 –> 00:09:53,360
فی نفسه با داده های واقعی کار خواهیم کرد.
263
00:09:53,360 –> 00:09:56,320
برای استراحت، دادهها را از پورتال دادههای la وارد میکنیم،
264
00:09:56,320 –> 00:09:58,480
بنابراین به جای اینکه من
265
00:09:58,480 –> 00:10:00,399
مجموعهای از دادهها را به شما ارائه دهم، در واقع
266
00:10:00,399 –> 00:10:03,120
دادهها را در زمان واقعی وارد میکنیم و این
267
00:10:03,120 –> 00:10:04,880
268
00:10:04,880 –> 00:10:08,880
تجسمها را بر اساس آن دادهها ایجاد میکنیم.
269
00:10:08,959 –> 00:10:10,160
و ما می رویم نگاهی به
270
00:10:10,160 –> 00:10:12,320
خودهمبستگی فضایی راه دیگری برای تفکر
271
00:10:12,320 –> 00:10:14,000
در مورد خودهمبستگی
272
00:10:14,000 –> 00:10:17,200
فضایی نوعی عدم
273
00:10:17,200 –> 00:10:20,640
تصادفی بودن فضایی است،
274
00:10:20,640 –> 00:10:24,000
به عبارت دیگر، اگر آماردان هستید، ممکن است با این مفهوم آشنا باشید، چیزهایی
275
00:10:24,000 –> 00:10:26,560
از نظر آماری از
276
00:10:26,560 –> 00:10:28,320
نظر تخصیص فضایی
277
00:10:28,320 –> 00:10:29,760
مهم هستند.
278
00:10:29,760 –> 00:10:32,160
279
00:10:32,160 –> 00:10:35,360
اوم شما می دانید که چیزها
280
00:10:35,360 –> 00:10:36,320
281
00:10:36,320 –> 00:10:39,040
بر اساس مقدار یک متغیر به یکدیگر مرتبط
282
00:10:39,040 –> 00:10:40,560
هستند و شاید از خود می پرسید که آیا
283
00:10:40,560 –> 00:10:42,320
چیزی به متغیر دیگری
284
00:10:42,320 –> 00:10:43,760
بر اساس زمان
285
00:10:43,760 –> 00:10:46,079
در این بازه زمانی مرتبط است، اگر این اتفاق بیفتد آیا شبیه به آن چیزی است که در این دوره زمانی اتفاق می افتد.
286
00:10:46,079 –> 00:10:47,519
287
00:10:47,519 –> 00:10:50,800
288
00:10:50,800 –> 00:10:52,880
خودهمبستگی فضایی دوره زمانی از این نظر مشابه است با
289
00:10:52,880 –> 00:10:53,920
این
290
00:10:53,920 –> 00:10:56,480
تفاوت که اگر در
291
00:10:56,480 –> 00:10:57,440
292
00:10:57,440 –> 00:11:00,399
اینجا برای یک پدیده خاص اتفاق می افتد، از فضا استفاده می کنیم،
293
00:11:00,399 –> 00:11:01,360
متغیری
294
00:11:01,360 –> 00:11:03,760
مشابه یا غیرمشابه با آن در
295
00:11:03,760 –> 00:11:05,600
مکانی کاملاً متفاوت اتفاق
296
00:11:05,600 –> 00:11:07,600
می افتد، چیزی که در اینجا آزمایش می کنیم و برای
297
00:11:07,600 –> 00:11:09,440
ارائه نوعی
298
00:11:09,440 –> 00:11:11,680
اهمیت آماری برای اینکه آیا چیزها
299
00:11:11,680 –> 00:11:13,440
از نظر
300
00:11:13,440 –> 00:11:15,200
مکانی روند رو به رشدی دارند یا نه در
301
00:11:15,200 –> 00:11:17,680
مناطق خاصی
302
00:11:17,680 –> 00:11:21,040
خوب است، بنابراین اوم
303
00:11:21,040 –> 00:11:23,760
اوه شما یک راه را می دانید. به
304
00:11:23,760 –> 00:11:24,320
این فکر کنید
305
00:11:24,320 –> 00:11:27,440
که اوم می
306
00:11:27,440 –> 00:11:30,399
دانید به اصطلاح قانون اول جغرافیا این
307
00:11:30,399 –> 00:11:32,079
است که همه چیز به هر چیز دیگری مربوط است،
308
00:11:32,079 –> 00:11:33,920
اما چیزهای نزدیک بیشتر
309
00:11:33,920 –> 00:11:35,680
از چیزهای دور مرتبط هستند
310
00:11:35,680 –> 00:11:37,760
، به نظر کاملا واضح است،
311
00:11:37,760 –> 00:11:40,800
گرافیکی که من در اینجا دارم در
312
00:11:40,800 –> 00:11:44,240
واقع یک تصویر تاریخی است. این یکی از اولین
313
00:11:44,240 –> 00:11:46,640
نمونه های تجزیه و تحلیل فضایی است که
314
00:11:46,640 –> 00:11:47,519
ثبت شده است
315
00:11:47,519 –> 00:11:51,200
و این مطالعه جان اسنو در
316
00:11:51,200 –> 00:11:54,399
مورد اپیدمی وبا در لندن
317
00:11:54,399 –> 00:11:58,399
در دهه 1800 است و کاری که جان اسنو انجام داد این است که او
318
00:11:58,399 –> 00:11:58,959
319
00:11:58,959 –> 00:12:01,920
مکان ها را اساساً خوشه های مرگ و میر
320
00:12:01,920 –> 00:12:04,560
بر اساس شیوع وبا
321
00:12:04,560 –> 00:12:06,079
اما افسانه ترسیم کرد. نشان می دهد که آنها
322
00:12:06,079 –> 00:12:07,920
نه تنها مرگ و میر هستند، بلکه
323
00:12:07,920 –> 00:12:08,720
محل
324
00:12:08,720 –> 00:12:11,839
پمپ های آب نیز وجود دارد، بنابراین تصور می شد که
325
00:12:11,839 –> 00:12:12,320
326
00:12:12,320 –> 00:12:15,519
این نوع شیوع احتمالی
327
00:12:15,519 –> 00:12:18,399
ناشی از انتقال از طریق هوا بوده
328
00:12:18,399 –> 00:12:19,360
329
00:12:19,360 –> 00:12:21,279
است، شبیه به بیماری همه گیر که ما در حال
330
00:12:21,279 –> 00:12:22,560
گذراندن
331
00:12:22,560 –> 00:12:24,480
آن هستیم. واقعیت این بود که از
332
00:12:24,480 –> 00:12:25,920
طریق آب می آمد
333
00:12:25,920 –> 00:12:28,320
و این واقعیت که همه این مرگ و میرها در
334
00:12:28,320 –> 00:12:30,639
اطراف یک پمپ آب جمع شده بودند
335
00:12:30,639 –> 00:12:33,839
، اساس مطالعه ای شد که می
336
00:12:33,839 –> 00:12:36,560
گفت خوشه فضایی حول یک پمپ منفرد شکل گرفت
337
00:12:36,560 –> 00:12:37,360
338
00:12:37,360 –> 00:12:39,440
و افسانه داستان می گوید که
339
00:12:39,440 –> 00:12:40,959
می دانید آنها پمپ را خاموش کردند
340
00:12:40,959 –> 00:12:44,959
و شیوع بیماری او را متوقف کرد،
341
00:12:44,959 –> 00:12:48,240
بنابراین این نمونه
342
00:12:48,240 –> 00:12:50,800
ای از این است که می
343
00:12:50,800 –> 00:12:51,600
دانید امروز به
344
00:12:51,600 –> 00:12:55,760
صورت دیجیتالی و آماری با پایتون چه کاری انجام
345
00:12:55,760 –> 00:12:59,040
می دهیم. ما امروز چه کار می کنیم
346
00:12:59,040 –> 00:13:01,839
، روش شناسی، اوه، که اشاره کردم، ما به
347
00:13:01,839 –> 00:13:02,959
348
00:13:02,959 –> 00:13:04,639
داده های lapd نگاه می کنیم، بنابراین می خواهیم داده ها را
349
00:13:04,639 –> 00:13:06,800
مستقیماً از پورتال داده ها
350
00:13:06,800 –> 00:13:10,079
از اداره پلیس
351
00:13:10,079 –> 00:13:11,200
وارد کنیم و از
352
00:13:11,200 –> 00:13:14,399
گروه های بلوک سرشماری و همچنین این استفاده خواهیم کرد.
353
00:13:14,399 –> 00:13:16,880
نوعی مرزها برای خلاصه کردن داده ها
354
00:13:16,880 –> 00:13:18,160
توسط
355
00:13:18,160 –> 00:13:20,880
و ما قصد داریم به صورت مکانی این دو مجموعه داده را به هم بپیوندیم،
356
00:13:20,880 –> 00:13:21,839
357
00:13:21,839 –> 00:13:22,959
بنابراین در مورد
358
00:13:22,959 –> 00:13:24,959
معنای پیوستن فضایی صحبت خواهیم کرد
359
00:13:24,959 –> 00:13:26,480
شاید شما نوعی اتصال ویژگی را انجام داده باشید،
360
00:13:26,480 –> 00:13:28,639
اما ما این کار را انجام می دهیم. یک
361
00:13:28,639 –> 00:13:29,040
پیوست فضایی به
362
00:13:29,040 –> 00:13:32,560
این معنی که ما میخواهیم بپیوندیم و
363
00:13:32,560 –> 00:13:36,160
تعداد دستگیریهایی را که در محدودههای خاصی اتفاق میافتد اندازهگیری میکنیم
364
00:13:36,160 –> 00:13:37,839
که
365
00:13:37,839 –> 00:13:39,279
گروههای بلوک سرشماری هستند،
366
00:13:39,279 –> 00:13:41,279
سپس دادهها را عادی میکنیم،
367
00:13:41,279 –> 00:13:42,560
بنابراین به جای اینکه
368
00:13:42,560 –> 00:13:45,760
شما بدانید تعداد مستقیم
369
00:13:45,760 –> 00:13:47,440
دستگیریها را عادی میکنیم. آن را
370
00:13:47,440 –> 00:13:49,040
بر اساس جمعیت، بنابراین ما میخواهیم بگوییم که
371
00:13:49,040 –> 00:13:49,680
372
00:13:49,680 –> 00:13:52,880
در هر 1000 نفر چند دستگیری وجود دارد، سپس
373
00:13:52,880 –> 00:13:53,760
374
00:13:53,760 –> 00:13:56,560
با استفاده از چشم موران، همبستگی خودکار فضایی جهانی را انجام
375
00:13:56,560 –> 00:13:59,360
میدهیم و این را بعداً توضیح خواهم داد
376
00:13:59,360 –> 00:14:02,320
و سپس یک خودهمبستگی فضایی محلی نیز انجام خواهیم داد.
377
00:14:02,320 –> 00:14:03,360
378
00:14:03,360 –> 00:14:05,360
این قسمت سرگرم کننده است
379
00:14:05,360 –> 00:14:07,680
زیرا اینجاست که ما می
380
00:14:07,680 –> 00:14:10,560
توانیم دقیقاً مکان
381
00:14:10,560 –> 00:14:11,680
این خوشه ها را
382
00:14:11,680 –> 00:14:16,079
در
383
00:14:16,079 –> 00:14:18,480
کتابخانه های خوبی که قرار است استفاده کنیم شناسایی کنیم، بنابراین در
384
00:14:18,480 –> 00:14:19,440
یک
385
00:14:19,440 –> 00:14:22,160
محیط پایتون هستیم و پایتون به شما اجازه می دهد
386
00:14:22,160 –> 00:14:22,880
387
00:14:22,880 –> 00:14:26,160
کتابخانه ها و بسیاری از موارد را وارد کنید. این کتابخانهها
388
00:14:26,160 –> 00:14:29,519
هستند، میدانید که جوامع عظیمی
389
00:14:29,519 –> 00:14:30,399
در پشت خود
390
00:14:30,399 –> 00:14:32,800
دارند، آنها بسیار مستند هستند،
391
00:14:32,800 –> 00:14:34,399
آنها توسط میلیونها نفر در سراسر
392
00:14:34,399 –> 00:14:35,680
جهان استفاده میشوند
393
00:14:35,680 –> 00:14:38,480
و آه، اینها فقط تعداد انگشت شماری از
394
00:14:38,480 –> 00:14:40,240
مواردی هستند که ما امروز از
395
00:14:40,240 –> 00:14:44,160
پانداهای matplotlib geopandas استفاده میکنیم.
396
00:14:44,160 –> 00:14:46,880
من تعدادی لینک
397
00:14:46,880 –> 00:14:48,000
در کل دفترچه
398
00:14:48,000 –> 00:14:51,440
یادداشت برای کمک و نوع مستندات پاشیده ام،
399
00:14:51,440 –> 00:14:53,360
بنابراین می توانید بدانید که روی هر یک از
400
00:14:53,360 –> 00:14:54,880
این پیوندها کلیک کنید تا اطلاعات بیشتری
401
00:14:54,880 –> 00:14:56,720
در مورد آن بدانید.
402
00:14:56,720 –> 00:14:59,440
با
403
00:14:59,440 –> 00:15:01,519
همکاری matplotlib
404
00:15:01,519 –> 00:15:03,120
405
00:15:03,120 –> 00:15:05,839
که یکی دیگر از کتابخانههای پایتون است، کار میکند و
406
00:15:05,839 –> 00:15:08,079
به شما امکان میدهد نمودارهایی تولید کنید که
407
00:15:08,079 –> 00:15:11,120
شبیه این
408
00:15:11,120 –> 00:15:14,399
نمودارهای خطی رنگارنگ هستند
409
00:15:14,399 –> 00:15:18,320
و آنچه در مورد
410
00:15:18,320 –> 00:15:20,399
مستندات همه این کتابخانهها عالی است این است که میدانید
411
00:15:20,399 –> 00:15:22,320
آنها شامل یک تعداد زیادی کد نمونه
412
00:15:22,320 –> 00:15:24,320
که می توانید به راحتی در
413
00:15:24,320 –> 00:15:26,399
محیط نوت بوک ژوپیتر خود کپی و
414
00:15:26,399 –> 00:15:27,120
415
00:15:27,120 –> 00:15:30,240
جایگذاری کنید و نمودارهایی را که در اینجا وجود دارد تولید کنید
416
00:15:30,240 –> 00:15:32,000
و بعد فقط در مورد شما می شود و سپس می
417
00:15:32,000 –> 00:15:33,680
گویید آه اگر می توانم این کار را با
418
00:15:33,680 –> 00:15:35,279
داده های نمونه انجام دهم نمی دانم آیا می توانم انجام دهم آن را با
419
00:15:35,279 –> 00:15:38,000
داده های خودم
420
00:15:38,959 –> 00:15:41,759
خوب است، بنابراین این matplotlib پاندا است uh
421
00:15:41,759 –> 00:15:42,800
geopandas
422
00:15:42,800 –> 00:15:45,120
همانطور که کلمه نشان می دهد geos است،
423
00:15:45,120 –> 00:15:46,240
جغرافیایی
424
00:15:46,240 –> 00:15:48,160
425
00:15:48,160 –> 00:15:49,440
426
00:15:49,440 –> 00:15:53,120
427
00:15:53,120 –> 00:15:57,199
428
00:15:57,199 –> 00:15:57,839
429
00:15:57,839 –> 00:16:01,920
است. واقعاً عالی است که بتوانید
430
00:16:01,920 –> 00:16:04,959
نمودارهایی را ایجاد کنید که بر اساس نقشه هستند
431
00:16:04,959 –> 00:16:08,160
و تنها خطوط کد را می دانید،
432
00:16:08,160 –> 00:16:10,079
بنابراین اگر داده های جدولی
433
00:16:10,079 –> 00:16:11,759
دارید که به این شکل است و در
434
00:16:11,759 –> 00:16:15,120
واقع با یک هندسه به شما این امکان را می دهد که
435
00:16:15,120 –> 00:16:16,320
پس از آن
436
00:16:16,320 –> 00:16:19,279
نمودارهایی بسازید که ماهیت جغرافیایی،
437
00:16:19,279 –> 00:16:22,399
فضایی و بصری دارند
438
00:16:22,399 –> 00:16:24,639
و سپس می توانید عناصر مختلف
439
00:16:24,639 –> 00:16:26,160
را در
440
00:16:26,160 –> 00:16:29,360
تجسم جغرافیایی خود بر اساس
441
00:16:29,360 –> 00:16:32,079
مقادیر موجود در متغیرهای خاص رنگ کنید که ممکن
442
00:16:32,079 –> 00:16:32,720
است
443
00:16:32,720 –> 00:16:35,759
بخشی از داده های جدولی
444
00:16:35,759 –> 00:16:39,839
با چند ضلعی هایی باشد که کار می کند. با امتیازات
445
00:16:39,839 –> 00:16:41,920
و یک سری
446
00:16:41,920 –> 00:16:43,839
چیزهای واقعاً جالب وجود دارد که می توانید
447
00:16:43,839 –> 00:16:45,600
با ژئوپانداها انجام دهید و ما
448
00:16:45,600 –> 00:16:48,720
کمی از آن را پوشش خواهیم داد و همچنین
449
00:16:49,440 –> 00:16:51,920
در بخش آماری
450
00:16:51,920 –> 00:16:54,079
چیزهایی که از دو کتابخانه استفاده خواهیم کرد
451
00:16:54,079 –> 00:16:57,600
. به نام uh esda
452
00:16:57,600 –> 00:17:00,079
این تجزیه و تحلیل داده های فضایی اکتشافی است
453
00:17:00,079 –> 00:17:00,800
454
00:17:00,800 –> 00:17:04,959
این یک بسته فرعی از نوع بزرگتری
455
00:17:04,959 –> 00:17:07,119
از بسته های آماری به نام
456
00:17:07,119 –> 00:17:10,319
سلول پی است که کتابخانه تجزیه و تحلیل فضایی پایتون است
457
00:17:10,319 –> 00:17:11,280
458
00:17:11,280 –> 00:17:13,439
و به ما امکان می دهد برخی از
459
00:17:13,439 –> 00:17:15,119
آمارهای فضایی را که امروز پوشش خواهیم داد انجام دهیم.
460
00:17:15,119 –> 00:17:18,160
و
461
00:17:18,160 –> 00:17:21,439
دیگری uh s plot um است،
462
00:17:21,439 –> 00:17:24,799
بنابراین این کتابخانه دیگری
463
00:17:24,799 –> 00:17:27,039
برای همبستگی خودکار فضایی محلی
464
00:17:27,039 –> 00:17:28,960
است که امروز از آن استفاده خواهیم کرد که به ما امکان می دهد
465
00:17:28,960 –> 00:17:29,760
466
00:17:29,760 –> 00:17:33,440
این نوع نمودارها و vi را تولید کنیم. نمودارهای معمولی
467
00:17:33,440 –> 00:17:37,360
از داده های ما خوب است
468
00:17:37,360 –> 00:17:40,720
و بنابراین ما اینجا هستیم، بنابراین ما می
469
00:17:40,720 –> 00:17:43,360
خواهیم با نوع کدگذاری بخشی
470
00:17:43,360 –> 00:17:44,720
از آزمایشگاه شروع کنیم
471
00:17:44,720 –> 00:17:46,240
و تعجب می کنم که
472
00:17:46,240 –> 00:17:48,640
در اینجا مکث کنم و مطمئن شوم که همه در
473
00:17:48,640 –> 00:17:50,799
سرعت هستند و آیا هر گونه سوالی وجود دارد از
474
00:17:50,799 –> 00:17:53,919
خودتان
475
00:17:56,080 –> 00:17:58,840
متشکریم که به آن سوال پاسخ
476
00:17:58,840 –> 00:18:01,840
477
00:18:02,400 –> 00:18:04,290
دادید، خیلی خوب است
478
00:18:04,290 –> 00:18:07,120
[موسیقی
479
00:18:07,120 –> 00:18:10,320
] خیلی خوب است، بنابراین من ادامه می دهم
480
00:18:10,320 –> 00:18:12,840
و ما را شروع می کنم اگر تازه وارد
481
00:18:12,840 –> 00:18:14,960
نوت بوک های jupyter هستید، اجازه دهید من فقط به شما خیلی سریع بگویم
482
00:18:14,960 –> 00:18:15,360
483
00:18:15,360 –> 00:18:18,720
آموزش آنچه شما در اینجا دارید و من
484
00:18:18,720 –> 00:18:20,640
از این حالت خارج می شوم تا
485
00:18:20,640 –> 00:18:22,720
صفحه نمایش شما را بیشتر از حالت ارائه من تقلید کند،
486
00:18:22,720 –> 00:18:23,440
487
00:18:23,440 –> 00:18:25,840
می بینید که وقتی سلولی
488
00:18:25,840 –> 00:18:27,520
را برجسته می کنم می توانم هر سلولی
489
00:18:27,520 –> 00:18:29,600
را که نوار آبی را در سمت چپ می بینید برجسته کنم
490
00:18:29,600 –> 00:18:31,200
به این معنی است که آن سلول در حال حاضر
491
00:18:31,200 –> 00:18:33,679
هایلایت شده یا فعال است،
492
00:18:33,679 –> 00:18:35,600
می توانید در داخل آن یک سلول کد
493
00:18:35,600 –> 00:18:38,320
کلیک کنید و چیزهایی را انتخاب کنید و در واقع آن را تغییر دهید،
494
00:18:38,320 –> 00:18:41,600
لطفاً فعلاً این کار را نکنید، اما می بینید
495
00:18:41,600 –> 00:18:42,960
که چگونه می توانید در واقع
496
00:18:42,960 –> 00:18:46,480
کد خود را ویرایش کنید و کد خود را برای
497
00:18:46,480 –> 00:18:49,760
اجرای یک کد اضافه کنید. سلول باید um
498
00:18:49,760 –> 00:18:52,799
shift را بزنید و وارد کنید تا
499
00:18:52,799 –> 00:18:54,320
یا k حالا می توانید مکان نما را
500
00:18:54,320 –> 00:18:57,280
در داخل داشته باشید که آن را فعال و سبز می کند
501
00:18:57,280 –> 00:19:00,160
یا فقط می توانید آن را انتخاب کنید که
502
00:19:00,160 –> 00:19:01,200
503
00:19:01,200 –> 00:19:04,160
وقتی انتخاب شد فقط آبی است اگر Shift را بزنید و
504
00:19:04,160 –> 00:19:05,280
وارد
505
00:19:05,280 –> 00:19:09,520
کنید سلول اجرا می شود و
506
00:19:09,520 –> 00:19:12,000
در نهایت می بینید که یک عدد در سمت چپ بالای صفحه ظاهر می شود.
507
00:19:12,000 –> 00:19:13,679
سلول در
508
00:19:13,679 –> 00:19:16,799
اینجا نشان می دهد که آن عدد
509
00:19:16,799 –> 00:19:18,559
اساساً می گوید این
510
00:19:18,559 –> 00:19:20,720
اولین سلول است زیرا سلول من شماره یک است
511
00:19:20,720 –> 00:19:23,280
که من در این نوت بوک اجرا کرده ام،
512
00:19:23,280 –> 00:19:26,000
شما لازم نیست سلول ها را به صورت متوالی
513
00:19:26,000 –> 00:19:27,600
اجرا کنید، می توانید آنها را بدون ترتیب اجرا کنید
514
00:19:27,600 –> 00:19:29,760
که یک نوع خوب است و بد،
515
00:19:29,760 –> 00:19:31,600
گاهی اوقات گیج کننده است
516
00:19:31,600 –> 00:19:33,840
زیرا این به شما بستگی دارد که فردی
517
00:19:33,840 –> 00:19:35,280
که این نوت بوک
518
00:19:35,280 –> 00:19:36,640
را اجرا می کند، تعیین کنید که می دانید چگونه می خواهید
519
00:19:36,640 –> 00:19:39,039
چیزها را اجرا کنید، معمولاً می خواهید
520
00:19:39,039 –> 00:19:40,559
آنها را از بالا به پایین اجرا کنید، اما ممکن
521
00:19:40,559 –> 00:19:42,720
است مواردی وجود داشته باشد که شیفت enter را انجام ندهید.
522
00:19:42,720 –> 00:19:46,160
شما
523
00:19:46,160 –> 00:19:48,400
مستقیماً به سلول بعدی می روید اگر فقط
524
00:19:48,400 –> 00:19:50,240
می خواهید یک سلول واحد را اجرا کنید و در
525
00:19:50,240 –> 00:19:52,080
آن سلول بمانید، ctrl enter است
526
00:19:52,080 –> 00:19:54,160
تا بتوانم کنترل enter را روی یک سلول فعال اجرا
527
00:19:54,160 –> 00:19:56,240
کنم و من را به پایین اسکرول نکند،
528
00:19:56,240 –> 00:19:58,080
فقط من را در آن سلول نگه می دارد و متوجه می شوم
529
00:19:58,080 –> 00:20:00,080
شماره mber one شماره دو را تغییر داده است
530
00:20:00,080 –> 00:20:02,400
و می گوید که من این سلول را اجرا کرده
531
00:20:02,400 –> 00:20:04,720
ام و این دومین کاری است که در این دفترچه شماره دو انجام داده ام، بسیار
532
00:20:04,720 –> 00:20:06,880
533
00:20:06,880 –> 00:20:08,880
خوب، می دانم که این برای اکثر شما مرور است،
534
00:20:08,880 –> 00:20:10,400
اما همچنین می دانم که تعداد خوبی
535
00:20:10,400 –> 00:20:12,080
از افراد وجود دارند که اولین بار می پوشد
536
00:20:12,080 –> 00:20:13,280
537
00:20:13,280 –> 00:20:14,400
خوب است من می خواهم به حالت ارائه خود برگردم،
538
00:20:14,400 –> 00:20:16,640
539
00:20:16,640 –> 00:20:19,520
540
00:20:19,520 –> 00:20:20,000
541
00:20:20,000 –> 00:20:21,520
اگر عددی را نمی بینید باید یک عدد را در بالا سمت چپ اینجا ببینید، به این معنی است
542
00:20:21,520 –> 00:20:23,840
که سلول را اجرا نکرده اید یا
543
00:20:23,840 –> 00:20:25,840
مشکلاتی وجود دارد، بنابراین امیدوارم که شما
544
00:20:25,840 –> 00:20:27,919
عددی را ببینید که
545
00:20:27,919 –> 00:20:31,440
یا یک یا دو خوب است، به این معنی که ما
546
00:20:31,440 –> 00:20:31,760
547
00:20:31,760 –> 00:20:34,159
همه این کتابخانه ها را اجرا کرده ایم، کتابخانه های زیادی
548
00:20:34,159 –> 00:20:36,080
در این آزمایشگاه
549
00:20:36,080 –> 00:20:38,720
پانداهای سودا پی وجود دارد و من همه
550
00:20:38,720 –> 00:20:39,679
اینها را
551
00:20:39,679 –> 00:20:43,280
با مرور آنها توضیح خواهم
552
00:20:43,280 –> 00:20:44,960
داد. آیا قرار است انجام دهیم،
553
00:20:44,960 –> 00:20:48,000
دوباره دادههای خود را آماده میکنیم، اینها همه
554
00:20:48,000 –> 00:20:48,880
عناصری هستند که به
555
00:20:48,880 –> 00:20:51,360
زودی در سمت چپ تولید میکنیم،
556
00:20:51,360 –> 00:20:52,080
این لا
557
00:20:52,080 –> 00:20:54,159
اوه امیدوارم بیشتر شما در l.a هستید،
558
00:20:54,159 –> 00:20:56,080
اما شاید بسیاری از شما از راه دور باشید.
559
00:20:56,080 –> 00:20:59,520
خارج از شهر و مرزهایی
560
00:20:59,520 –> 00:21:01,440
که تقریباً اینجا در تاریکی می بینید، شهر است
561
00:21:01,440 –> 00:21:03,200
562
00:21:03,200 –> 00:21:05,039
دادههای جرم و جنایتی که ما وارد میکنیم مربوط به
563
00:21:05,039 –> 00:21:07,039
لپد در نقطههای قرمز است
564
00:21:07,039 –> 00:21:09,280
که حوزه قضایی لپد فقط شهر لا را پوشش میدهد،
565
00:21:09,280 –> 00:21:10,640
بنابراین میتوانید
566
00:21:10,640 –> 00:21:13,039
شکافهای کوچکی را در اینجا از سانتا مونیکا و
567
00:21:13,039 –> 00:21:15,120
سایر مناطقی که جزئی از حوزه قضایی لپد نیستند مشاهده کنید.
568
00:21:15,120 –> 00:21:16,960
569
00:21:16,960 –> 00:21:19,039
این مجموعه دادهها
570
00:21:19,039 –> 00:21:21,039
دقیقاً روی هم بسیار فضایی
571
00:21:21,039 –> 00:21:22,080
هستند
572
00:21:22,080 –> 00:21:24,159
و این همه نوع
573
00:21:24,159 –> 00:21:26,080
مؤلفه فضایی است که ما با آن کار
574
00:21:26,080 –> 00:21:28,400
میکنیم، قرار است به دادهها بپیوندیم که
575
00:21:28,400 –> 00:21:31,200
آنها را به صورت فضایی توسط گروههای بلوک سرشماری کمیت کنیم
576
00:21:31,200 –> 00:21:32,640
که به ما امکان میدهد این choropleth را تولید کنیم.
577
00:21:32,640 –> 00:21:34,720
نقشه های خروجی نهایی
578
00:21:34,720 –> 00:21:37,760
در اینجا بسیار خوب است و این
579
00:21:37,760 –> 00:21:39,440
اساساً قسمت اول کارگاه است
580
00:21:39,440 –> 00:21:40,799
و قسمت دوم قرار است همبستگی خودکار فضایی را به درستی انجام دهد،
581
00:21:40,799 –> 00:21:43,440
582
00:21:43,440 –> 00:21:46,480
بنابراین گروه های بلوک
583
00:21:46,480 –> 00:21:48,640
ما از گروه های بلوکی
584
00:21:48,640 –> 00:21:50,880
که بخشی از
585
00:21:50,880 –> 00:21:52,799
اداره سرشماری هستند استفاده خواهیم کرد. اداره سرشماری ایالات متحده
586
00:21:52,799 –> 00:21:54,400
587
00:21:54,400 –> 00:21:57,280
مرزهایی را برای کل
588
00:21:57,280 –> 00:21:58,000
کشور
589
00:21:58,000 –> 00:22:01,840
بر اساس کمپ های جمعیتی ایجاد می کند،
590
00:22:01,840 –> 00:22:04,799
بنابراین تقریباً یک سرشماری حدود
591
00:22:04,799 –> 00:22:06,640
5000 نفر را در
592
00:22:06,640 –> 00:22:10,000
خود دارد و مرزهای آنها توسط
593
00:22:10,000 –> 00:22:13,360
اداره سرشماری یک دولت تعیین شده است. آژانس داخلی
594
00:22:13,360 –> 00:22:16,480
یک گروه بلوکی یک
595
00:22:16,480 –> 00:22:19,120
تراکت سرشماری با حدود 5000 نفر
596
00:22:19,120 –> 00:22:22,640
را به اجزای کوچکتر تقسیم می کند
597
00:22:22,640 –> 00:22:24,799
بسته به تحقیق شما ممکن است
598
00:22:24,799 –> 00:22:26,320
بخواهید از تله های سرشماری استفاده کنید
599
00:22:26,320 –> 00:22:28,960
که دوباره به اندازه 5000
600
00:22:28,960 –> 00:22:30,480
نفر است، بنابراین من
601
00:22:30,480 –> 00:22:31,440
می گویم
602
00:22:31,440 –> 00:22:33,440
یا شما ممکن است در مورد یک محله باشد. میخواهید گروههای بلوکی را انجام دهید
603
00:22:33,440 –> 00:22:35,039
که همانطور که از نامش پیداست،
604
00:22:35,039 –> 00:22:38,720
گروهی از بلوکها هستند. ریزدانگی
605
00:22:38,720 –> 00:22:41,919
تحقیق شما ممکن است شما را وادار
606
00:22:41,919 –> 00:22:43,360
کند یکی یا دیگری را انتخاب کنید،
607
00:22:43,360 –> 00:22:45,120
بنابراین اگر در سطح محلهای تنگ کار
608
00:22:45,120 –> 00:22:46,720
میکنید، ممکن است بخواهید بروید.
609
00:22:46,720 –> 00:22:48,080
تا گروه بلوک،
610
00:22:48,080 –> 00:22:49,679
اگر در سطح شهرستان کار می کنید،
611
00:22:49,679 –> 00:22:51,039
ممکن است بخواهید در سطح تراکت سرشماری بمانید،
612
00:22:51,039 –> 00:22:54,000
613
00:22:54,000 –> 00:22:57,120
داده هایی که ما از آنها استفاده خواهیم کرد.
614
00:22:57,120 –> 00:22:58,880
615
00:22:58,880 –> 00:23:00,400
616
00:23:00,400 –> 00:23:02,159
از گزارشگر سرشماری شنیدهام
617
00:23:02,159 –> 00:23:05,039
، این منبع واقعاً فوقالعادهای
618
00:23:05,039 –> 00:23:07,200
است و کاملاً رایگان است، زیرا این
619
00:23:07,200 –> 00:23:09,039
دادهها رایگان است، درست است، منظورم این است که ما آن را
620
00:23:09,039 –> 00:23:10,240
با دلارهای مالیاتی خود میپردازیم،
621
00:23:10,240 –> 00:23:11,760
بنابراین اگر به
622
00:23:11,760 –> 00:23:13,679
وبسایت اداره سرشماری بروید، میتوانید
623
00:23:13,679 –> 00:23:16,480
اطلاعات سرشماری را دانلود کنید. در هر نقطه ای
624
00:23:16,480 –> 00:23:17,840
از کشور تنظیم شده است،
625
00:23:17,840 –> 00:23:21,200
اما گاهی اوقات پیمایش دشوار است،
626
00:23:21,200 –> 00:23:23,600
بنابراین
627
00:23:23,600 –> 00:23:25,200
سایت های خواهر یا
628
00:23:25,200 –> 00:23:27,919
سایت هایی وجود دارند که توسط سایر سازمان های
629
00:23:27,919 –> 00:23:30,320
دانشگاهی یا غیرانتفاعی ساخته شده اند
630
00:23:30,320 –> 00:23:33,600
که صراحتاً استفاده از آنها بسیار آسان تر است،
631
00:23:33,600 –> 00:23:36,400
بنابراین وب سایت اداره سرشماری متاسفم.
632
00:23:36,400 –> 00:23:37,760
633
00:23:37,760 –> 00:23:40,960
وبسایت گزارشگر سرشماری به شما امکان میدهد که اساساً
634
00:23:40,960 –> 00:23:41,760
هر
635
00:23:41,760 –> 00:23:45,039
مجموعه دادهای را از سرشماری دانلود کنید،
636
00:23:45,039 –> 00:23:49,200
فقط با پر کردن کادرهای متنی
637
00:23:49,200 –> 00:23:51,600
چیزی شبیه به شما میتوانید آن را پر کنید
638
00:23:51,600 –> 00:23:52,480
639
00:23:52,480 –> 00:23:55,679
و میتوانید جداول مسابقه را دریافت کنید
640
00:23:55,679 –> 00:23:57,200
و سپس آنها را
641
00:23:57,200 –> 00:23:59,760
برای پروژه خود دانلود کنید. همچنین با
642
00:23:59,760 –> 00:24:00,720
دانش زیادی همراه است،
643
00:24:00,720 –> 00:24:03,760
درست به شما می گوید که این جمله چگونه کار می
644
00:24:03,760 –> 00:24:04,880
645
00:24:04,880 –> 00:24:06,559
646
00:24:06,559 –> 00:24:08,640
647
00:24:08,640 –> 00:24:09,760
648
00:24:09,760 –> 00:24:12,559
649
00:24:12,559 –> 00:24:14,159
کند. من زیاد وارد
650
00:24:14,159 –> 00:24:14,559
651
00:24:14,559 –> 00:24:17,360
آن نمی شوم، این یک کارگاه سرشماری نیست، اما
652
00:24:17,360 –> 00:24:18,000
صفحه فرود
653
00:24:18,000 –> 00:24:20,799
برای داده های ما کل جمعیت
654
00:24:20,799 –> 00:24:21,440
بسیار ساده
655
00:24:21,440 –> 00:24:23,440
کل جمعیت بر اساس گروه بلوک سرشماری است.
656
00:24:23,440 –> 00:24:24,720
657
00:24:24,720 –> 00:24:28,559
شما
658
00:24:28,559 –> 00:24:32,080
به یک نوع جدول در صفحه گزارشگر سرشماری
659
00:24:32,080 –> 00:24:33,360
660
00:24:33,360 –> 00:24:36,559
فرود می آیید که می دانید
661
00:24:36,559 –> 00:24:38,559
من فکر می کنم این باید بسیار برجسته تر باشد
662
00:24:38,559 –> 00:24:40,320
اما این
663
00:24:40,320 –> 00:24:42,559
دکمه جادویی است در اینجا دکمه داده های
664
00:24:42,559 –> 00:24:45,440
دانلود را می توانید به عنوان یک فایل csv
665
00:24:45,440 –> 00:24:49,440
یا geojson دانلود کنید. فایل یک فایل geojson
666
00:24:49,440 –> 00:24:52,960
فرمتی است که به شما امکان می دهد
667
00:24:52,960 –> 00:24:56,000
با پایتون در geopandas کار
668
00:24:56,000 –> 00:24:59,520
کنید، در واقع فرمت مورد علاقه من است
669
00:24:59,520 –> 00:25:02,000
و با یک ستون هندسه همراه است،
670
00:25:02,000 –> 00:25:04,080
بنابراین بلافاصله می توانید این داده ها را نقشه برداری کنید،
671
00:25:04,080 –> 00:25:05,039
672
00:25:05,039 –> 00:25:09,200
من قبلاً آن را در مخزن um خود گنجانده ام.
673
00:25:09,200 –> 00:25:11,360
ما امروز از آن استفاده میکنیم، بنابراین نیازی نیست
674
00:25:11,360 –> 00:25:12,880
آن را دانلود کنید، اما فقط به عنوان
675
00:25:12,880 –> 00:25:14,320
مرجع برای
676
00:25:14,320 –> 00:25:16,240
پروژه خود، ممکن است بخواهید بدانید
677
00:25:16,240 –> 00:25:18,720
که در دسترس شما
678
00:25:18,720 –> 00:25:21,919
است، سلول کد
679
00:25:21,919 –> 00:25:24,720
بعدی که در اینجا خاکستری است، آن
680
00:25:24,720 –> 00:25:25,840
داده را وارد میکند
681
00:25:25,840 –> 00:25:29,120
تا gpd بماند. برای
682
00:25:29,120 –> 00:25:29,760
کتابخانه
683
00:25:29,760 –> 00:25:31,919
geopanthers، بنابراین زمانی که من وارد کردن دادههای
684
00:25:31,919 –> 00:25:33,600
کتابخانه را انجام دادم، به آن
685
00:25:33,600 –> 00:25:37,919
نام مستعار gpd دادم، بنابراین gpd مخفف
686
00:25:37,919 –> 00:25:40,559
geopandas زنجیرههای نقطهای است، دستوری که میگوید هی،
687
00:25:40,559 –> 00:25:42,559
ما از یکی از
688
00:25:42,559 –> 00:25:44,240
توابع کتابخانههای geopandas به نام
689
00:25:44,240 –> 00:25:47,440
فایل خواندنی استفاده میکنیم. خ بلافاصله
690
00:25:47,440 –> 00:25:50,400
و در پرانتزهایی که من آرگومانها را میپذیرم،
691
00:25:50,400 –> 00:25:51,600
692
00:25:51,600 –> 00:25:54,080
تنها کاری که باید در یک
693
00:25:54,080 –> 00:25:55,120
نقل قول انجام دهید
694
00:25:55,120 –> 00:25:58,880
این است که به آن بگویید که آن فایل در کجا قرار دارد،
695
00:25:58,880 –> 00:26:01,600
بنابراین از آنجایی که من آن را دانلود کردهام و
696
00:26:01,600 –> 00:26:02,640
در یک پوشه
697
00:26:02,640 –> 00:26:04,640
داده قرار دادهام، مسیر نسبی از جایی است که این
698
00:26:04,640 –> 00:26:06,320
نوتبوک قرار دارد. بنابراین این اسلش داده
699
00:26:06,320 –> 00:26:08,480
و سپس نام طولانی
700
00:26:08,480 –> 00:26:10,320
فایل geojson است که من آن را تغییر نداده ام این
701
00:26:10,320 –> 00:26:11,440
دقیقاً همان چیزی است که در آن
702
00:26:11,440 –> 00:26:14,799
آمده است، زیرا از گزارشگر سرشماری
703
00:26:14,799 –> 00:26:16,880
من این gdf را می نامم که در واقع
704
00:26:16,880 –> 00:26:18,640
مخفف قاب داده جغرافیایی است،
705
00:26:18,640 –> 00:26:22,320
بنابراین ادامه دهید و آن سلول را راه اندازی کنید
706
00:26:22,320 –> 00:26:25,679
و بیایید به سلول بعدی برویم و بیایید
707
00:26:25,679 –> 00:26:27,919
اطلاعاتی را که در حال حاضر به نوتبوک خود وارد کردهایم کاوش کنیم،
708
00:26:27,919 –> 00:26:30,720
709
00:26:30,720 –> 00:26:32,960
بنابراین قاب دادههای جغرافیایی gdf نامی است که من
710
00:26:32,960 –> 00:26:34,240
به این داده دادم،
711
00:26:34,240 –> 00:26:36,799
سر نقطه به ما اجازه میدهد به
712
00:26:36,799 –> 00:26:37,520
713
00:26:37,520 –> 00:26:40,400
پنج ردیف اول دادهها درست نگاه کنیم. در اینجا
714
00:26:40,400 –> 00:26:41,360
715
00:26:41,360 –> 00:26:43,039
برای کسانی از شما که تازه وارد پایتون هستید
716
00:26:43,039 –> 00:26:45,279
، میخواهم چند کار را
717
00:26:45,279 –> 00:26:46,720
بچشید که میتوانید به محض
718
00:26:46,720 –> 00:26:48,640
داشتن اطلاعات در نوتبوک خود انجام دهید،
719
00:26:48,640 –> 00:26:50,559
بنابراین میدانید که بسیار
720
00:26:50,559 –> 00:26:52,080
ساده است، فقط یک متغیر وجود دارد. کل
721
00:26:52,080 –> 00:26:54,080
جمعیت
722
00:26:54,080 –> 00:26:55,440
و همانطور که اشاره کردم همراه با
723
00:26:55,440 –> 00:26:58,240
ستون هندسه است و یک شناسه جغرافیایی
724
00:26:58,240 –> 00:27:01,679
در اینجا وجود دارد که اساساً یک کد fips
725
00:27:01,679 –> 00:27:02,799
726
00:27:02,799 –> 00:27:05,919
یک کد شناسایی فدرال است که
727
00:27:05,919 –> 00:27:07,279
ما از آن به
728
00:27:07,279 –> 00:27:10,159
عنوان یک شناسه منحصر به فرد برای این گروه های بلوک استفاده
729
00:27:10,159 –> 00:27:12,480
730
00:27:12,640 –> 00:27:15,360
می کنیم.
731
00:27:15,360 –> 00:27:16,559
دستور دیگری را
732
00:27:16,559 –> 00:27:18,240
که به پنج سطر اول نگاه کردیم
733
00:27:18,240 –> 00:27:19,679
، یکی از دستورات مورد علاقه من است،
734
00:27:19,679 –> 00:27:21,520
زیرا اطلاعات زیادی در
735
00:27:21,520 –> 00:27:24,799
مورد دادههایی که وارد کردهایم به شما میگوید و
736
00:27:24,799 –> 00:27:26,559
نه تنها
737
00:27:26,559 –> 00:27:28,480
نام ستونها را درست به ما میدهد. بنابراین ما
738
00:27:28,480 –> 00:27:30,240
نام ستونها
739
00:27:30,240 –> 00:27:32,159
را داریم و به ما میگوید چند ورودی وجود دارد
740
00:27:32,159 –> 00:27:33,679
، خوب است
741
00:27:33,679 –> 00:27:35,760
تعداد رکوردهای جدول ما چقدر است، بنابراین
742
00:27:35,760 –> 00:27:39,840
میدانیم که 2516 رکورد آوردهایم،
743
00:27:39,840 –> 00:27:41,440
بنابراین این بدان معناست
744
00:27:41,440 –> 00:27:44,000
که 2500 گروه بلوک در جدول وجود دارد.
745
00:27:44,000 –> 00:27:45,919
شهر لا
746
00:27:45,919 –> 00:27:48,399
ام اما چیزهای بیشتری در اینجا وجود دارد، مثلاً
747
00:27:48,399 –> 00:27:49,279
به ما
748
00:27:49,279 –> 00:27:53,760
میگوید چند تا از این um
749
00:27:53,760 –> 00:27:57,520
که میدانید ردیفها یا ستونها نیستند،
750
00:27:57,520 –> 00:28:00,000
بنابراین اگر مجموعه داده دیگری را وارد کنید
751
00:28:00,000 –> 00:28:00,559
و
752
00:28:00,559 –> 00:28:02,399
به نوعی نامرتب است، ممکن است
753
00:28:02,399 –> 00:28:04,559
ستونهایی وجود داشته باشند که مقدار زیادی null داشته باشند. ارزش ها
754
00:28:04,559 –> 00:28:06,720
و این خوب است بدانید که در یک نگاه
755
00:28:06,720 –> 00:28:08,720
درست ممکن است مانند خدای من باشید
756
00:28:08,720 –> 00:28:12,880
که من 500 رکورد UH را از دست
757
00:28:12,880 –> 00:28:15,840
داده ام، اوه اوه و در نهایت مهم ترین
758
00:28:15,840 –> 00:28:17,279
آن نوع داده است،
759
00:28:17,279 –> 00:28:19,120
بنابراین با یک دستور می توانید
760
00:28:19,120 –> 00:28:20,480
نوع داده هر
761
00:28:20,480 –> 00:28:24,000
کدام از این ستون ها را نیز دریابید.
762
00:28:24,000 –> 00:28:26,080
بنابراین ما یک شی داریم که
763
00:28:26,080 –> 00:28:27,279
اساساً متن است،
764
00:28:27,279 –> 00:28:30,000
بنابراین من می دانم که شناسه من یک نوع داده متنی است
765
00:28:30,000 –> 00:28:30,480
766
00:28:30,480 –> 00:28:34,720
و می دانم که مقدار کل جمعیت
767
00:28:34,720 –> 00:28:38,000
من که باید عددی
768
00:28:38,000 –> 00:28:41,120
باشد، اگر بخواهیم کمیت کنیم، شناور
769
00:28:41,120 –> 00:28:43,440
شناور نیست، به این معنی است که می تواند باشد. یک اعشار
770
00:28:43,440 –> 00:28:44,799
که عالی
771
00:28:44,799 –> 00:28:48,000
است ستون هندسه به این دلیل است که ما از geopandas استفاده می
772
00:28:48,000 –> 00:28:51,840
کنیم، آن را به عنوان یک نوع داده هندسی تشخیص می دهد، به
773
00:28:51,840 –> 00:28:54,720
این معنی که
774
00:28:54,720 –> 00:28:56,840
فورا آماده نقشه برداری است، بسیار
775
00:28:56,840 –> 00:29:00,559
خوب، پس بیایید چند کار
776
00:29:00,559 –> 00:29:02,159
دیگر را انجام دهیم که می خواهیم کوتاه کنیم.
777
00:29:02,159 –> 00:29:03,840
دادهها را تا حداقل
778
00:29:03,840 –> 00:29:08,000
ستونها انجام دهید، بنابراین برای انجام این کار در
779
00:29:08,000 –> 00:29:11,039
پایتون در پانداها، آن
780
00:29:11,039 –> 00:29:13,840
را دوباره تعریف
781
00:29:13,840 –> 00:29:16,000
782
00:29:16,000 –> 00:29:19,279
میکنم، بنابراین با گفتن اینکه میخواهم gdf
783
00:29:19,279 –> 00:29:22,720
فقط این سه ستون را شامل شود، از شر یک ستون خلاص میشوم. اساساً
784
00:29:22,720 –> 00:29:24,840
چیزی که در خارج می بینید
785
00:29:24,840 –> 00:29:28,000
براکتهای مربعی یک لیست یک لیست پایتون
786
00:29:28,000 –> 00:29:31,360
از تنها ستونهایی است که من
787
00:29:31,360 –> 00:29:34,640
درست میخواهم و چه کارهایی انجام میدهند و در
788
00:29:34,640 –> 00:29:36,480
ادامه نام این ستونها را تغییر
789
00:29:36,480 –> 00:29:39,039
میدهم، میبینید که من اینجا چه میکنم، بنابراین
790
00:29:39,039 –> 00:29:41,279
دادهها را به سه ستون برش میدهم
791
00:29:41,279 –> 00:29:43,919
و سپس ستون ها را دوباره تعریف کنید متأسفانه
792
00:29:43,919 –> 00:29:44,880
793
00:29:44,880 –> 00:29:48,640
نام ستون ها را تغییر دهید تا ستون های نقطه gdf به
794
00:29:48,640 –> 00:29:51,120
چیزی باشد که کاربر پسندتر باشد، بنابراین
795
00:29:51,120 –> 00:29:53,200
من نمی دانم نسخه 01
796
00:29:53,200 –> 00:29:55,279
چیست، منظورم این است که می دانم که این
797
00:29:55,279 –> 00:29:57,120
شماره جدول اداره سرشماری است،
798
00:29:57,120 –> 00:29:59,760
اما هیچ کس دیگری نمی داند که کل آن است.
799
00:29:59,760 –> 00:30:01,039
بسیار
800
00:30:01,039 –> 00:30:03,120
خوب است و من
801
00:30:03,120 –> 00:30:06,559
ستون هندسه را به همین نام ترک
802
00:30:06,559 –> 00:30:08,960
می کنم و بیایید به این داده ها نگاهی بیندازیم،
803
00:30:08,960 –> 00:30:10,559
بنابراین فقط یک دستور دیگر
804
00:30:10,559 –> 00:30:13,440
نقطه سر نقطه دم پنج ردیف آخر را به ما نشان می دهد
805
00:30:13,440 –> 00:30:14,000
806
00:30:14,000 –> 00:30:17,440
و این همان چیزی است که اکنون
807
00:30:17,440 –> 00:30:19,840
داریم سه ستون من از
808
00:30:19,840 –> 00:30:21,520
ستون خطا خلاص
809
00:30:21,520 –> 00:30:23,279
شدم، بنابراین ما fipsco totalpop داریم و
810
00:30:23,279 –> 00:30:26,480
ستون هندسه
811
00:30:27,360 –> 00:30:30,240
اکنون اوه گزارشگر سرشماری کاری را انجام می دهد
812
00:30:30,240 –> 00:30:31,200
که
813
00:30:31,200 –> 00:30:33,679
همه ما باید از آن آگاه باشیم و
814
00:30:33,679 –> 00:30:34,320
815
00:30:34,320 –> 00:30:38,320
یک ردیف در سطر آخر جدول خود دارد
816
00:30:38,320 –> 00:30:40,399
که همه چیز را خلاصه می کند. که شما
817
00:30:40,399 –> 00:30:41,360
شامل uded
818
00:30:41,360 –> 00:30:43,279
بنابراین این یک نوع خوب و بد است درست
819
00:30:43,279 –> 00:30:44,880
است عالی است هی می دانم
820
00:30:44,880 –> 00:30:46,799
که کل جمعیت شهر
821
00:30:46,799 –> 00:30:50,080
لس آنجلس 4 میلیون نفر است
822
00:30:50,080 –> 00:30:51,360
اما بد است زیرا اگر در حال انجام
823
00:30:51,360 –> 00:30:53,120
تجزیه و تحلیل آماری هستید و نمی دانید
824
00:30:53,120 –> 00:30:55,039
که یکی از rows خلاصه کامل است
825
00:30:55,039 –> 00:30:58,240
، همه دادههای شما را
826
00:30:58,240 –> 00:30:59,519
منحرف میکند، خوب این همان چیزی است که برای
827
00:30:59,519 –> 00:31:01,679
اولین بار که این دادهها را دانلود کردم برای من اتفاق افتاد،
828
00:31:01,679 –> 00:31:04,559
بنابراین باید از شر آن ردیف خلاص شویم
829
00:31:04,559 –> 00:31:06,559
، بسیار خوب، ما یک روش پایتون دیگری را در اینجا یاد گرفتیم
830
00:31:06,559 –> 00:31:08,559
که چگونه یک را رها کنیم.
831
00:31:08,559 –> 00:31:09,679
ستون بسیار
832
00:31:09,679 –> 00:31:11,600
خوب است، احتمالاً راههای مختلفی برای
833
00:31:11,600 –> 00:31:13,039
انجام آن وجود دارد، اما اگر من
834
00:31:13,039 –> 00:31:15,840
دم را خروجی میدهم و شماره شناسه را
835
00:31:15,840 –> 00:31:17,519
در
836
00:31:17,519 –> 00:31:19,440
اینجا میبینم، میتوانم آن را با دستور قطره نقطه رها کنم،
837
00:31:19,440 –> 00:31:20,640
838
00:31:20,640 –> 00:31:22,320
بنابراین توجه کنید کاری که من اینجا انجام میدهم این است که
839
00:31:22,320 –> 00:31:24,799
gdf را دوباره تعریف میکنم.
840
00:31:24,799 –> 00:31:28,480
gdf بدون ردیف خلاصه
841
00:31:28,480 –> 00:31:31,600
خوب است، نام آن را تغییر نمیدهم،
842
00:31:31,600 –> 00:31:33,200
آن را به همان شکل نگه میدارم،
843
00:31:33,200 –> 00:31:35,430
بنابراین اکنون که این کار را انجام میدهم
844
00:31:35,430 –> 00:31:36,799
[Music]
845
00:31:36,799 –> 00:31:39,120
ما هستیم، یک رکورد کمتر در جدول خود داریم،
846
00:31:39,120 –> 00:31:41,039
خوب یکی دیگر از کارهایی که میخواستم
847
00:31:41,039 –> 00:31:41,360
انجام دهم این
848
00:31:41,360 –> 00:31:44,880
است که کد fips بنابراین
849
00:31:44,880 –> 00:31:46,880
کد fips در اینجا همانطور که می بینید
850
00:31:46,880 –> 00:31:48,880
شامل
851
00:31:48,880 –> 00:31:52,559
یک پنج صفر است صفر صفر
852
00:31:52,559 –> 00:31:55,760
ما می خواهم از شر آن قسمت از
853
00:31:55,760 –> 00:31:56,640
کد fips خلاص شوم
854
00:31:56,640 –> 00:32:01,440
زیرا یک گروه بلوک سرشماری از
855
00:32:01,440 –> 00:32:04,399
نظر شناسه در واقع با صفر
856
00:32:04,399 –> 00:32:05,840
شش
857
00:32:05,840 –> 00:32:10,240
صفر شش شروع می شود، کد fips برای کالیفرنیا است،
858
00:32:10,240 –> 00:32:14,559
بنابراین دو رقم دو رقمی با صفر شروع می شود و
859
00:32:14,559 –> 00:32:17,200
صفر سه هفت است. پنجمین کد شهرستان
860
00:32:17,200 –> 00:32:17,679
861
00:32:17,679 –> 00:32:20,799
برای لا کانتی درست است، بنابراین
862
00:32:20,799 –> 00:32:24,399
ما سی و هفتمین شهرستان در کالیفرنیا هستیم
863
00:32:24,399 –> 00:32:28,240
و سپس آنچه در زیر می آید
864
00:32:28,240 –> 00:32:30,799
شماره تراکت سرشماری در شش رقم است و سپس
865
00:32:30,799 –> 00:32:32,640
شماره نهایی
866
00:32:32,640 –> 00:32:36,000
شماره گروه بلوک است، احتمالاً اطلاعات زیادی وجود دارد،
867
00:32:36,000 –> 00:32:37,360
868
00:32:37,360 –> 00:32:39,519
بنابراین ما می خواهیم یک پنج صفر
869
00:32:39,519 –> 00:32:41,200
صفر صفر ما را رها کنید
870
00:32:41,200 –> 00:32:43,120
و تنها کاری که میخواهیم اینجا انجام دهیم این است که
871
00:32:43,120 –> 00:32:44,559
872
00:32:44,559 –> 00:32:49,360
بگوییم کد fips را بردارید و
873
00:32:49,360 –> 00:32:52,000
این قسمت را با هیچ چیز درست جایگزین کنید، بنابراین
874
00:32:52,000 –> 00:32:54,799
ما در حال جستجو و جایگزینی هستیم
875
00:32:54,799 –> 00:32:57,120
و زمانی که انجام دادیم متوجه خواهید شد
876
00:32:57,120 –> 00:32:58,480
که کد fips اکنون
877
00:32:58,480 –> 00:33:01,440
در واقع فقط آن اعداد را دارد،
878
00:33:01,440 –> 00:33:03,360
879
00:33:03,360 –> 00:33:06,480
بسیار خوب، بنابراین آخرین کاری که میخواهم
880
00:33:06,480 –> 00:33:07,360
انجام دهم این
881
00:33:07,360 –> 00:33:10,480
است که از شر برخی از مقادیر خلاص میشوم، خوب
882
00:33:10,480 –> 00:33:13,360
و میخواهم از
883
00:33:13,679 –> 00:33:17,600
یک دستور مرتب سازی بنابراین ما داده ای داشته
884
00:33:17,600 –> 00:33:19,679
باشیم که بتوانیم مقادیر را با استفاده از so مرتب کنیم rt دستور pandas را
885
00:33:19,679 –> 00:33:21,679
ارزش گذاری می کند
886
00:33:21,679 –> 00:33:23,039
و من
887
00:33:23,039 –> 00:33:24,640
اسناد را در اینجا دارم اگر می خواهید آن را بررسی
888
00:33:24,640 –> 00:33:26,080
889
00:33:26,080 –> 00:33:28,880
کنید دستور اساساً می پذیرد um
890
00:33:28,880 –> 00:33:30,640
باید به خوبی تعریف کنید که می
891
00:33:30,640 –> 00:33:31,279
خواهید بر اساس چه ستونی مرتب کنید
892
00:33:31,279 –> 00:33:32,960
بنابراین من با کل جمعیت شروع می
893
00:33:32,960 –> 00:33:34,799
894
00:33:34,799 –> 00:33:37,360
کنم و می روم برای خروجی سر
895
00:33:37,360 –> 00:33:38,399
20 ردیف
896
00:33:38,399 –> 00:33:42,000
بالای شروع، بنابراین در اینجا
897
00:33:42,000 –> 00:33:44,640
کاری که انجام می دهد این است که من 20 ردیف را نشان می دهم زیرا من 20 ردیف
898
00:33:44,640 –> 00:33:45,600
را در
899
00:33:45,600 –> 00:33:48,799
داخل سر نقطه دارم و بر
900
00:33:48,799 –> 00:33:51,200
اساس کل جمعیت مرتب شده است.
901
00:33:51,200 –> 00:33:53,600
902
00:33:53,600 –> 00:33:54,960
صفر،
903
00:33:54,960 –> 00:33:56,399
بنابراین ما گروه های بلوکی داریم که
904
00:33:56,399 –> 00:33:58,640
هیچ فردی در آنها وجود ندارد،
905
00:33:58,640 –> 00:34:01,120
بچه ها می دانید چرا
906
00:34:01,120 –> 00:34:01,919
ممکن است یک گروه بلوکی وجود داشته باشد،
907
00:34:01,919 –> 00:34:04,000
یک گروه بلوک سرشماری که
908
00:34:04,000 –> 00:34:05,760
هیچ کس در آن
909
00:34:05,760 –> 00:34:09,840
وجود نداشته باشد، هیچ حدس و گمانی در چت قرار داده
910
00:34:13,359 –> 00:34:18,720
نشده است، نه مانند قطعات است. از پارک گریفیث یا
911
00:34:18,800 –> 00:34:22,239
این نکته خوبی است بله،
912
00:34:22,239 –> 00:34:25,918
اما معمولاً
913
00:34:25,918 –> 00:34:29,119
گروههای بلوک جمعیت صفر
914
00:34:29,119 –> 00:34:32,320
هستند، من در مورد پارکها اطلاعی ندارم، پارکها
915
00:34:32,320 –> 00:34:35,040
توسط جوامع مسکونی احاطه شدهاند، بنابراین
916
00:34:35,040 –> 00:34:37,040
من در واقع ندیدهام که
917
00:34:37,040 –> 00:34:40,560
ام کوهها، شاید بله،
918
00:34:40,560 –> 00:34:44,159
فرودگاهها و مانند مناطق ساحلی طولانی
919
00:34:44,159 –> 00:34:47,280
wh قبل از اینکه تعداد زیادی
920
00:34:47,280 –> 00:34:50,560
قایق وجود داشته باشد و اوه شما بندر را می شناسید،
921
00:34:50,560 –> 00:34:51,359
922
00:34:51,359 –> 00:34:54,719
مناطق بسیار بزرگی وجود دارد که به نوعی امکانات صنعتی
923
00:34:54,719 –> 00:34:57,760
یا فرودگاهی هستند، آنها
924
00:34:57,760 –> 00:34:58,560
زمین های زیادی را پوشش می دهند
925
00:34:58,560 –> 00:35:01,280
و افراد واقعی بسیار کمی
926
00:35:01,280 –> 00:35:03,359
در آنها زندگی می کنند،
927
00:35:03,359 –> 00:35:06,480
بسیار خوب است. به جلو
928
00:35:06,480 –> 00:35:09,680
برویم، بیایید داده ها را زیرمجموعه قرار دهیم، بنابراین
929
00:35:09,680 –> 00:35:12,400
یک زیرمجموعه از قاب داده را انتخاب می کنیم
930
00:35:12,400 –> 00:35:14,560
و اگر می خواهید اسناد مربوط به نحوه انجام این کار را بیاموزید، پیوندی در اینجا
931
00:35:14,560 –> 00:35:16,240
دارم،
932
00:35:16,240 –> 00:35:19,119
اما این دستور بسیار
933
00:35:19,119 –> 00:35:21,119
خوبی است، بنابراین دوباره من
934
00:35:21,119 –> 00:35:23,920
میخواهیم قاب دادههای جغرافیایی خود را مجدداً تعریف کنم
935
00:35:23,920 –> 00:35:26,400
تا برابر با زیرمجموعهای از آنچه که
936
00:35:26,400 –> 00:35:27,599
قبلاً داریم،
937
00:35:27,599 –> 00:35:28,720
چگونه انجام دهیم،
938
00:35:28,720 –> 00:35:32,640
میخواهیم بگوییم هی میخواهم gdf
939
00:35:34,800 –> 00:35:37,440
همه ردیفهایی باشد که جمعیت کل
940
00:35:37,440 –> 00:35:38,960
آن بیش از 100 است.
941
00:35:38,960 –> 00:35:41,040
این منطقی است، بنابراین ما
942
00:35:41,040 –> 00:35:42,720
هر چیزی را که بیش از 100 عدد باشد
943
00:35:42,720 –> 00:35:44,800
در قاب داده جغرافیایی خود نگه می داریم و در واقع به
944
00:35:44,800 –> 00:35:46,480
نوعی بقیه را حذف یا برش می دهیم
945
00:35:46,480 –> 00:35:49,920
، خوب
946
00:35:49,920 –> 00:35:51,680
وقتی داده ها پاک می شوند،
947
00:35:51,680 –> 00:35:53,359
فایل ملی داده ها اصلاح می شود و
948
00:35:53,359 –> 00:35:54,640
949
00:35:54,640 –> 00:35:58,480
در چت داده های واقعی مورد سوال قرار می گیرد.
950
00:35:58,480 –> 00:35:59,839
که شما آورده اید نیست
951
00:35:59,839 –> 00:36:01,920
درست تغییر می کند، بنابراین
952
00:36:01,920 –> 00:36:05,520
فایل اصلی geojson در واقع
953
00:36:05,520 –> 00:36:07,680
در نوت بوک jupyter شما کپی می شود
954
00:36:07,680 –> 00:36:09,680
و تغییر نمی کند،
955
00:36:09,680 –> 00:36:13,839
اما شما
956
00:36:13,839 –> 00:36:16,480
متغیری به نام gdf ایجاد کرده اید که شامل
957
00:36:16,480 –> 00:36:17,040
داده های
958
00:36:17,040 –> 00:36:20,400
موجود در آن است و همانطور که آن را تغییر می دهید، آن
959
00:36:20,400 –> 00:36:23,520
متغیر اکنون بریده شده است
960
00:36:23,520 –> 00:36:26,560
و اکنون تغییر نمی کند. آن سوابق
961
00:36:26,560 –> 00:36:28,400
را داشته باشید، بنابراین اگر
962
00:36:28,400 –> 00:36:29,680
میخواهید به عقب برگردید،
963
00:36:29,680 –> 00:36:32,720
باید دوباره از نو شروع کنید، اگر لازم بود
964
00:36:32,720 –> 00:36:33,440
چیزی را
965
00:36:33,440 –> 00:36:35,200
قبلاً نگه دارید، ممکن است بخواهید آن را
966
00:36:35,200 –> 00:36:37,760
به gdf2 یا چیزی درست
967
00:36:37,760 –> 00:36:42,400
یا gdf بزرگتر از 100 تغییر دهید،
968
00:36:42,400 –> 00:36:45,520
اما من ندارم. نیاز به نگه
969
00:36:45,520 –> 00:36:48,720
داشتن سایر مجموعه های داده، بنابراین می خواهم
970
00:36:48,720 –> 00:36:52,240
آن را حفظ کنم، به عنوان یک سوال دیگر، آیا می
971
00:36:52,240 –> 00:36:54,720
توانم یک میلیون رکورد در چارچوب داده داشته
972
00:36:54,720 –> 00:36:58,400
باشم، اوه شما می توانید من با یک میلیون
973
00:36:58,400 –> 00:36:59,200
رکورد کار
974
00:36:59,200 –> 00:37:02,240
کرده ام، این مسئله قدرت محاسباتی است.
975
00:37:02,240 –> 00:37:03,839
976
00:37:03,839 –> 00:37:06,720
977
00:37:06,720 –> 00:37:08,079
محاسبات
978
00:37:08,079 –> 00:37:11,280
در هستهای که بخشی از رایانه شما
979
00:37:11,280 –> 00:37:12,560
980
00:37:12,560 –> 00:37:15,040
نیست اتفاق میافتد، این یک تعادل است، اما ممکن است
981
00:37:15,040 –> 00:37:16,400
982
00:37:16,400 –> 00:37:18,240
مانند هر نرمافزار دیگری با مشکلات حافظه مواجه شوید، هر چه
983
00:37:18,240 –> 00:37:19,760
دادههای شما بزرگتر باشد، سیستم شما را
984
00:37:19,760 –> 00:37:20,880
مختل میکند.
985
00:37:20,880 –> 00:37:24,079
من می گویم در این محیط
986
00:37:24,079 –> 00:37:26,240
با موفقیت بدون هیچ مشکلی
987
00:37:26,240 –> 00:37:29,359
با صدها هزار رکورد
988
00:37:29,359 –> 00:37:32,320
کار کرده ام، می توانم بگویم فراتر از این که شما با
989
00:37:32,320 –> 00:37:34,560
مشکلات حافظه مواجه می شوید یا فقط
990
00:37:34,560 –> 00:37:36,320
سیستم را از بین می برد،
991
00:37:36,320 –> 00:37:38,320
خوب این بستگی به این دارد که در کدام کتابخانه
992
00:37:38,320 –> 00:37:40,000
هستید.
993
00:37:40,000 –> 00:37:41,920
اگر از کتابخانههای جاوا اسکریپت استفاده
994
00:37:41,920 –> 00:37:44,480
995
00:37:44,480 –> 00:37:45,680
996
00:37:45,680 –> 00:37:48,800
میکنید، اگر از matplotlib استفاده میکنید که از نوع نتایج ثابتتری است که برمیگردند،
997
00:37:48,800 –> 00:37:50,560
998
00:37:50,560 –> 00:37:53,599
ممکن است قابل انجامتر باشد، منابع بیشتری از شما میگیرد.
999
00:37:54,560 –> 00:37:57,599
1000
00:37:57,599 –> 00:38:00,480
برای گنجاندن
1001
00:38:00,480 –> 00:38:02,160
تنها رکوردهایی که حداقل 100
1002
00:38:02,160 –> 00:38:03,599
نفر در آنها هستند،
1003
00:38:03,599 –> 00:38:05,119
بیایید کارهای سرگرم کننده انجام دهیم، اجازه دهید قبل از انجام این کار،
1004
00:38:05,119 –> 00:38:07,440
نقشه برداری از این
1005
00:38:07,440 –> 00:38:10,640
داده ها را شروع کنیم.
1006
00:38:10,640 –> 00:38:14,079
1007
00:38:14,079 –> 00:38:16,800
1008
00:38:16,800 –> 00:38:18,880
1009
00:38:18,880 –> 00:38:20,560
1010
00:38:20,560 –> 00:38:23,359
برای انجام تجزیه و تحلیل فضایی
1011
00:38:23,359 –> 00:38:26,400
یا نیاز به اندازه گیری فواصل دارد
1012
00:38:26,400 –> 00:38:30,720
و آمار مکانی را می دانید
1013
00:38:30,720 –> 00:38:33,599
، توصیه می شود از
1014
00:38:33,599 –> 00:38:34,880
واحدهای زاویه ای
1015
00:38:34,880 –> 00:38:38,160
که درجه یک هستند دور شوید. و از
1016
00:38:38,160 –> 00:38:40,720
یک سیستم مختصات پیشبینی شده
1017
00:38:40,720 –> 00:38:41,920
استفاده
1018
00:38:41,920 –> 00:38:44,240
کنید که دادههای شما را به
1019
00:38:44,240 –> 00:38:46,000
اندازهگیری متر
1020
00:38:46,000 –> 00:38:48,000
یا پا تبدیل میکند، بسته به اینکه از چه طرحی
1021
00:38:48,000 –> 00:38:50,160
استفاده میکنید، بنابراین ما میخواهیم دادههایمان را بیاوریم
1022
00:38:50,160 –> 00:38:52,320
و آنها را به یک
1023
00:38:52,320 –> 00:38:56,160
پروجکشن وب مرکور تبدیل کنیم و geopanis یک ارائه میدهد.
1024
00:38:56,160 –> 00:38:56,560
یک راه بسیار
1025
00:38:56,560 –> 00:38:59,359
خوب و سریع و آسان برای انجام این کار که
1026
00:38:59,359 –> 00:39:00,079
فقط گفتن
1027
00:39:00,079 –> 00:39:03,280
دو سیستم مرجع مختصات crs است
1028
00:39:03,280 –> 00:39:05,760
و اوه می دانید که می توانید
1029
00:39:05,760 –> 00:39:08,560
اسناد مربوط به PS های مختلف را
1030
00:39:08,560 –> 00:39:10,320
که کدهای
1031
00:39:10,320 –> 00:39:12,079
پیش بینی های مختلف هستند نگاه کنید،
1032
00:39:12,079 –> 00:39:15,359
ما از یک سیستم پروجکشن جهانی
1033
00:39:15,359 –> 00:39:19,040
به نام webmercator3857 استفاده خواهیم کرد.
1034
00:39:19,040 –> 00:39:22,400
این همچنین توسط یک کتابخانه پایتون استفاده میشود
1035
00:39:22,400 –> 00:39:23,839
که من آن را به نام context
1036
00:39:23,839 –> 00:39:25,920
philly وارد میکنم که به ما امکان میدهد
1037
00:39:25,920 –> 00:39:29,359
نقشههای پایه را در پشت نقشههای خود بیاوریم،
1038
00:39:29,359 –> 00:39:30,800
بنابراین میخواهیم دادههای خود را به webmercator تبدیل کنیم
1039
00:39:30,800 –> 00:39:33,040
1040
00:39:33,040 –> 00:39:36,000
و بیایید چند نمودار برای نمودارهای
1041
00:39:36,000 –> 00:39:36,560
1042
00:39:36,560 –> 00:39:39,920
i ایجاد کنیم. m از
1043
00:39:39,920 –> 00:39:43,440
1044
00:39:43,440 –> 00:39:46,800
1045
00:39:46,800 –> 00:39:49,200
1046
00:39:49,200 –> 00:39:50,079
1047
00:39:50,079 –> 00:39:52,560
این دستور استفاده خواهد کرد. از
1048
00:39:52,560 –> 00:39:54,079
matplotlib
1049
00:39:54,079 –> 00:39:57,119
plt و همانطور که می بینید در اینجا مجموعه
1050
00:39:57,119 –> 00:39:59,359
کاملی از نمونه هایی از نحوه ایجاد
1051
00:39:59,359 –> 00:40:02,640
یک نمودار با استفاده از این روش وجود دارد
1052
00:40:02,640 –> 00:40:06,240
و از نوعی از روش محور شکل
1053
00:40:06,240 –> 00:40:08,880
برای ایجاد نمودارهای منفرد یا
1054
00:40:08,880 –> 00:40:10,000
چندگانه
1055
00:40:10,000 –> 00:40:11,920
در یک خروجی استفاده می کند و ما این کار را انجام خواهیم داد. در واقع هر دو
1056
00:40:11,920 –> 00:40:13,280
1057
00:40:13,280 –> 00:40:16,800
مشکلی ندارند، بنابراین در اینجا یک کد
1058
00:40:16,800 –> 00:40:20,640
برای ایجاد یک نمودار واحد um وجود دارد، بنابراین
1059
00:40:20,640 –> 00:40:23,119
دستور uh را در اینجا داریم که یک شکل ایجاد می کند
1060
00:40:23,119 –> 00:40:26,240
و
1061
00:40:26,400 –> 00:40:28,640
خطوط محور Uh 4 تا 8 همان
1062
00:40:28,640 –> 00:40:29,440
نمودار واقعی
1063
00:40:29,440 –> 00:40:32,000
است که ما آن را با
1064
00:40:32,000 –> 00:40:34,079
قاب داده جغرافیایی خود مقدم می کنیم. شامل ستون هندسه
1065
00:40:34,079 –> 00:40:35,440
است
1066
00:40:35,440 –> 00:40:37,359
و ما می خواهیم
1067
00:40:37,359 –> 00:40:38,640
قاب داده های جغرافیایی خود را با
1068
00:40:38,640 –> 00:40:41,359
این آرگومان ها رسم کنیم، اساساً می گوییم
1069
00:40:41,359 –> 00:40:43,119
ax برابر است با تبر به این معنی
1070
00:40:43,119 –> 00:40:46,319
که من این را در این نموداری که به درستی ایجاد کردم قرار می دهم
1071
00:40:46,319 –> 00:40:47,119
1072
00:40:47,119 –> 00:40:50,880
و اینها برخی از ویژگی ها هستند که
1073
00:40:50,880 –> 00:40:53,920
چگونه شما را می خواهم بدانید
1074
00:40:53,920 –> 00:40:56,560
که هندسههایی که باید در
1075
00:40:56,560 –> 00:40:57,520
نمودار
1076
00:40:57,520 –> 00:40:59,599
آلفا ارائه شوند کدورت هستند، بنابراین کمی
1077
00:40:59,599 –> 00:41:01,280
1078
00:41:01,280 –> 00:41:03,839
شفافیت در طرح وجود دارد که
1079
00:41:03,839 –> 00:41:04,880
محور را خاموش
1080
00:41:04,880 –> 00:41:07,760
میکنیم و این خط کد را اضافه میکنیم که
1081
00:41:07,760 –> 00:41:08,960
1082
00:41:08,960 –> 00:41:11,760
اساساً یک نقشه پایه در اختیار ما قرار میدهد
1083
00:41:11,760 –> 00:41:12,240
تا
1084
00:41:12,240 –> 00:41:16,319
زمانی که شما این را اجرا می
1085
00:41:16,640 –> 00:41:19,520
کنید، خروجی گرافیکی خوبی از داده های ما تولید می کند،
1086
00:41:19,520 –> 00:41:20,400
1087
00:41:20,400 –> 00:41:22,720
بنابراین ما این را به صورت جدولی دیدیم و اکنون
1088
00:41:22,720 –> 00:41:24,640
آن را به صورت بصری می بینیم،
1089
00:41:24,640 –> 00:41:28,000
بنابراین این 2500
1090
00:41:28,000 –> 00:41:30,240
هر یک از این چند ضلعی است که
1091
00:41:30,240 –> 00:41:31,599
در اینجا می بینید یکی از
1092
00:41:31,599 –> 00:41:34,800
2500 گروه بلوک است. در
1093
00:41:34,800 –> 00:41:38,880
آخر و حرکت رو به جلو، بله، باید
1094
00:41:38,880 –> 00:41:40,880
به این هم اشاره کنم که نقشه پایه ای که
1095
00:41:40,880 –> 00:41:41,440
اینجا
1096
00:41:41,440 –> 00:41:43,520
در پس زمینه می بینید که توسط
1097
00:41:43,520 –> 00:41:45,839
این خط 14 تولید شده است.
1098
00:41:45,839 –> 00:41:48,880
بنابراین این فقط یک کمک کوچک
1099
00:41:48,880 –> 00:41:51,440
است، البته اختیاری است،
1100
00:41:51,440 –> 00:41:52,640
اما فقط به
1101
00:41:52,640 –> 00:41:57,280
نوعی تصویر بصری را ایجاد می کند. خیلی
1102
00:41:57,440 –> 00:41:59,440
خوب است، بنابراین اکنون که نقشه ای
1103
00:41:59,440 –> 00:42:00,800
از گروه های بلوک داریم،
1104
00:42:00,800 –> 00:42:04,560
بیایید یک کار انجام دهیم، بیایید داده های دیگری دریافت
1105
00:42:04,560 –> 00:42:06,319
کنیم، بنابراین اکنون می خواهیم با
1106
00:42:06,319 –> 00:42:09,359
پورتال داده کار کنیم، بنابراین در اینجا پورتال داده la
1107
00:42:09,359 –> 00:42:11,280
است، اگر هرگز این کار را نکرده اید، یک پیوند دارم.
1108
00:42:11,280 –> 00:42:13,760
قبل از اینکه بسیاری از
1109
00:42:13,760 –> 00:42:17,440
سازمانهای دولتی در حال حاضر پورتالهایی را برای دادههایی ارائه میدهند
1110
00:42:17,440 –> 00:42:20,160
که ما اساساً با پول
1111
00:42:20,160 –> 00:42:20,800
مالیات خود
1112
00:42:20,800 –> 00:42:23,359
هزینه آن را میپردازیم، بنابراین آنها میدانند که یک دسته
1113
00:42:23,359 –> 00:42:25,520
از شما میدانند
1114
00:42:25,520 –> 00:42:27,920
آب و برق ایمنی و آب و برق
1115
00:42:27,920 –> 00:42:31,280
و لپتاپ نیز در اینجا دادههایی دارد.
1116
00:42:31,280 –> 00:42:34,000
اگر برای داده های استراحت جستجو می کنید در پورتال la
1117
00:42:34,000 –> 00:42:34,720
data
1118
00:42:34,720 –> 00:42:36,560
در نهایت به صفحهای میرسید که
1119
00:42:36,560 –> 00:42:38,160
به این شکل است
1120
00:42:38,160 –> 00:42:42,000
و این مجموعه دادهای است که
1121
00:42:42,000 –> 00:42:45,119
میدانید بخش لپد
1122
00:42:45,119 –> 00:42:48,319
است، هفتگی بهروزرسانی میشود، نه
1123
00:42:48,319 –> 00:42:49,359
دروغ میگویند
1124
00:42:49,359 –> 00:42:53,119
آخرین بهروزرسانی 24 فوریه
1125
00:42:53,119 –> 00:42:56,240
چه خبر است بنابراین، نه،
1126
00:42:56,240 –> 00:42:56,800
این بهروزرسانی هفتگی نیست،
1127
00:42:56,800 –> 00:42:59,440
اوم میخواهند، اما من در واقع مرتباً این را بررسی
1128
00:42:59,440 –> 00:43:00,240
1129
00:43:00,240 –> 00:43:02,319
میکردم و فکر میکنم بیشتر شبیه ماهانه است و
1130
00:43:02,319 –> 00:43:03,920
در حال حاضر
1131
00:43:03,920 –> 00:43:07,040
کاملاً عقب ماندهاند.
1132
00:43:07,040 –> 00:43:09,359
1133
00:43:09,359 –> 00:43:12,240
1134
00:43:12,240 –> 00:43:13,920
ستون هایی
1135
00:43:13,920 –> 00:43:15,760
که با این مجموعه داده مرتبط هستند
1136
00:43:15,760 –> 00:43:19,280
درست است، بنابراین ما تاریخ دستگیری
1137
00:43:19,280 –> 00:43:22,960
زمان دستگیری را داریم که
1138
00:43:22,960 –> 00:43:24,640
اساساً دقیقاً سن فردی
1139
00:43:24,640 –> 00:43:25,359
که دستگیر شده است
1140
00:43:25,359 –> 00:43:29,119
جنسیت شما کد نزول را می دانید
1141
00:43:29,119 –> 00:43:30,400
که
1142
00:43:30,400 –> 00:43:33,839
اساساً مسابقه ای است که می خواهم این مجموعه داده را مقدمه کنم.
1143
00:43:33,839 –> 00:43:35,280
با گفتن اینکه من خیلی با این
1144
00:43:35,280 –> 00:43:36,560
دادهها کار کردهام،
1145
00:43:36,560 –> 00:43:38,800
این بر این اساس است که نمیدانم آیا یکی از
1146
00:43:38,800 –> 00:43:40,240
شما دستگیر شدهاید یا نه، من قبلاً دستگیر شدهام یا خیر،
1147
00:43:40,240 –> 00:43:41,680
اما
1148
00:43:41,680 –> 00:43:44,800
یک افسر پلیس یک
1149
00:43:44,800 –> 00:43:47,839
دفترچه یادداشت جلوی او خواهد داشت و
1150
00:43:47,839 –> 00:43:50,720
نوشتن این دادهها در بسیاری از موارد
1151
00:43:50,720 –> 00:43:51,599
ذهنی است،
1152
00:43:51,599 –> 00:43:54,160
درست است.
1153
00:43:54,160 –> 00:43:55,200
1154
00:43:55,200 –> 00:43:58,400
1155
00:43:58,400 –> 00:43:59,920
1156
00:43:59,920 –> 00:44:04,480
1157
00:44:04,480 –> 00:44:06,560
1158
00:44:06,560 –> 00:44:08,079
که قرار است با آن
1159
00:44:08,079 –> 00:44:10,800
کار کنیم و از کتابخانه ای به نام سوکراتا استفاده می کنیم
1160
00:44:10,800 –> 00:44:12,560
و این نقطه پایانی داده است
1161
00:44:12,560 –> 00:44:14,480
که از
1162
00:44:14,480 –> 00:44:17,280
نقطه پایانی استفاده می کنیم به این معنی که از یک
1163
00:44:17,280 –> 00:44:18,880
api برای گرفتن داده ها استفاده می کنیم.
1164
00:44:18,880 –> 00:44:22,960
مستقیماً از
1165
00:44:22,960 –> 00:44:26,000
پورتال داده باز که از socrata
1166
00:44:26,000 –> 00:44:29,200
در باطن استفاده می کند تا داده های خود را میزبانی کند،
1167
00:44:29,200 –> 00:44:31,760
بنابراین این مربوط به داده های دستگیری است
1168
00:44:31,760 –> 00:44:32,480
و شما می توانید
1169
00:44:32,480 –> 00:44:34,400
تمام کارهای مختلفی را که می توانید
1170
00:44:34,400 –> 00:44:36,640
با داده ها با استفاده از api آنها انجام دهید، مشاهده کنید،
1171
00:44:36,640 –> 00:44:39,040
این همه فیلدهایی است که می توانید
1172
00:44:39,040 –> 00:44:40,640
قبل از اینکه آن را وارد کنید، از آنها پرس و جو کنید، می توانید
1173
00:44:40,640 –> 00:44:42,000
یک سری کارها را انجام دهید
1174
00:44:42,000 –> 00:44:44,720
، تکه های کد در این نوع
1175
00:44:44,720 –> 00:44:45,680
داده ها وجود دارد
1176
00:44:45,680 –> 00:44:49,280
و یکی از آنها پانداهای پایتون است که
1177
00:44:49,280 –> 00:44:52,560
بسیار جالب است و نمونه کدهایی
1178
00:44:52,560 –> 00:44:56,800
برای وارد کردن این مجموعه داده دقیق به نوت بوک ما وجود دارد.
1179
00:44:56,800 –> 00:44:58,800
و این اساساً همان چیزی است که ما
1180
00:44:58,800 –> 00:45:00,000
هستیم ما این کار را کپی و پیست کرده ایم
1181
00:45:00,000 –> 00:45:00,880
1182
00:45:00,880 –> 00:45:03,040
و کمی آن را
1183
00:45:03,040 –> 00:45:05,520
برای آزمایشگاه خود پیکربندی
1184
00:45:05,520 –> 00:45:08,880
کرده ایم، بنابراین از sodapi socrata
1185
00:45:08,880 –> 00:45:09,440
که یک
1186
00:45:09,440 –> 00:45:12,400
کتابخانه پایتون است دوباره استفاده می کنیم، من بیشتر این را کپی و
1187
00:45:12,400 –> 00:45:13,920
جایگذاری کردم
1188
00:45:13,920 –> 00:45:16,480
و یک عبارت Where اضافه کردم. بسیار خوب، بنابراین من
1189
00:45:16,480 –> 00:45:18,000
یک بیانیه کجا اضافه کردم تا به
1190
00:45:18,000 –> 00:45:21,119
نوعی در یک
1191
00:45:21,119 –> 00:45:23,040
محدوده تاریخی خاص برای داده هایی که باید از اداره پلیس
1192
00:45:23,040 –> 00:45:24,319
لا اوه وارد
1193
00:45:24,319 –> 00:45:26,560
شوند، توضیح دهم، بنابراین می خواهم بگویم
1194
00:45:26,560 –> 00:45:29,200
که اطلاعات دستگیری بین
1195
00:45:29,200 –> 00:45:32,560
اول ژوئیه سال گذشته تا
1196
00:45:32,560 –> 00:45:35,839
تقریباً کجاست. اوه شما می دانید آخرین اوه اوه اوه اوه
1197
00:45:35,839 –> 00:45:39,440
اوه 31 ژانویه، بسیار خوب، پس این
1198
00:45:39,440 –> 00:45:41,440
مانند داده های واقعی است و ما
1199
00:45:41,440 –> 00:45:42,800
آن را در
1200
00:45:42,800 –> 00:45:45,359
حال حاضر وارد می کنیم، بنابراین امیدوارم که این یک
1201
00:45:45,359 –> 00:45:47,359
زمان عصبی کار کند زیرا اوه این
1202
00:45:47,359 –> 00:45:48,079
یکی از آن
1203
00:45:48,079 –> 00:45:51,839
چیزهایی است که زندگی می کنند و وابسته هستند. یک کارگاه
1204
00:45:51,839 –> 00:45:53,920
بسیار خوب است، بنابراین
1205
00:45:53,920 –> 00:45:56,079
بیایید اطلاعات
1206
00:45:56,079 –> 00:45:57,680
مربوط به دادههایی را که بهتازگی در
1207
00:45:57,680 –> 00:46:01,359
اطلاعات نقطهای آوردهایم، دریافت کنیم و اینها همه رکوردهایی
1208
00:46:01,359 –> 00:46:02,560
هستند که در
1209
00:46:02,560 –> 00:46:06,480
25 ردیف سمت راست آوردهایم، متأسفم 25 ستون
1210
00:46:06,480 –> 00:46:10,160
اینها انواع دادهها هستند. همه
1211
00:46:10,160 –> 00:46:12,880
اشیایی که متن هستند دارای
1212
00:46:12,880 –> 00:46:14,640
عرض جغرافیایی هستند ngitude که همچنین یک
1213
00:46:14,640 –> 00:46:15,599
شی است
1214
00:46:15,599 –> 00:46:16,800
که باید آن را به عدد um تغییر دهیم،
1215
00:46:16,800 –> 00:46:18,960
1216
00:46:18,960 –> 00:46:22,160
خب،
1217
00:46:22,160 –> 00:46:24,960
اجازه دهید به داده ها نگاه کنیم، به نظر می رسد که
1218
00:46:24,960 –> 00:46:25,839
1219
00:46:25,839 –> 00:46:29,599
این فقط پیش نمایش داده ها است
1220
00:46:29,599 –> 00:46:31,520
و در اینجا ستون های طول و عرض جغرافیایی
1221
00:46:31,520 –> 00:46:33,839
um
1222
00:46:33,839 –> 00:46:36,720
و بیایید ادامه دهیم و
1223
00:46:36,720 –> 00:46:38,319
قبل از اینکه بتوانیم واقعاً از آن استفاده کنیم، کمی این داده ها را ماساژ
1224
00:46:38,319 –> 00:46:39,040
می
1225
00:46:39,040 –> 00:46:42,079
دهیم، بنابراین اول از
1226
00:46:42,079 –> 00:46:44,800
همه داده ها در چیزی قرار می گیرند که به آن قاب داده
1227
00:46:44,800 –> 00:46:45,599
می گویند،
1228
00:46:45,599 –> 00:46:49,040
هنوز هم پانداهای جغرافیایی نیستند، بنابراین می
1229
00:46:49,040 –> 00:46:52,800
خواهیم داده ها را به یک قاب داده geopandas
1230
00:46:52,800 –> 00:46:56,160
و این کد نحوه تبدیل
1231
00:46:56,160 –> 00:47:00,400
و داشتن یک مستند برای آن است و
1232
00:47:00,400 –> 00:47:02,480
بنابراین من می خواهم
1233
00:47:02,480 –> 00:47:04,160
1234
00:47:04,160 –> 00:47:07,520
با تعریف
1235
00:47:07,520 –> 00:47:09,040
هندسه به عنوان
1236
00:47:09,040 –> 00:47:12,160
ترکیبی از ستون های طول و عرض جغرافیایی، داده های دستگیری خود را به یک قاب داده کاندیداهای جغرافیایی تبدیل کنم.
1237
00:47:12,160 –> 00:47:16,079
قاب داده پانداهای ما خوب است
1238
00:47:16,079 –> 00:47:17,599
و سپس من میخواهم آن را
1239
00:47:17,599 –> 00:47:19,200
به همان تصویری که از واحدهای زاویهای داشتیم
1240
00:47:19,200 –> 00:47:20,240
1241
00:47:20,240 –> 00:47:23,359
به یک وب مرکراتور تبدیل کنم و اکنون ما داریم
1242
00:47:23,359 –> 00:47:24,079
1243
00:47:24,079 –> 00:47:26,960
متأسفم مرحله آخر این است که به یاد بیاوریم
1244
00:47:26,960 –> 00:47:28,720
پرتابگر عرض جغرافیایی اشیایی بودند که ما
1245
00:47:28,720 –> 00:47:30,720
نیاز به تبدیل t که به شناور می شود،
1246
00:47:30,720 –> 00:47:33,760
بنابراین دوباره این دستور پایتون برای
1247
00:47:33,760 –> 00:47:34,319
تبدیل
1248
00:47:34,319 –> 00:47:37,520
یک ستون نوع داده از
1249
00:47:37,520 –> 00:47:39,520
چیزی به چیز دیگری است، بنابراین
1250
00:47:39,520 –> 00:47:41,119
من به عنوان نوع float
1251
00:47:41,119 –> 00:47:45,040
برای طول و عرض جغرافیایی عمل
1252
00:47:45,040 –> 00:47:47,599
می کنم و فکر می کنم در نهایت آماده ترسیم آن هستیم،
1253
00:47:47,599 –> 00:47:48,400
بنابراین
1254
00:47:48,400 –> 00:47:52,000
دوباره همان کد زیر نمودار matplotlib در اینجا
1255
00:47:52,000 –> 00:47:54,000
و به جای gdf که
1256
00:47:54,000 –> 00:47:55,920
گروه های بلوک است، من استراحت می کنم
1257
00:47:55,920 –> 00:47:59,040
و آنها را رسم می کنم، این یک
1258
00:47:59,040 –> 00:48:00,880
مجموعه داده نقطه ای است در مقابل
1259
00:48: