در این مطلب، ویدئو مهمان ویژه: Niklas Rosenstein – Python In Houdini: Importing Satellite Data با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:36:48
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:02,040
سلام بچه ها امروز من این پسر را برای شما آوردم
2
00:00:02,040 –> 00:00:04,080
این Alden Stein از نیکلاس نیکاست و
3
00:00:04,080 –> 00:00:06,240
او یکی از با استعدادترین
4
00:00:06,240 –> 00:00:09,110
توسعه دهندگان پایتون است که شخصاً می دانم از او تشکر می کنم و
5
00:00:09,110 –> 00:00:11,460
او یک پروژه بسیار جالب را
6
00:00:11,460 –> 00:00:13,740
با خود آورده است، بنابراین در مورد آن به ما بگویید بله من به
7
00:00:13,740 –> 00:00:15,599
دنبال یک پروژه بودم. برای کسب اطلاعات
8
00:00:15,599 –> 00:00:17,670
بیشتر در مورد آدنی و مواد شیمیایی
9
00:00:17,670 –> 00:00:20,880
امروزه داده های ماهواره ای گایا یا ki نامیده می شود
10
00:00:20,880 –> 00:00:24,269
و حاوی بیش از 1
11
00:00:24,269 –> 00:00:26,990
میلیارد جسم در فضا و
12
00:00:26,990 –> 00:00:30,869
مختصات آنها و طیف گسترده ای
13
00:00:30,869 –> 00:00:34,260
از اندازه گیری های ثبت شده در مورد
14
00:00:34,260 –> 00:00:36,360
این موضوعات از حسگرهای مختلف
15
00:00:36,360 –> 00:00:38,430
است. مانند یک پروژه نقشه برداری برای
16
00:00:38,430 –> 00:00:39,930
فضا، بله، این در واقع
17
00:00:39,930 –> 00:00:43,290
هدف نهایی به تنهایی است و نسخه کوچکتری
18
00:00:43,290 –> 00:00:45,360
از مجموعه داده وجود دارد، زیرا یک میلیارد به عنوان
19
00:00:45,360 –> 00:00:47,670
نقطه در گینه نو، به عنوان مثال،
20
00:00:47,670 –> 00:00:49,440
ضرری است که ما با
21
00:00:49,440 –> 00:00:51,960
کمی کمتر شروع خواهیم کرد. و
22
00:00:51,960 –> 00:00:54,030
نسخه کوچکتری وجود دارد که فقط شامل 2.5
23
00:00:54,030 –> 00:00:55,949
میلیون شیء است، اینها در واقع
24
00:00:55,949 –> 00:00:57,510
شروع به تأیید وجود ستاره ها می کنند
25
00:00:57,510 –> 00:01:00,059
و دقت را با
26
00:01:00,059 –> 00:01:02,280
داده های قبلی بهبود می بخشند. پس از حمام، میتوانید
27
00:01:02,280 –> 00:01:04,199
حالت را
28
00:01:04,199 –> 00:01:07,080
با استفاده از پایتون به دینی وارد کنید و سپس ما از
29
00:01:07,080 –> 00:01:11,010
vex برای تبدیل این دادهها استفاده میکنیم تا آنها
30
00:01:11,010 –> 00:01:12,990
را در آدنین تجسم کنیم، بنابراین امروز به نوعی در حال
31
00:01:12,990 –> 00:01:15,479
ساختن یک نقشه ستارهای هستیم، بله،
32
00:01:15,479 –> 00:01:18,299
میخواهیم بسازیم. یک ابر ستاره ای که
33
00:01:18,299 –> 00:01:19,890
بسیار جذاب به نظر می رسد زیرا در نهایت
34
00:01:19,890 –> 00:01:21,420
تصمیم گرفتم که اکنون زمان آن فرا رسیده است، اما
35
00:01:21,420 –> 00:01:23,280
نمی توانم بیشتر از این به دور پایتون بپردازم،
36
00:01:23,280 –> 00:01:25,799
بنابراین من واقعا مشتاقانه منتظر این
37
00:01:25,799 –> 00:01:28,170
هستم و حدس می زنم بیایید شروع کنیم بله،
38
00:01:28,170 –> 00:01:32,520
سلام و به آموزش من خوش آمدید
39
00:01:32,520 –> 00:01:35,610
آنتن بوسه امروز انجام نشد
40
00:01:35,610 –> 00:01:38,310
می خواهم به شما نشان دهم چگونه می توانید
41
00:01:38,310 –> 00:01:40,409
داده های CSV را به هودینی وارد کنید من به دنبال
42
00:01:40,409 –> 00:01:42,600
مجموعه داده هایی برای وارد کردن به هودینی بودم
43
00:01:42,600 –> 00:01:45,780
با آرشیو Gaia روبرو شدم که توسط ESA میزبانی می
44
00:01:45,780 –> 00:01:47,490
شود، آژانس فضایی اروپا
45
00:01:47,490 –> 00:01:50,490
که آنها اطلاعات ارائه می دهند یا داده
46
00:01:50,490 –> 00:01:52,140
های ماهواره خود را که آنها در سال 2013 پرتاب کردند
47
00:01:52,140 –> 00:01:54,689
و می توانید آن داده ها را پیدا کنید اگر
48
00:01:54,689 –> 00:01:57,540
به اینجا به آرشیو ESA بروید، من
49
00:01:57,540 –> 00:01:59,280
لینک توضیحات را اضافه می کنم و به
50
00:01:59,280 –> 00:02:01,140
صفحه دانلودها می روم و سپس در
51
00:02:01,140 –> 00:02:03,630
یک نوع FTP وحشتناک هستید.
52
00:02:03,630 –> 00:02:05,850
ctory و منبع Gaia و منبع tjs وجود دارد و
53
00:02:05,850 –> 00:02:07,590
من قصد دارم اینها را در کمی توضیح دهم
54
00:02:07,590 –> 00:02:09,209
، همچنین اسنادی
55
00:02:09,209 –> 00:02:10,830
در مورد این داده ها وجود دارد، بنابراین بیایید
56
00:02:10,830 –> 00:02:13,050
ابتدا به آن نگاه کنیم که در اینجا می توانیم چیزی
57
00:02:13,050 –> 00:02:13,590
در مورد بچه ها
58
00:02:13,590 –> 00:02:15,480
در منبع TGS ببینیم.
59
00:02:15,480 –> 00:02:17,400
شرح یا ستونهای موجود در
60
00:02:17,400 –> 00:02:19,500
این دادهها برای هر دوی آنها تقریباً یکسان
61
00:02:19,500 –> 00:02:21,959
است. منبع گایا در واقع
62
00:02:21,959 –> 00:02:24,150
مجموعه کامل دادهای است که آنها منتشر کردهاند، بنابراین
63
00:02:24,150 –> 00:02:25,980
حاوی حدود 1 میلیارد جرم در
64
00:02:25,980 –> 00:02:28,140
فضا است که لزوماً ستاره نیست، زیرا
65
00:02:28,140 –> 00:02:30,330
اشیاء دیگری را نیز میگیرد که
66
00:02:30,330 –> 00:02:33,450
توسط آنها روشن شده است. stars و منبع tjs یک
67
00:02:33,450 –> 00:02:35,459
مجموعه داده کوچکتر است که با سایر
68
00:02:35,459 –> 00:02:37,349
مجموعه داده های قبلی از Hipparchus
69
00:02:37,349 –> 00:02:39,780
و Tycho تا Mission مقایسه می شود، زیرا آنها
70
00:02:39,780 –> 00:02:41,879
در اینجا ذکر می کنند که فقط شامل 2.5 میلیون ستاره است
71
00:02:41,879 –> 00:02:43,500
و اینها در واقع شروع شده اند بنابراین آنها
72
00:02:43,500 –> 00:02:45,510
تأیید می کنند که اینها در واقع ستاره هستند و
73
00:02:45,510 –> 00:02:46,560
نه هر نوع دیگری از اشیاء که
74
00:02:46,560 –> 00:02:48,450
ستون ها تقریباً یکسان هستند،
75
00:02:48,450 –> 00:02:50,250
چند مورد دیگر وجود دارد و تعداد کمی کمتر از طریق
76
00:02:50,250 –> 00:02:52,410
آنها نگاه می کنیم، می توانیم متوجه شویم که
77
00:02:52,410 –> 00:02:55,829
طول و عرض جغرافیایی در دسترس است. بنابراین،
78
00:02:55,829 –> 00:02:57,420
این مختصات کروی هستند که
79
00:02:57,420 –> 00:03:00,540
میتوانیم از آنها برای محاسبه مختصات XYZ در
80
00:03:00,540 –> 00:03:02,760
نمای هودینی یا
81
00:03:02,760 –> 00:03:04,319
سیستم مختصات دکارتی هودینی استفاده
82
00:03:04,319 –> 00:03:07,769
کنیم. چیزی به نام فکر G mean Mac نیز وجود دارد
83
00:03:07,769 –> 00:03:10,530
که مخفف نورسنجی باند G قدر متوسط است پس
84
00:03:10,530 –> 00:03:12,569
ز بررسی برخی از مق
85
00:03:12,569 –> 00:03:14,610
لات جستجوی آنلاین در گو
86
00:03:14,610 –> 00:03:16,110
ل. متوجه شدیم که این در واقع یک
87
00:03:16,110 –> 00:03:17,579
نمایش متفاوت از روشنایی
88
00:03:17,579 –> 00:03:19,200
درخشندگی ستاره است که
89
00:03:19,200 –> 00:03:21,000
در نجوم قدر نامیده می شود. ما از طریق
90
00:03:21,000 –> 00:03:22,889
این مقاله ویکی پدیا نگاه می کنیم، می توانیم دریابیم که
91
00:03:22,889 –> 00:03:24,090
فرمول هایی وجود دارد و
92
00:03:24,090 –> 00:03:26,010
بعداً از آن فرمول برای محاسبه
93
00:03:26,010 –> 00:03:27,630
شدت واقعی ستاره استفاده خواهیم کرد.
94
00:03:27,630 –> 00:03:29,370
در بالا نیز
95
00:03:29,370 –> 00:03:32,730
اختلاف منظر وجود دارد و اختلاف منظر
96
00:03:32,730 –> 00:03:35,190
اساساً زاویه یا حرکت
97
00:03:35,190 –> 00:03:36,660
ظاهری جسم در پشت پس زمینه آن است، زمانی
98
00:03:36,660 –> 00:03:38,459
که از دو
99
00:03:38,459 –> 00:03:40,920
موقعیت مختلف به آن نگاه می کنید، بنابراین مقاله ای در مورد
100
00:03:40,920 –> 00:03:42,450
آن وجود دارد که من می خواهم آن را پیوند دهم.
101
00:03:42,450 –> 00:03:44,220
در توضیحات و این توضیح میدهد که
102
00:03:44,220 –> 00:03:46,230
الکس چگونه برای
103
00:03:46,230 –> 00:03:48,569
ستارهها و آنجا اندازهگیری میشود e همچنین یک فرمول بسیار ساده
104
00:03:48,569 –> 00:03:50,190
برای محاسبه فاصله
105
00:03:50,190 –> 00:03:52,319
ستاره با استفاده از اختلاف منظر آن است که فقط 1
106
00:03:52,319 –> 00:03:53,970
تقسیم بر اختلاف منظر است، اما
107
00:03:53,970 –> 00:03:55,049
ما باید مطمئن شویم که در
108
00:03:55,049 –> 00:03:56,730
واقع با ثانیه های قوسی کار می کنیم زیرا
109
00:03:56,730 –> 00:03:58,500
در غیر این صورت فرمول صحیح نیست و
110
00:03:58,500 –> 00:03:59,700
شما باید برای در
111
00:03:59,700 –> 00:04:01,440
نظر گرفتن صحیح واحدها، اگر
112
00:04:01,440 –> 00:04:02,940
دوباره در بایگانی نگاه کنید، میتوانیم متوجه شویم
113
00:04:02,940 –> 00:04:05,940
که دادههای CSV متناسب با دادهها و دادههای جدول تابلو هستند،
114
00:04:05,940 –> 00:04:08,579
اکنون اینها برخی از
115
00:04:08,579 –> 00:04:10,889
فرمتهای فایل نجومی هستند که میخواهیم با فرمت CSV کار کنیم،
116
00:04:10,889 –> 00:04:12,419
زیرا تجزیه و تحلیل آن سادهترین است.
117
00:04:12,419 –> 00:04:14,190
پایتون و اگر به منبع گایا نگاه کنید که
118
00:04:14,190 –> 00:04:15,959
دایرکتوری B را می بیند، می توانید متوجه
119
00:04:15,959 –> 00:04:18,329
شوید که حدود 5000 فایل در آنجا وجود دارد،
120
00:04:18,329 –> 00:04:20,339
بله، بنابراین این تعداد فایل ها زیاد است و
121
00:04:20,339 –> 00:04:22,140
در واقع حدود 200
122
00:04:22,140 –> 00:04:24,599
گیگابایت داده فشرده شده است و
123
00:04:24,599 –> 00:04:27,030
کار کردن با آن کمی غیرمعمول است.
124
00:04:27,030 –> 00:04:27,570
اگر فقط شش نفر
125
00:04:27,570 –> 00:04:29,610
باقی ماندهاید و با
126
00:04:29,610 –> 00:04:30,840
چراغ و هودینی شروع به کار میکنید، وقتی
127
00:04:30,840 –> 00:04:33,210
بارگیری دادهها در Denis تمام شد، بررسی کنید که
128
00:04:33,210 –> 00:04:35,010
همه چیز کار میکند، میتوانیم به راحتی به
129
00:04:35,010 –> 00:04:36,720
استفاده از دادههای بیشتر تغییر دهیم. اما برای این آموزش
130
00:04:36,720 –> 00:04:38,700
ما از منبع TGS استفاده می کنیم که
131
00:04:38,700 –> 00:04:40,980
فقط از شانزده قسمت تشکیل شده است که
132
00:04:40,980 –> 00:04:43,050
ششصد مگابایت در داده های فشرده را تشکیل می دهد
133
00:04:43,050 –> 00:04:44,940
اکنون برای این شانزده فایل،
134
00:04:44,940 –> 00:04:46,800
دانلود آنها با دست بسیار آسان است، اما زمانی
135
00:04:46,800 –> 00:04:48,480
که می خواهید اطلاعات کامل Gaia را دانلود کنید.
136
00:04:48,480 –> 00:04:50,100
تنظیم کنید مدتی طول می کشد تا شما
137
00:04:50,100 –> 00:04:51,810
روی پنج هزار ادنان برای دانلود پنج هزار فایل کلیک کنید،
138
00:04:51,810 –> 00:04:53,490
بنابراین ما می خواهیم
139
00:04:53,490 –> 00:04:55,020
یک اسکریپت پایتون کوچک بنویسیم، ما
140
00:04:55,020 –> 00:04:56,640
این فایل ها را نمی دانیم، اما اول از همه
141
00:04:56,640 –> 00:04:58,950
باید پایتون را نصب کنیم، پس می رویم. برای
142
00:04:58,950 –> 00:05:02,970
انجام این کار، اکنون به python.org بروید و به
143
00:05:02,970 –> 00:05:06,660
دانلودها بروید و پایتون 3.6 را برای
144
00:05:06,660 –> 00:05:09,270
پایتون دو هفت یک سه هودینی
145
00:05:09,270 –> 00:05:11,670
در واقع با پایتون 2.7 عرضه می کند و
146
00:05:11,670 –> 00:05:13,170
پایتون دو در حال حاضر
147
00:05:13,170 –> 00:05:15,660
استاندارد و صنعت VFX است،
148
00:05:15,660 –> 00:05:18,690
اما به زودی تغییر خواهد کرد، بنابراین اگر شما
149
00:05:18,690 –> 00:05:25,080
به python clark python.org میروید، میبینید
150
00:05:25,080 –> 00:05:26,970
که پایتون 2 در
151
00:05:26,970 –> 00:05:28,740
عرض دو سال و هشت ماه دیگر منسوخ میشود و این
152
00:05:28,740 –> 00:05:31,980
زمانی است که صنعت VFX نیز باید تصمیم بگیرد
153
00:05:31,980 –> 00:05:34,080
که حداقل به پایتون 3 تغییر کند تا
154
00:05:34,080 –> 00:05:36,810
قسمت سوم کمی طول بکشد. بسیار مدرن است، اما
155
00:05:36,810 –> 00:05:38,550
مطمئن شوید که به تازگی با پایتون ها شروع کرده اید،
156
00:05:38,550 –> 00:05:40,140
احتمالاً شروع با پایتون 2.7 آسان تر است،
157
00:05:40,140 –> 00:05:42,780
زیرا
158
00:05:42,780 –> 00:05:44,850
هنگام کار با پایتون خارج
159
00:05:44,850 –> 00:05:46,860
از ویندوز و داخل Bedini سردرگم نخواهید شد، بنابراین ما
160
00:05:46,860 –> 00:05:49,950
آن را دانلود می کنیم و روی run کلیک کنید
161
00:05:49,950 –> 00:05:52,170
تا مطمئن شوید که برای همه کاربران نصب
162
00:05:52,170 –> 00:05:53,730
می کنید زیرا روی
163
00:05:53,730 –> 00:05:55,560
هارد دیسک اصلی شما قرار می گیرد، می توانید
164
00:05:55,560 –> 00:05:57,180
فایل های برنامه را به
165
00:05:57,180 –> 00:06:00,390
جای درایو اصلی نصب کنید، اینها همه خوب هستند به جز
166
00:06:00,390 –> 00:06:02,190
برای Python XS که به مسیر اضافه می شوید.
167
00:06:02,190 –> 00:06:03,870
ما میتوانیم از خط کامنت بدون هیچچیز دیگری از آن استفاده کنیم،
168
00:06:03,870 –> 00:06:05,910
بنابراین
169
00:06:05,910 –> 00:06:07,200
170
00:06:07,200 –> 00:06:08,820
اکنون که پایتون را نصب کردهایم، نصب آن را
171
00:06:08,820 –> 00:06:10,650
نیز انتخاب میکنیم، باید بررسی کنیم که آیا کار میکرده است، بنابراین
172
00:06:10,650 –> 00:06:13,320
روی نماد ویندوز کلیک راست کرده و اکنون پاورشل ویندوز را انتخاب
173
00:06:13,320 –> 00:06:14,340
174
00:06:14,340 –> 00:06:17,070
کنیم. شما وارد پایتون میشوید
175
00:06:17,070 –> 00:06:20,790
،
176
00:06:20,790 –> 00:06:22,740
قبل از شروع نوشتن اسکریپت خود برای
177
00:06:22,740 –> 00:06:23,460
دانلود
178
00:06:23,460 –> 00:06:25,860
فایلهای tjs، باید اعلان نظر تعاملی را ببینید که میخواهیم کتابخانهای به نام درخواستها را نصب کنیم
179
00:06:25,860 –> 00:06:27,300
که به ما کمک میکند
180
00:06:27,300 –> 00:06:29,160
فایلها را از urn و
181
00:06:29,160 –> 00:06:30,270
از اینترنت کمی سادهتر از
182
00:06:30,270 –> 00:06:33,060
استفاده از کتابخانه استاندارد است، بنابراین باید
183
00:06:33,060 –> 00:06:34,060
آن را نصب کنیم
184
00:06:34,060 –> 00:06:36,040
و میتوانیم از درخواستهای نصب پیپ استفاده کنیم،
185
00:06:36,040 –> 00:06:38,650
اما pip با پایتون 2 از قبل نصب نشده است،
186
00:06:38,650 –> 00:06:42,820
بنابراین باید برای
187
00:06:42,820 –> 00:06:45,820
اسکریپتی به نام get pip در گوگل جستجو کنیم که اکنون میتوانیم
188
00:06:45,820 –> 00:06:47,710
از آنجایی که پایتون را در پوشه برنامهها نصب کردهایم، روی دسکتاپ خود ذخیره
189
00:06:47,710 –> 00:06:51,010
کنید،
190
00:06:51,010 –> 00:06:54,100
به سادگی میتوانیم این را با نگاهی
191
00:06:54,100 –> 00:06:55,840
به مسیر فایل اجرایی بررسی کنیم و به امتیازات مدیریت نیاز داریم
192
00:06:55,840 –> 00:06:58,270
و این یعنی ما آنها را
193
00:06:58,270 –> 00:07:00,160
با پوستهای که بهتازگی باز کردهایم نداریم، پس
194
00:07:00,160 –> 00:07:02,860
بیایید PowerShell را باز کنیم. در حالت ادمین
195
00:07:02,860 –> 00:07:05,650
پس بیایید به دسکتاپ خود برویم زیرا همانطور
196
00:07:05,650 –> 00:07:07,990
که متوجه خواهید شد ما در دایرکتوری اصلی خود شروع به کار نکردیم
197
00:07:07,990 –> 00:07:08,710
198
00:07:08,710 –> 00:07:13,930
متأسفیم و اکنون می
199
00:07:13,930 –> 00:07:16,840
توانیم اسکریپت را با پایتون اجرا کنیم آنچه را که دیدید در
200
00:07:16,840 –> 00:07:18,880
آنجا تکمیل برگه بود بنابراین من tab را فشار می دهم
201
00:07:18,880 –> 00:07:21,000
و تکمیل می شود. نام فایل برای من
202
00:07:21,000 –> 00:07:22,990
به همین دلیل است که من کل گوشی را کامل ننوشتم
203
00:07:22,990 –> 00:07:24,880
او که در مورد آن است شما اکنون
204
00:07:24,880 –> 00:07:27,880
پیپ را وارد کنید باید کار کند و همچنین باید
205
00:07:27,880 –> 00:07:30,010
کتابخانه درخواست ها را از
206
00:07:30,010 –> 00:07:31,900
پوسته مدیریت نصب کنیم، بنابراین بیایید درخواست نصب پیپ را انجام دهیم
207
00:07:31,900 –> 00:07:34,810
و من قبلاً آن را نصب کردهام،
208
00:07:34,810 –> 00:07:36,640
بنابراین دوباره این کار را انجام نمیدهد، اما
209
00:07:36,640 –> 00:07:37,960
برای شما باید ببینید که در حال
210
00:07:37,960 –> 00:07:39,670
دانلود کردن کتابخانه است و
211
00:07:39,670 –> 00:07:41,800
آن را نصب میکند، بیایید به پوسته معمولی خود برگردیم و
212
00:07:41,800 –> 00:07:46,300
به دسکتاپ خود برویم و در اینجا
213
00:07:46,300 –> 00:07:49,000
شروع به نوشتن اسکریپت دانلود خود میکنیم. بنابراین
214
00:07:49,000 –> 00:07:51,790
من notepad plus plus را باز می کنم و سپس
215
00:07:51,790 –> 00:07:54,060
به سرعت می خواهم این را به عنوان
216
00:07:54,060 –> 00:07:56,980
دانلود pi ذخیره کنم، باید
217
00:07:56,980 –> 00:07:58,330
کمی از درخواستی که ما
218
00:07:58,330 –> 00:08:01,840
نصب کرده ایم و همچنین ماژول سیستم عامل استفاده
219
00:08:01,840 –> 00:08:03,340
کنیم زیرا در حال انجام برخی از عملیات سیستم فایل هستیم.
220
00:08:03,340 –> 00:08:07,690
حالا اگر به TGA نگاه کنید، بیایید
221
00:08:07,690 –> 00:08:09,640
دوباره بایگانی را جستجو کنیم، اکنون
222
00:08:09,640 –> 00:08:12,550
TGS یا CSV را دانلود کنید، میبینید که
223
00:08:12,550 –> 00:08:14,770
همه نامهای بسیار مشابهی دارند، بنابراین
224
00:08:14,770 –> 00:08:16,570
ما فقط باید با استفاده از
225
00:08:16,570 –> 00:08:19,030
ایندکس صحیح اینجا را جایگزین کنیم و یک
226
00:08:19,030 –> 00:08:21,880
URL جدید در واقع به سادگی کپی کنیم.
227
00:08:21,880 –> 00:08:23,800
آدرس پیوند و من می خواهم این را
228
00:08:23,800 –> 00:08:26,530
به عنوان یک الگو درج کنم، بنابراین از یک رشته خام
229
00:08:26,530 –> 00:08:28,480
در اینجا استفاده می کنم که در واقع
230
00:08:28,480 –> 00:08:29,860
در این مورد ضروری نیست، فقط می خواهم
231
00:08:29,860 –> 00:08:31,630
مطمئن شوم که هر نوع
232
00:08:31,630 –> 00:08:33,789
کاراکتر خاصی مانند اسلش های برگشتی برای مثال
233
00:08:33,789 –> 00:08:35,350
اگر تی هی در رشته ظاهر می شوند و
234
00:08:35,350 –> 00:08:36,940
معنی خاصی ندارند. من می
235
00:08:36,940 –> 00:08:39,190
خواهم این آخرین دنباله
236
00:08:39,190 –> 00:08:42,220
سه صفر را با یک مکان نگهدار جایگزین کنم که آن را
237
00:08:42,220 –> 00:08:45,550
index می نامم و بعداً می خواهیم
238
00:08:45,550 –> 00:08:46,970
مکان نگهدار را
239
00:08:46,970 –> 00:08:49,250
با شاخص صحیح جایگزین کنیم، البته ما.
240
00:08:49,250 –> 00:08:51,320
باید به پایتون بگوییم که مطمئن شود
241
00:08:51,320 –> 00:08:53,930
رشته جایگزین دقیقاً
242
00:08:53,930 –> 00:08:55,850
سه کاراکتر دارد و بقیه را با صفر پر کند،
243
00:08:55,850 –> 00:08:58,580
بنابراین من میخواهم double double را اضافه کنم
244
00:08:58,580 –> 00:09:03,290
: 0 3 D نحوی برای این
245
00:09:03,290 –> 00:09:05,030
نوع چیزها است، میتوانید آن را جستجو کنید اگر
246
00:09:05,030 –> 00:09:06,950
اکنون فقط قالب بندی رشته پایتون را
247
00:09:06,950 –> 00:09:08,420
برای تابع اصلی
248
00:09:08,420 –> 00:09:14,680
ما جستجو کنید، ما از 0 تا 15 را تکرار می
249
00:09:15,880 –> 00:09:20,120
کنیم، به همین دلیل است که من از x محدوده 16 استفاده می کنم و
250
00:09:20,120 –> 00:09:23,900
URL شما را با استفاده از
251
00:09:23,900 –> 00:09:27,440
روش فرمت در x برابر در لینوکس و فقط برای
252
00:09:27,440 –> 00:09:29,360
اهداف آزمایشی ارائه می کنیم.
253
00:09:29,360 –> 00:09:31,640
آدرسهایی را که اکنون تولید میکنیم چاپ میکنیم
254
00:09:31,640 –> 00:09:36,190
255
00:09:36,190 –> 00:09:38,330
وقتی اسکریپت از خط نظر اجرا میشود، به سرعت تابع اصلی خود را فراخوانی میکند
256
00:09:38,330 –> 00:09:42,440
و فقط آن را از پوسته ما اجرا
257
00:09:42,440 –> 00:09:44,690
میکنیم، خیلی خوب به نظر میرسد،
258
00:09:44,690 –> 00:09:48,560
این همان چیزی است که میخواهیم و اکنون میتوانیم
259
00:09:48,560 –> 00:09:51,890
با قاطعیت ادامه دهیم. با وارد کردن نام فایل
260
00:09:51,890 –> 00:09:53,900
که محتویات URL باید Gym را ذخیره کند،
261
00:09:53,900 –> 00:09:57,020
بنابراین می گوییم نام فایل برابر است و
262
00:09:57,020 –> 00:10:01,280
می توانیم از کتابخانه مسیر POSIX استفاده کنیم
263
00:10:01,280 –> 00:10:03,560
که با مسیرها و سیستم فایل POSIX سروکار
264
00:10:03,560 –> 00:10:06,170
دارد و از آنجایی که پوشه ها مقداری فاصله
265
00:10:06,170 –> 00:10:07,850
و اسلش رو به جلو دارند، می توانیم از آن نیز استفاده
266
00:10:07,850 –> 00:10:11,090
کنیم. your else بنابراین ما می توانیم از نام پایه مسیر POSIX استفاده کنیم
267
00:10:11,090 –> 00:10:13,580
که این قسمت از URL را به ما می دهد
268
00:10:13,580 –> 00:10:19,490
، بنابراین اگر این فایل از قبل
269
00:10:19,490 –> 00:10:21,230
وجود داشته باشد، زیرا ممکن است
270
00:10:21,230 –> 00:10:23,090
اسکریپت را در نقطه ای متوقف کرده باشید و پس از
271
00:10:23,090 –> 00:10:24,440
راه اندازی مجدد، می توانیم آن را رد کنیم،
272
00:10:24,440 –> 00:10:30,530
بنابراین اگر مسیر خوب، نام فایل است. میتوانیم
273
00:10:30,530 –> 00:10:37,640
بگوییم که پرینت از نام من گذشت و سپس
274
00:10:37,640 –> 00:10:40,490
بقیه حلقه را رد کنید، اکنون
275
00:10:40,490 –> 00:10:43,610
از کتابخانه درخواست برای باز کردن URL استفاده
276
00:10:43,610 –> 00:10:45,920
میکنیم و بسیار مهم است که آن را استریم
277
00:10:45,920 –> 00:10:47,960
کنیم زیرا در غیر این صورت محتوای
278
00:10:47,960 –> 00:10:49,460
پاسخ به طور کامل در حافظه بارگذاری میشود.
279
00:10:49,460 –> 00:10:51,260
قبل از اینکه ما فرصتی برای
280
00:10:51,260 –> 00:10:53,930
کار با داده ها داشته باشیم و البته من فریاد می زنم
281
00:10:53,930 –> 00:10:56,930
که البته اگر شما
282
00:10:56,930 –> 00:10:58,850
آن را استریم کنید می توانیم از سرور بخوانیم
283
00:10:58,850 –> 00:11:00,680
و در همان
284
00:11:00,680 –> 00:11:03,260
زمان فایل را به سیستم فایل منتقل می کنیم تا
285
00:11:03,260 –> 00:11:04,520
نتیجه بسیار بیشتری داشته باشد. روش جدید
286
00:11:04,520 –> 00:11:07,790
دانلود فایل ها اکنون نام فایل
287
00:11:07,790 –> 00:11:10,490
را در حالت باینری سمت راست باز می کنیم که بسیار
288
00:11:10,490 –> 00:11:13,910
مهم است زیرا حالت غیر باینری
289
00:11:13,910 –> 00:11:17,060
محتوا را به عنوان متن مدیریت می کند و
290
00:11:17,060 –> 00:11:18,980
کاراکترهای خط جدید را با
291
00:11:18,980 –> 00:11:21,320
دنباله خط جدید مناسب برای پلتفرم جایگزین می کند که
292
00:11:21,320 –> 00:11:24,020
در موارد ویندوز CLR F من چنین است.
293
00:11:24,020 –> 00:11:26,089
فید خط نوبت کاراکتر که ما نمیخواهیم، بنابراین فق
294
00:11:26,089 –> 00:11:27,830
میخواهیم دادههای باینری را دریافت کنیم و دا
295
00:11:27,830 –> 00:11:30,110
ههای باینری بنویسیم، اکنون میخواهیم رو
296
00:11:30,110 –> 00:11:32,959
تکههایی که از
297
00:11:32,959 –> 00:11:38,300
رور دریافت میکنیم تکرار کنیم و اندازه قطعه 1024
298
00:11:38,300 –> 00:11:41,300
ایت است و سپس به سادگی می
299
00:11:41,300 –> 00:11:45,620
نویسیم. آن تکه فایل و قبل از اینکه
300
00:11:45,620 –> 00:11:48,950
فایل را باز کنیم یا آن را دانلود کنیم من
301
00:11:48,950 –> 00:11:50,060
به سادگی می خواهم آن را پرینت بگیرم که در حال
302
00:11:50,060 –> 00:11:52,940
دانلود آن هستیم تا بدانیم در کنسول با چه چیزی سر و کار
303
00:11:52,940 –> 00:11:54,160
داریم،
304
00:11:54,160 –> 00:12:02,870
بیایید سعی کنیم اکنون
305
00:12:02,870 –> 00:12:04,580
این کار انجام شود.
306
00:12:04,580 –> 00:12:06,200
تا زمانی که دانلود به پایان رسید، ادامه
307
00:12:06,200 –> 00:12:08,029
می دهیم، می توانید روی دسکتاپ ما همه مواردی را
308
00:12:08,029 –> 00:12:09,890
که اینجا دانلود کرده ایم ببینید، اکنون این
309
00:12:09,890 –> 00:12:13,010
فایل های CSV فشرده شده gzip هستند و
310
00:12:13,010 –> 00:12:15,470
می توانیم آنها را با رمز ۷ زیپ از حالت فشرده
311
00:12:15,470 –> 00:12:17,120
خارج کنیم تا از اینجا استخراج کنیم. به آن توجه کنید و
312
00:12:17,120 –> 00:12:19,880
نه، نیم تنه است، می توانید ببینید که بسیار
313
00:12:19,880 –> 00:12:20,390
بزرگ است،
314
00:12:20,390 –> 00:12:23,750
من حدود 130000 ورودی در اینجا دارم و
315
00:12:23,750 –> 00:12:26,570
این هدر است که می گوید
316
00:12:26,570 –> 00:12:27,830
نام هر یک از
317
00:12:27,830 –> 00:12:29,990
ستون ها را مشخص می کند که ما نمی خواهیم همه
318
00:12:29,990 –> 00:12:31,490
این فایل ها را از حالت فشرده خارج کنیم زیرا می توانیم این کار را انجام دهیم. که در
319
00:12:31,490 –> 00:12:33,830
هودینی از پایتون و ما واقعاً
320
00:12:33,830 –> 00:12:35,839
با از حالت فشرده کردن آنها به صورت دستی در زمان صرفه جویی نمی کنیم،
321
00:12:35,839 –> 00:12:37,459
اگر این کار را از طریق اسکریپت پایتون انجام
322
00:12:37,459 –> 00:12:39,290
دهیم، خیلی کندتر بارگذاری نمی شود، بنابراین اکنون که فایل ها را در اختیار داریم،
323
00:12:39,290 –> 00:12:40,850
بارگذاری مستقیم آنها از نسخه فشرده بسیار راحت است.
324
00:12:40,850 –> 00:12:42,170
325
00:12:42,170 –> 00:12:44,089
میتوانیم مستقیماً وارد نام VD شویم،
326
00:12:44,089 –> 00:12:46,040
بیایید با یک گره هندسه شروع کنیم
327
00:12:46,040 –> 00:12:49,600
و در داخل آن گره فایل را حذف کنیم و
328
00:12:49,600 –> 00:12:52,400
یک زیر پایتون ایجاد کنیم، اکنون در اینجا
329
00:12:52,400 –> 00:12:54,740
یک کد پیشفرض وجود دارد که ما
330
00:12:54,740 –> 00:12:57,620
قصد نداریم آنها را حذف کنیم، زیرا به
331
00:12:57,620 –> 00:12:59,270
گره و هندسه مورد نیاز خود نیاز داریم.
332
00:12:59,270 –> 00:13:01,520
با دادهها پر میشود و ممکن است
333
00:13:01,520 –> 00:13:04,190
تعجب کنید که نام KU
334
00:13:04,190 –> 00:13:06,529
از ماژول Houdini Python است که به
335
00:13:06,529 –> 00:13:09,440
طور پیشفرض در این فضای نام موجود است،
336
00:13:09,440 –> 00:13:11,420
اما من آن را بهویژه
337
00:13:11,420 –> 00:13:13,460
برای مبتدیها گیجکننده میدانم، بنابراین من آن را دوست
338
00:13:13,460 –> 00:13:16,190
دارم با مرتب کردن صریح آن در
339
00:13:16,190 –> 00:13:18,680
بالای اسکریپت، ما به راهی برای تعریف کردن در فهرست یادداشت نیاز داریم که در
340
00:13:18,680 –> 00:13:20,510
آن همه فایلهای ما
341
00:13:20,510 –> 00:13:23,090
در آنجا خوانده میشوند، اضافه کردن
342
00:13:23,090 –> 00:13:25,250
پارامتری برای محدود کردن تعداد نقاط داده
343
00:13:25,250 –> 00:13:27,290
برای بارگذاری نیز راحت است، زیرا اگر فقط در حال
344
00:13:27,290 –> 00:13:29,180
آزمایش خود باشیم. جستجوی اسکریپت برای
345
00:13:29,180 –> 00:13:34,220
فیلد رشته ای که در حال حاضر خط
346
00:13:34,220 –> 00:13:36,740
کشیده شده است و ما به یک
347
00:13:36,740 –> 00:13:40,310
عدد صحیح برای محدود کردن تعداد نقاط
348
00:13:40,310 –> 00:13:42,830
برای بارگذاری در مدول با پایتون نیاز
349
00:13:42,830 –> 00:13:44,060
داریم، زمانی که ما به تازگی
350
00:13:44,060 –> 00:13:46,010
اسکریپت خود را توسعه می دهیم، زیرا
351
00:13:46,010 –> 00:13:47,660
بارگذاری کل مجموعه زمان زیادی می برد
352
00:13:47,660 –> 00:13:49,190
و
353
00:13:49,190 –> 00:13:50,420
هر بار که خط را عوض می کنیم دو دقیقه منتظر می مانیم
354
00:13:50,420 –> 00:13:52,450
و فقط ببینیم که آیا کار می کند
355
00:13:52,450 –> 00:13:57,170
قابل قبول نیست و هیچ سرگرم کننده ای ندارد بنابراین
356
00:13:57,170 –> 00:14:00,430
من این یکی را اینجا دایرکتوری صدا
357
00:14:00,430 –> 00:14:03,110
می کنم و در واقع نیازی ندارم یک فیلد رشتهای اما در
358
00:14:03,110 –> 00:14:06,880
عوض یک فیلد فایل که فقط خواندنی است
359
00:14:06,880 –> 00:14:10,130
، دایرکتوری را فراخوانی میکند، بیایید
360
00:14:10,130 –> 00:14:13,070
اعمال کنیم که اکنون در اینجا میتوانیم پارامتر دایرکتوری خود را بخوانیم
361
00:14:13,070 –> 00:14:16,160
میتوانیم از تابع parm بد استفاده
362
00:14:16,160 –> 00:14:18,170
کنیم که پارامتر را بازیابی کرده
363
00:14:18,170 –> 00:14:20,510
و بلافاصله آن را ارزیابی میکند.
364
00:14:20,510 –> 00:14:22,010
ما فقط مقداری را دریافت می کنیم که می
365
00:14:22,010 –> 00:14:24,920
توانید در داخل اینجا در هودینی نیز مشاهده کنید،
366
00:14:24,920 –> 00:14:29,500
اکنون همین کار را برای ردیف های حداکثر
367
00:14:29,500 –> 00:14:31,910
انجام دهید، فقط کمی تست کنید بیایید
368
00:14:31,910 –> 00:14:35,420
دایرکتوری را چاپ کنیم و ردیف های بعدی را چاپ
369
00:14:35,420 –> 00:14:37,550
کنیم، در واقع ما در پایتون 2 هستیم، بنابراین به پرانتز نیازی نداریم.
370
00:14:37,550 –> 00:14:40,300
اوه،
371
00:14:40,300 –> 00:14:43,460
اجازه دهید application را اجرا کنیم و می بینید که
372
00:14:43,460 –> 00:14:45,920
یک رشته خالی داریم و 0 بیایید
373
00:14:45,920 –> 00:14:47,510
مستقیم برویم یا دسکتاپ جایی که
374
00:14:47,510 –> 00:14:50,810
فایل های داده t.j.s خود را داریم و پذیرش را فشار دهیم،
375
00:14:50,810 –> 00:14:51,500
متاسفم
376
00:14:51,500 –> 00:14:53,390
در واقع برای انتخاب یک دایرکتوری
377
00:14:53,390 –> 00:14:54,980
باید به دایرکتوری والد بروید،
378
00:14:54,980 –> 00:14:56,840
مانند دایرکتوری است. در اینجا و پذیرش را فشار دهید
379
00:14:56,840 –> 00:14:58,970
و اکنون می توانید ببینید که ما
380
00:14:58,970 –> 00:15:00,770
مسیر دسکتاپ را برای
381
00:15:00,770 –> 00:15:04,670
پارامتر دایرکتوری داریم و ما به
382
00:15:04,670 –> 00:15:06,590
ماژول csv نیاز داریم زیرا
383
00:15:06,590 –> 00:15:08,420
داده های CSV را می خوانیم اما قبل از آن
384
00:15:08,420 –> 00:15:10,640
به ماژول gzip نیز نیاز داریم تا
385
00:15:10,640 –> 00:15:14,060
اکنون در تابع اصلی خود، داده ها را در حال از حالت فشرده خارج کنید
386
00:15:14,060 –> 00:15:15,800
، فقط بررسی می کنیم که آیا
387
00:15:15,800 –> 00:15:18,470
مقدار دایرکتوری نداریم، بنابراین آیا رشته در اینجا
388
00:15:18,470 –> 00:15:21,370
خالی است، ما فقط کاری انجام نمی دهیم و
389
00:15:21,370 –> 00:15:25,100
همچنین اگر دایرکتوری وجود نداشته باشد،
390
00:15:25,100 –> 00:15:28,680
باید همچنین فقط از کل
391
00:15:28,680 –> 00:15:30,869
اجرا رد شوید از یادداشت فرعی، اکنون
392
00:15:30,869 –> 00:15:32,430
باید تمام فایلهایی را
393
00:15:32,430 –> 00:15:34,350
که میخواهیم از دایرکتوری بارگذاری
394
00:15:34,350 –> 00:15:36,240
کنیم، مشخص کنیم، بنابراین فهرست را فهرست
395
00:15:36,240 –> 00:15:38,809
میکنیم، بنابراین برای نام در فهرست OS اینجا میگوییم
396
00:15:38,809 –> 00:15:42,480
و بررسی میکنیم که آیا نام به پایان میرسد یا خیر.
397
00:15:42,480 –> 00:15:49,259
با CSV GZ اوه و ما می خواهیم
398
00:15:49,259 –> 00:15:52,110
آن را به لیست فایل ها اضافه کنیم و می خواهیم
399
00:15:52,110 –> 00:15:55,079
آن را به صورت نیمه مطلق اضافه کنیم تا
400
00:15:55,079 –> 00:15:57,600
با نام دایرکتوری قبلی به آن ملحق شویم و سپس
401
00:15:57,600 –> 00:15:59,910
می توانیم لیست را مرتب کنیم زیرا
402
00:15:59,910 –> 00:16:03,029
بارگیری آن منطقی است قسمت
403
00:16:03,029 –> 00:16:05,040
اول دادهها را مانند قسمت دوم میدانیم، بنابراین میخواهیم
404
00:16:05,040 –> 00:16:06,480
آنها را بر اساس نامشان مرتب کنیم که
405
00:16:06,480 –> 00:16:07,800
به طور خودکار ترتیب درستی در آینده به ما میدهد
406
00:16:07,800 –> 00:16:09,990
که رشتههای مرتبسازی چگونه
407
00:16:09,990 –> 00:16:11,999
کار میکنند و در واقع ما همچنین باید
408
00:16:11,999 –> 00:16:13,860
ماژول سیستمعامل را وارد کنیم زیرا من از آن در اینجا استفاده میکنم.
409
00:16:13,860 –> 00:16:17,269
در این بخش اکنون میتوانیم
410
00:16:17,269 –> 00:16:19,889
لیست فایلها را چاپ کنیم و همچنین باید
411
00:16:19,889 –> 00:16:23,309
اسکریپت خود را فراخوانی کنیم که تابع اصلی ما با عنوان application
412
00:16:23,309 –> 00:16:25,800
گفته میشود و میبینیم که
413
00:16:25,800 –> 00:16:27,839
یک فایل واحد در آنجا نداریم و این به این
414
00:16:27,839 –> 00:16:31,230
دلیل است که اوه من از C به جای B استفاده کردم. C’s
415
00:16:31,230 –> 00:16:34,110
be easy fix و می توانید ببینید که ما
416
00:16:34,110 –> 00:16:37,620
همه 16 فایل را در این فایل داریم لیست با نگاهی
417
00:16:37,620 –> 00:16:39,689
به دادههای ما، بیایید به سرعت بخوانیم
418
00:16:39,689 –> 00:16:41,970
چه نوع دادههایی را میخواهیم
419
00:16:41,970 –> 00:16:43,529
از بایگانی CSV استخراج کنیم،
420
00:16:43,529 –> 00:16:46,439
دوباره این را از حالت فشرده
421
00:16:46,439 –> 00:16:48,629
422
00:16:48,629 –> 00:16:51,149
خارج میکنیم. به چه داده هایی
423
00:16:51,149 –> 00:16:53,699
برای اختلاف منظر نیاز داریم که دقیقاً
424
00:16:53,699 –> 00:16:55,589
در اینجا وجود دارد توجه داشته باشید که همه آن ها با حروف کوچک هستند
425
00:16:55,589 –> 00:16:57,929
زیرا در مستندات همه آن ها با
426
00:16:57,929 –> 00:16:59,879
حروف بزرگ بودند، اما در واقع همه عناوین در اینجا
427
00:16:59,879 –> 00:17:02,129
کوچک هستند و در
428
00:17:02,129 –> 00:17:05,909
نهایت آنها lb ما هستند و او فکر می کرد که به معنای
429
00:17:05,909 –> 00:17:09,029
ستون های Meg است که اکنون ما می تواند به نوعی شمارش کند که چه
430
00:17:09,029 –> 00:17:11,309
نمایه های ستونی دارد، ستون هایی که ما
431
00:17:11,309 –> 00:17:13,020
نخواهیم داشت.
432
00:17:13,020 –> 00:17:14,569
433
00:17:14,569 –> 00:17:16,890
434
00:17:16,890 –> 00:17:18,359
435
00:17:18,359 –> 00:17:19,589
منظور من در یک
436
00:17:19,589 –> 00:17:25,230
ثانیه است، بنابراین ما روی هر فایلی
437
00:17:25,230 –> 00:17:30,029
در لیست فایلها تکرار میکنیم و آنها را با یک
438
00:17:30,029 –> 00:17:33,510
ماژول g-sib باز میکنیم که به ما یک
439
00:17:33,510 –> 00:17:34,889
دسته فایل میدهد که میتوانیم
440
00:17:34,889 –> 00:17:36,270
دادههای
441
00:17:36,270 –> 00:17:39,380
فشردهنشده را بخوانیم و میتوانیم آنها را در یک سیدی قرار دهیم.
442
00:17:39,380 –> 00:17:44,790
شی خواننده و ج ust برای تست، ما می خواهیم
443
00:17:44,790 –> 00:17:48,410
ردیف اول را از فایل CSV بخوانیم و
444
00:17:48,410 –> 00:17:49,950
همانجا را بشکنیم،
445
00:17:49,950 –> 00:17:51,929
زیرا فعلاً نمی خواهیم این کار را برای
446
00:17:51,929 –> 00:17:53,