در این مطلب، ویدئو Josh Weissbock: Web Scraping در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:22:01
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:01,880 –> 00:00:04,260
بنابراین بله، من در واقع متوجه شدم
2
00:00:04,260 –> 00:00:05,939
که این سخنرانی را فقط 48 ساعت پیش انجام میدادم،
3
00:00:05,939 –> 00:00:08,160
بنابراین دیروز همه آنها را جمعآوری کردم، مطمئن
4
00:00:08,160 –> 00:00:10,410
هستم که برخی از جزئیات کلیدی را از دست دادهام، بنابراین اگر سؤالی داشتید، دوست دارم
5
00:00:10,410 –> 00:00:12,030
در مورد آن صحبت کنم.
6
00:00:12,030 –> 00:00:15,540
نام من
7
00:00:15,540 –> 00:00:17,519
جاش وایز باک است و در مورد
8
00:00:17,519 –> 00:00:19,380
خراشهای وب توزیع شده
9
00:00:19,380 –> 00:00:25,589
و پایتون در 20 دقیقه آینده صحبت میکنم،
10
00:00:25,589 –> 00:00:27,689
هدف من در اینجا این است که به شما نشان دهم چگونه
11
00:00:27,689 –> 00:00:30,060
و چرا میتوانید یک وباسکریپر متمایز
12
00:00:30,060 –> 00:00:32,759
در پایتون بسازید تا وفاداری شما در اسکراپینگ وب بهبود یابد.
13
00:00:32,759 –> 00:00:38,280
مشاغل
14
00:00:38,280 –> 00:00:40,140
چاکلی چه چیزی را من وارد می کنیم که خراش دادن
15
00:00:40,140 –> 00:00:42,000
چیست، ما به ساختن یک
16
00:00:42,000 –> 00:00:44,130
رویکرد تکراری در ساخت یک اسکراپر
17
00:00:44,130 –> 00:00:46,350
و رسیدن به وضعیت نهایی که در
18
00:00:46,350 –> 00:00:48,180
آن یک خراش توزیع شده داریم و به
19
00:00:48,180 –> 00:00:49,860
توسعه آینده نگاه می کنیم و سپس
20
00:00:49,860 –> 00:00:55,770
شامل این بحث را شروع کنید،
21
00:00:55,770 –> 00:00:57,780
اجازه دهید از خودم شروع کنم، نام من جاش
22
00:00:57,780 –> 00:00:59,550
ویزباخ است. من از
23
00:00:59,550 –> 00:01:03,500
سال 2008 که در دانشگاه بودم، کاربر پایتون هستم،
24
00:01:03,500 –> 00:01:05,459
متأسفانه
25
00:01:05,459 –> 00:01:08,490
به دلیل تمام پلتفرمهای داده قدیمی
26
00:01:08,490 –> 00:01:11,100
که روی آنها کار میکنم، هنوز از Python 2.7 استفاده میکنم. آ و به عنوان یک تیم، بقیه
27
00:01:11,100 –> 00:01:12,540
اعضای تیم من ویژگی های جدید را به
28
00:01:12,540 –> 00:01:16,350
جای ارتقا به پایتون 3 در
29
00:01:16,350 –> 00:01:17,340
طول روزی که در دولت کانادا
30
00:01:17,340 –> 00:01:19,590
در ویکتوریا بریتیش کلمبیا کار می کنم
31
00:01:19,590 –> 00:01:21,210
ترجیح می
32
00:01:21,210 –> 00:01:23,520
دهند. هر پلتفرم میگوید جیم یک روز مورد XP
33
00:01:23,520 –> 00:01:25,229
در حال حاضر همه رئیسجمهورها
34
00:01:25,229 –> 00:01:29,250
روز به روز در فرانسه نمیبینند و سپس من
35
00:01:29,250 –> 00:01:31,470
شغل دومی در لیگ ملی هاکی
36
00:01:31,470 –> 00:01:33,200
دارم که در آنجا به عنوان تحلیلگر داده کار میکنم،
37
00:01:33,200 –> 00:01:37,409
اساساً علم داده Moneyball برای
38
00:01:37,409 –> 00:01:40,170
تیم لیگ ملی هاکی و این
39
00:01:40,170 –> 00:01:42,030
واقعاً همان نوع کاری است
40
00:01:42,030 –> 00:01:44,070
که در هر نوع دیگری از
41
00:01:44,070 –> 00:01:47,820
زمینه های تجزیه و تحلیل داده های علم داده می بینید، به جز اینکه
42
00:01:47,820 –> 00:01:50,850
دامنه متفاوت است و اینجاست که من
43
00:01:50,850 –> 00:01:53,780
از این بحث خارج می شوم،
44
00:01:57,130 –> 00:02:00,410
بنابراین مسئولیت من در تیم NHL
45
00:02:00,410 –> 00:02:02,540
من است. من اساساً مسئول
46
00:02:02,540 –> 00:02:04,730
کل خط لوله اطلاعات هستم. من
47
00:02:04,730 –> 00:02:06,800
مسئول جمع آوری داده ها، داده های ذخیره سازی
48
00:02:06,800 –> 00:02:08,180
، تمیز کردن داده ها آماده سازی داده
49
00:02:08,180 –> 00:02:11,450
هایی هستم که تا زمان انجام آن حدود 80٪ از کار من را
50
00:02:11,450 –> 00:02:12,740
به خود اختصاص می دهد، من واقعاً هیچ
51
00:02:12,740 –> 00:02:14,540
تلاش یا ذهنی ندارم. انرژی برای کار کردن
52
00:02:14,540 –> 00:02:18,170
خود تجزیه و تحلیل، بنابراین من
53
00:02:18,170 –> 00:02:19,460
مسئولیت اصلی را که در نهایت به بقیه اعضای تیم من می رسد، به
54
00:02:19,460 –> 00:02:22,700
پایان می رسانم، به همین دلیل
55
00:02:22,700 –> 00:02:24,860
باید مطمئن شوم که
56
00:02:24,860 –> 00:02:27,380
داده های به روزی داریم که معتبر هستند و
57
00:02:27,380 –> 00:02:32,270
تا حد امکان کامل جمع آوری شده اند. هر
58
00:02:32,270 –> 00:02:34,010
شب ما اسکریپت های زیادی را اجرا می کنیم و داده های زیادی را
59
00:02:34,010 –> 00:02:36,110
جمع آوری می کنیم، بنابراین
60
00:02:36,110 –> 00:02:37,610
اطلاعات به روز شده ای داریم
61
00:02:37,610 –> 00:02:39,440
و من باید اطمینان حاصل کنم که این اسکریپت ها
62
00:02:39,440 –> 00:02:41,150
می توانند با وفاداری بالا اجرا شوند، به این معنی
63
00:02:41,150 –> 00:02:43,840
که ما تا حد امکان داده ها را جمع آوری می کنیم تا
64
00:02:43,840 –> 00:02:46,010
اطمینان حاصل کنیم که معتبر هستند و ما
65
00:02:46,010 –> 00:02:52,820
هیچ اطلاعات کلیدی را از دست ندهید، ببینید این
66
00:02:52,820 –> 00:02:54,200
بحث واقعاً در مورد داده های مجموعه است،
67
00:02:54,200 –> 00:02:59,120
جایی است که ما روی خراش دادن وب خود تمرکز می کنیم تا
68
00:02:59,120 –> 00:03:02,450
همه ما بتوانیم بر اساس
69
00:03:02,450 –> 00:03:05,420
سناریوهای نمونه یک مورد استفاده اساسی از
70
00:03:05,420 –> 00:03:07,910
آنچه که خراش دادن به
71
00:03:07,910 –> 00:03:09,230
چه صورت است، استفاده کنیم. برای جمعآوری اطلاعات زیادی
72
00:03:09,230 –> 00:03:12,170
از یک وبسایت، این کار
73
00:03:12,170 –> 00:03:15,050
در جایی که هر صفحه وب دقیقاً
74
00:03:15,050 –> 00:03:16,340
طرحبندی مشابهی دارد، آسان میکند، بنابراین ما میدانیم اطلاعات در کجای
75
00:03:16,340 –> 00:03:18,290
صفحه قرار دارد، اما سعی میکنیم
76
00:03:18,290 –> 00:03:20,360
تعداد زیادی از آنها را جمعآوری کنیم، به عنوان مثال اگر
77
00:03:20,360 –> 00:03:21,770
میخواهید برای جمعآوری
78
00:03:21,770 –> 00:03:23,959
اطلاعات از مقالات ویکیپدیا یا
79
00:03:23,959 –> 00:03:26,090
اگر میخواهید اطلاعاتی را از
80
00:03:26,090 –> 00:03:30,110
کتابهای خارج از آمازون مانند
81
00:03:30,110 –> 00:03:31,850
نویسنده پیت یا شماره صفحه،
82
00:03:31,850 –> 00:03:36,739
زبان شابک، زبان بررسیها و غیره جمعآوری
83
00:03:36,739 –> 00:03:37,970
کنید، استفاده کنید تا بتوانیم از پایتون برای ساختن
84
00:03:37,970 –> 00:03:39,620
اسکراپر استفاده کنیم. همه این کارها را بسیار
85
00:03:39,620 –> 00:03:42,350
ساده و آسان انجام دهید،
86
00:03:42,350 –> 00:03:43,940
مشکل زمانی پیش میآید که میخواهید این کار را نه
87
00:03:43,940 –> 00:03:46,190
فقط یک بار بلکه 15000 بار متوالی انجام دهید و
88
00:03:46,190 –> 00:03:49,630
اعتماد کنید که چه چیزی کار میکند.
89
00:03:52,959 –> 00:03:55,099
90
00:03:55,099 –> 00:03:59,269
91
00:03:59,269 –> 00:04:02,629
دادهها را درخواست کنید و برای شروع تجزیه آنها
92
00:04:02,629 –> 00:04:04,550
اگر تا به حال با هر نوع اسکریپ وب بازی
93
00:04:04,550 –> 00:04:05,810
کردهاید، احتمالاً
94
00:04:05,810 –> 00:04:09,200
از درخواستهای مشابه یا URL Lib یا
95
00:04:09,200 –> 00:04:11,989
lm22 خود برای رسیدگی به بخش HDTV
96
00:04:11,989 –> 00:04:15,260
درخواستهای خود استفاده مشابهی انجام دادهاید، آیا از یک اسکریپت استفاده کردهاید.
97
00:04:15,260 –> 00:04:16,728
وبسایت را کشیده باشد،
98
00:04:16,728 –> 00:04:19,100
HTML را بیرون میکشد، هر کسی
99
00:04:19,100 –> 00:04:20,449
که آن را قبل از نوعی تجزیه یا سوپ
100
00:04:20,449 –> 00:04:21,130
زیبا
101
00:04:21,130 –> 00:04:24,770
آلوم x ll xml میگذراند و از آن برای
102
00:04:24,770 –> 00:04:26,720
خرید HTML برای گرفتن اطلاعات خاص استفاده میکند.
103
00:04:26,720 –> 00:04:27,770
n که
104
00:04:27,770 –> 00:04:31,190
در وب سایت به دنبال آن هستید و در حالت ایده آل در آن
105
00:04:31,190 –> 00:04:32,450
نقطه زمانی که اطلاعاتی در اختیار داشتید می خواهید
106
00:04:32,450 –> 00:04:33,410
آن را به کاربر برگردانید،
107
00:04:33,410 –> 00:04:35,330
چه در حال چاپ آن بر روی صفحه نمایش
108
00:04:35,330 –> 00:04:38,060
ذخیره چاپ CSV در یک فایل یا
109
00:04:38,060 –> 00:04:42,919
ذخیره آن هستید. به یک پایگاه داده، همانطور که گفتم
110
00:04:42,919 –> 00:04:45,740
انجام این کار یک بار آسان
111
00:04:45,740 –> 00:04:50,330
112
00:04:50,330 –> 00:04:54,830
113
00:04:54,830 –> 00:04:57,020
114
00:04:57,020 –> 00:04:59,600
115
00:04:59,600 –> 00:05:02,270
است. احتمالاً این را به عنوان
116
00:05:02,270 –> 00:05:04,639
یک رویکرد دو مرحله ای در نظر بگیرید، یک اسکراپر کوچکتر ایجاد می کنید
117
00:05:04,639 –> 00:05:06,470
که از طریق
118
00:05:06,470 –> 00:05:08,419
صفحه فهرست وب سایت یا از طریق نتایج جستجوی وب سایت می گذرد
119
00:05:08,419 –> 00:05:10,789
و
120
00:05:10,789 –> 00:05:12,320
لیستی از URL هایی را که می خواهید تجزیه کنید ایجاد می
121
00:05:12,320 –> 00:05:14,810
کند و سپس شروع به حلقه زدن از طریق
122
00:05:14,810 –> 00:05:18,050
آنها می کنید. نشانیهای اینترنتی برای جمعآوری اطلاعات ارزش هر صفحه
123
00:05:18,050 –> 00:05:22,039
و مثالی بسیار ساده
124
00:05:22,039 –> 00:05:23,360
، این یک ایده رویکرد خطی است
125
00:05:23,360 –> 00:05:25,280
، احتمالاً در نهایت URLها را ذخیره میکنید
126
00:05:25,280 –> 00:05:26,870
و احتمالاً چیزی را در
127
00:05:26,870 –> 00:05:29,180
حافظه فهرست میکنید و فقط آن را
128
00:05:29,180 –> 00:05:34,490
برای یک l ساده مرور میکنید. اوه اکنون باز هم
129
00:05:34,490 –> 00:05:35,870
این کار هنوز آسان است، اما
130
00:05:35,870 –> 00:05:36,800
زمانی که شما سعی می
131
00:05:36,800 –> 00:05:38,930
کنید 15000 بار متوالی استفاده کنید، مشکلاتی را به وجود می آوریم که فقط به دلیل
132
00:05:38,930 –> 00:05:39,800
ماهیت اینترنت، مشکلاتی پیش
133
00:05:39,800 –> 00:05:42,919
می آید که اینترنت شما
134
00:05:42,919 –> 00:05:44,599
ممکن است از بین برود اینترنت شما ممکن است از بین برود.
135
00:05:44,599 –> 00:05:47,360
کار را متوقف کنید، می توانید 500 خطا دریافت کنید
136
00:05:47,360 –> 00:05:50,750
و الگوهای 400 خطا ممکن است
137
00:05:50,750 –> 00:05:53,630
شکسته شوند، بنابراین برخی از صفحات ممکن است
138
00:05:53,630 –> 00:05:55,490
بر اساس الگو بر
139
00:05:55,490 –> 00:05:57,530
اساس داده های وارد شده شکسته شوند، بنابراین
140
00:05:57,530 –> 00:05:58,400
کمی مشکل وجود
141
00:05:58,400 –> 00:05:59,630
دارد، چیزی باعث خرابی اسکریپت می
142
00:05:59,630 –> 00:06:00,680
شود و احتمالاً شما این کار را می کنید. تمام
143
00:06:00,680 –> 00:06:02,000
کارهایی را که در طول شب انجام داده اید از دست بدهید،
144
00:06:02,000 –> 00:06:04,150
145
00:06:07,400 –> 00:06:09,450
بنابراین با این رویکرد ساده، حتی اگر
146
00:06:09,450 –> 00:06:10,920
آسان است، ابتدا مشکلات زیادی در مورد آن وجود دارد،
147
00:06:10,920 –> 00:06:14,070
148
00:06:14,070 –> 00:06:14,970
اگر یک اسکریپت داشته باشید که
149
00:06:14,970 –> 00:06:16,860
یک وب سایت را با چهار
150
00:06:16,860 –> 00:06:18,960
15000 صفحه چکش می کند، شناسایی می شود. اطلاعات
151
00:06:18,960 –> 00:06:20,790
بارها و بارها احتمالاً
152
00:06:20,790 –> 00:06:22,080
به عنوان یک ربات برچسب گذاری شده است و احتمالاً
153
00:06:22,080 –> 00:06:25,020
IP شما ممنوع شده است، بنابراین می دانم که همیشه
154
00:06:25,020 –> 00:06:27,510
به robots.txt احترام می گذارم و مطمئن شوید که به چه چیزی وبسی نگاه می کنید.
155
00:06:27,510 –> 00:06:29,130
از شما میخواهد که بتوانید به آن
156
00:06:29,130 –> 00:06:30,300
دسترسی داشته باشید و اینکه چقدر سریع میتوانید به
157
00:06:30,300 –> 00:06:32,240
آن دسترسی داشته باشید،
158
00:06:32,240 –> 00:06:35,250
موضوع دیگری استاتیک در مقایسه با
159
00:06:35,250 –> 00:06:38,190
محتوای پویا است، زمانی که در سالهای 2013/14 شروع به کار
160
00:06:38,190 –> 00:06:41,910
کردم، اینترنت
161
00:06:41,910 –> 00:06:44,250
ثابتتر بود و با افزایشی که داشتیم.
162
00:06:44,250 –> 00:06:45,870
در چارچوبهای جاوا اسکریپت، اگر به
163
00:06:45,870 –> 00:06:48,960
برخی از فریم ورکهای قدیمیتر واکنش زاویهای نشان دهید،
164
00:06:48,960 –> 00:06:50,940
محتوای بسیار بیشتری بهصورت پویا
165
00:06:50,940 –> 00:06:54,660
تولید میشود، بنابراین کتابخانه ساده پایتون
166
00:06:54,660 –> 00:06:56,190
مانند درخواست دیگر مفید نیست، زیرا
167
00:06:56,190 –> 00:06:57,780
نمیتوانند تولید کنند یا نمیتوانند
168
00:06:57,780 –> 00:06:59,250
جاوا اسکریپت را برای تولید آن
169
00:06:59,250 –> 00:07:06,180
محتوای جدید اجرا کنند، ما نیز مشکلاتی داریم. با یک
170
00:07:06,180 –> 00:07:08,220
رویکرد خطی ساده، زیرا ما هیچ
171
00:07:08,220 –> 00:07:11,100
راه واقعی برای ردیابی پیشرفت خود نداریم، آنچه
172
00:07:11,100 –> 00:07:15,120
تاکنون انجام دادهایم و بررسی کنیم که آیا
173
00:07:15,120 –> 00:07:17,640
قبلاً یک وبسایت بارگیری کردهایم یا نه،
174
00:07:17,640 –> 00:07:19,590
بارگیری یک وبسایت دو بار
175
00:07:19,590 –> 00:07:20,970
در زمان خراش بسیار پرهزینه است زیرا بزرگترین
176
00:07:20,970 –> 00:07:22,230
تنگنا شما این است.
177
00:07:22,230 –> 00:07:26,220
درخواست واقعی منابع خواهد بود و البته
178
00:07:26,220 –> 00:07:27,420
همانطور که گفتم مناطق زیادی وجود دارد که
179
00:07:27,420 –> 00:07:29,010
می توانند در این مسیر به شما کمک کنند
180
00:07:29,010 –> 00:07:31,410
که احتمالاً حتی انتظار آن را هم ندارید، بنابراین
181
00:07:31,410 –> 00:07:32,730
به نوعی نیاز دارید o رسیدگی به این
182
00:07:32,730 –> 00:07:36,120
خرابیها Prevention، بنابراین میخواهیم
183
00:07:36,120 –> 00:07:37,320
با تکرار بعدی اسکراپر به آنها
184
00:07:37,320 –> 00:07:41,580
بپردازیم، زیرا من صرفاً میخوردم از یک رویکرد پروکسی استفاده میکردم.
185
00:07:41,580 –> 00:07:44,690
186
00:07:44,690 –> 00:07:49,080
187
00:07:49,080 –> 00:07:50,640
188
00:07:50,640 –> 00:07:55,410
پراکسیها، سرور اسکراپر کامپیوتر مرکزی ما
189
00:07:55,410 –> 00:07:57,960
،
190
00:07:57,960 –> 00:08:00,630
درخواستها را برای منابع از طریق یک
191
00:08:00,630 –> 00:08:03,450
یا پراکسیهای مختلف تغذیه میکند، ما
192
00:08:03,450 –> 00:08:05,400
همچنین میخواهیم درخواستها را با
193
00:08:05,400 –> 00:08:09,210
استفاده از تأخیرهای تصادفی بین درخواستهایی
194
00:08:09,210 –> 00:08:11,610
که در حال شروع چرخش سرصفحهها از طریق درخواستهایمان هستیم، شروع
195
00:08:11,610 –> 00:08:12,990
کنیم. همه اینها به
196
00:08:12,990 –> 00:08:16,260
ما کمک میکنند که
197
00:08:16,260 –> 00:08:18,690
طرف شناسایی ربات در حذف این موارد،
198
00:08:18,690 –> 00:08:21,000
درخواستهای شما را بیشتر
199
00:08:21,000 –> 00:08:22,860
شبیه کاربرانی واقعی میکند که صفحات را درخواست میکنند، نه
200
00:08:22,860 –> 00:08:24,390
اینکه اسکریپت شما فقط
201
00:08:24,390 –> 00:08:27,930
وبسایتی را که ما میخواهیم اثبات
202
00:08:27,930 –> 00:08:29,820
کنیم میخواهم مشکل پیشنویس
203
00:08:29,820 –> 00:08:33,839
جاوا اسکریپت را با انتقال از درخواستها یا
204
00:08:33,839 –> 00:08:35,820
URL Lib به چیزی که بتواند
205
00:08:35,820 –> 00:08:38,099
جاوا اسکریپت را مدیریت کند برطرف کنم و ترجیح من
206
00:08:38,099 –> 00:08:39,570
چیزی شبیه سلنیوم با سر است. مرورگرهای کمتر
207
00:08:39,570 –> 00:08:48,300
208
00:08:48,300 –> 00:08:49,890
از نظر منابع استفاده شده و زمان
209
00:08:49,890 –> 00:08:51,210
اجرای واقعی آن کمی گران تر هستند، اما در واقع
210
00:08:51,210 –> 00:08:53,880
به شما این امکان را می دهد که جاوا اسکریپت خود را اجرا کنید
211
00:08:53,880 –> 00:08:55,380
و محتوای زیادی را تولید کنید، بنابراین
212
00:08:55,380 –> 00:09:00,089
شما باید HTML را انتخاب کنید و باید آن را نیز تجزیه کنید.
213
00:09:00,089 –> 00:09:01,170
ابزارهای بسیار بیشتری در اختیار شما قرار می دهد تا اطمینان حاصل شود
214
00:09:01,170 –> 00:09:04,970
که محتوای شما به درستی بارگذاری شده است، ما
215
00:09:04,970 –> 00:09:08,460
می خواهیم مشکل خرابی تصادفی را
216
00:09:08,460 –> 00:09:11,160
با احتمالاً ساده ترین راه حل کنیم این
217
00:09:11,160 –> 00:09:13,020
است که می دانم در داخل ظریف یا
218
00:09:13,020 –> 00:09:14,520
بسیار پایتونیک نیست، اما شما اساساً آن را
219
00:09:14,520 –> 00:09:17,550
در یک حلقه while پرتاب می کنید تا زمانی که آن را پیدا کنم. موفق میشوید شما
220
00:09:17,550 –> 00:09:18,600
فقط به تلاش خود ادامه میدهید و او به
221
00:09:18,600 –> 00:09:21,060
تلاش ادامه میدهد که خیلی
222
00:09:21,060 –> 00:09:23,190
چیزها مانند مواردی که گفتم اگر
223
00:09:23,190 –> 00:09:24,720
سرور برای چند ثانیه از کار بیفتد،
224
00:09:24,720 –> 00:09:25,920
اینترنت شما برای چند
225
00:09:25,920 –> 00:09:27,779
ثانیه قطع شود، این مشکلات برطرف میشود، اما شما هنوز هم
226
00:09:27,779 –> 00:09:29,130
میخواهید که
227
00:09:29,130 –> 00:09:31,040
پس از شکستهای زیاد، دست از
228
00:09:31,040 –> 00:09:33,839
کار بکشید، بنابراین تا رسیدن به موفقیت بیشتر تلاش میکنید یا
229
00:09:33,839 –> 00:09:37,050
فقط دست از کار بکشید، من همچنین میخواهم شروع به
230
00:09:37,050 –> 00:09:39,029
معرفی نوعی ردیابی
231
00:09:39,029 –> 00:09:42,750
پیشرفت کنم.
232
00:09:42,750 –> 00:09:44,009
همه ما میخواهیم
233
00:09:44,009 –> 00:09:45,690
مطمئن شویم که هیچ یک از
234
00:09:45,690 –> 00:09:48,209
تلاشهایمان را تکرار نکردهایم و میخواهیم
235
00:09:48,209 –> 00:09:51,329
راههایی فکر کنیم تا مطمئن شویم که اگر فیلمنامه
236
00:09:51,329 –> 00:09:54,870
کاملاً فرو ریخت یا شکست،
237
00:09:54,870 –> 00:10:02,130
مجبور نباشیم از ابتدا دوباره شروع کنیم، بنابراین
238
00:10:02,130 –> 00:10:05,279
این رویکرد همچنان ادامه دارد. برخی از اشتباهات
239
00:10:05,279 –> 00:10:06,540
بزرگترین آنها با افزودن این همه
240
00:10:06,540 –> 00:10:08,399
ویژگیها و لایههای جدید و
241
00:10:08,399 –> 00:10:11,130
تشخیص بدحجابی است که
242
00:10:11,130 –> 00:10:13,709
زمان را کاهش میدهیم یا میگذرانیم تا حکایتی واقعی ارائه کنیم
243
00:10:13,709 –> 00:10:17,399
وقتی کاری
244
00:10:17,399 –> 00:10:19,199
که حدود 15000 صفحه است را اجرا
245
00:10:19,199 –> 00:10:21,690
میکنم، حدود 26 ساعت طول میکشد. برای تکمیل آن،
246
00:10:21,690 –> 00:10:24,420
برای نیاز به دادهها در
247
00:10:24,420 –> 00:10:28,769
هر روز برای تیم، خیلی کارآمد نبود، ما همچنین
248
00:10:28,769 –> 00:10:30,420
منابع بیکار را داریم، با معرفی
249
00:10:30,420 –> 00:10:33,389
آن لایه میانی از پراکسیها که فقط یکی
250
00:10:33,389 –> 00:10:34,649
در یک زمان کار میکرد، بنابراین باید
251
00:10:34,649 –> 00:10:36,149
آنجا بنشینید و اگر برای منابع پول میپردازید
252
00:10:36,149 –> 00:10:37,470
، استفاده خیلی خوبی از
253
00:10:37,470 –> 00:10:42,810
منابع نیست و ما هنوز
254
00:10:42,810 –> 00:10:45,930
در این مرحله به هیچ ردیابی پیشرفت جدی
255
00:10:45,930 –> 00:10:49,889
یا توانایی مدیریت
256
00:10: