در این مطلب، ویدئو آموزش پایتون: فکر کردن در مورد داده ها در تکه ها با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:03:11
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:01,709 –> 00:00:04,200
ما دیدهایم که حافظه و
2
00:00:04,200 –> 00:00:06,390
ذخیرهسازی موجود مجموعههای دادهای را محدود میکند که میتوان آنها را
3
00:00:06,390 –> 00:00:09,120
تجزیه و تحلیل کرد. یک استراتژی رایج
4
00:00:09,120 –> 00:00:11,900
تقسیم مجموعه دادهها به بخشهای کوچکتر است،
5
00:00:11,900 –> 00:00:14,490
ما از یک فایل دویست هزار خطی استفاده میکنیم که
6
00:00:14,490 –> 00:00:16,830
خلاصهای از تاکسیسواری شهر نیویورک
7
00:00:16,830 –> 00:00:19,130
از دو هفته اول سال 2013 است.
8
00:00:19,130 –> 00:00:22,710
سپس با استفاده از خواندن CSV با پارامتر
9
00:00:22,710 –> 00:00:25,919
اندازه قطعه برابر با 50000، تابع
10
00:00:25,919 –> 00:00:28,249
یک شی را برمیگرداند که میتوانیم روی
11
00:00:28,249 –> 00:00:31,560
متغیر حلقه تکرار کنیم chunk دارای
12
00:00:31,560 –> 00:00:34,050
مقادیر چهار فریم داده متوالی است
13
00:00:34,050 –> 00:00:36,780
که هر کدام 50000 خط دارد به جز آخرین آن،
14
00:00:36,780 –> 00:00:38,550
زیرا خط اول
15
00:00:38,550 –> 00:00:41,640
فایل سرصفحه است. خط متغیر حلقه chunk
16
00:00:41,640 –> 00:00:43,770
دارای ویژگی های قاب داده استاندارد مانند
17
00:00:43,770 –> 00:00:46,710
شکل است بنابراین آخرین قطعه تقریبا
18
00:00:46,710 –> 00:00:50,250
50000 سطر و 14 ستون دارد که
19
00:00:50,250 –> 00:00:52,440
روش اطلاعات را فراخوانی می کند نام ستون ها را نشان می دهد مانند
20
00:00:52,440 –> 00:00:56,760
حشرات زمان سفر و فاصله سفر ما
21
00:00:56,760 –> 00:00:59,250
می توانیم یک سری منطقی بسازیم سفر طولانی است
22
00:00:59,250 –> 00:01:02,250
که درست است. هر زمان که زمان سفر
23
00:01:02,250 –> 00:01:05,269
از 1200 ثانیه یا 20 دقیقه
24
00:01:05,269 –> 00:01:08,010
فراخوانی بیشتر شود، میتوانیم از دسترسی محلی نقطه
25
00:01:08,010 –> 00:01:10,470
با سری بولی استفاده کنیم تا
26
00:01:10,470 –> 00:01:13,130
ردیفها را فیلتر کنیم. مجدداً این شرط
27
00:01:13,130 –> 00:01:17,040
مشخصه shape را نگه میدارد نشان میدهد حدود 50500
28
00:01:17,040 –> 00:01:19,320
تاکسی سواری بیش از 20
29
00:01:19,320 –> 00:01:23,690
دقیقه از این 50000 سفر را نشان میدهد،
30
00:01:23,690 –> 00:01:26,280
بیایید این منطق فیلتر را در
31
00:01:26,280 –> 00:01:29,310
یک فیلتر تابع جاسازی کنیم، سفر طولانی است که
32
00:01:29,310 –> 00:01:31,140
یک قاب داده را به عنوان ورودی میپذیرد و یک قاب داده را
33
00:01:31,140 –> 00:01:33,030
برمیگرداند. سطرها
34
00:01:33,030 –> 00:01:35,540
با سفرهای بیش از 20 دقیقه مطابقت دارند و سپس
35
00:01:35,540 –> 00:01:38,010
36
00:01:38,010 –