در این مطلب، ویدئو دانیل چن: تمیز کردن و مرتب کردن داده ها در پانداها | PyData DC 2018 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:27:22
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,659 –> 00:00:02,929
بنابراین، کسانی از شما که وارد
2
00:00:02,929 –> 00:00:06,660
این سایت میشوید، مخزن github برای
3
00:00:06,660 –> 00:00:08,670
همه چیزهایی است که ما روی آن کار خواهیم کرد، بنابراین
4
00:00:08,670 –> 00:00:10,740
حتی بعد از آموزش نوتبوکها
5
00:00:10,740 –> 00:00:13,860
، همه آنها را اینجا منتشر میکنم،
6
00:00:13,860 –> 00:00:15,900
کاری که میخواهم انجام دهید این است که اگر میتوانید بروید به
7
00:00:15,900 –> 00:00:19,109
پیوندی که در اینجا هایلایت شده است و
8
00:00:19,109 –> 00:00:21,320
اگر راه خود را درباره github نمیدانید،
9
00:00:21,320 –> 00:00:24,060
میتوانید روی این دکمه سبز رنگ اینجا
10
00:00:24,060 –> 00:00:27,029
کلیک کنید و روی download zip کلیک کنید و
11
00:00:27,029 –> 00:00:28,470
حداقل همه چیز در
12
00:00:28,470 –> 00:00:31,320
مهمترین بخش مربوط به آن دانلود میشود زیرا
13
00:00:31,320 –> 00:00:33,120
مجموعه دادههای ما با آنها کار خواهم کرد،
14
00:00:33,120 –> 00:00:34,950
همه در این مخزن ذخیره می شوند، بنابراین اگر می
15
00:00:34,950 –> 00:00:38,040
خواهید دنبال کنید، حداقل می توانید
16
00:00:38,040 –> 00:00:52,440
آن راه را دنبال کنید، بنابراین من فقط
17
00:00:52,440 –> 00:00:55,520
کمی در مورد راه اندازی صحبت خواهم کرد، بنابراین
18
00:00:55,520 –> 00:00:57,690
وقتی این را دانلود کردید، اگر
19
00:00:57,690 –> 00:00:59,910
I’ll را دانلود کنید فرض کنید نسخه زیپ آن را دانلود کرده
20
00:00:59,910 –> 00:01:01,379
اید و من تصور نمی کنم
21
00:01:01,379 –> 00:01:03,000
که همه افراد حاضر در اتاق می دانند
22
00:01:03,000 –> 00:01:07,229
آن را در جایی که راحت است از حالت فشرده خارج کنید،
23
00:01:07,229 –> 00:01:09,299
بنابراین دسکتاپ احتمالاً مکانی مفید
24
00:01:09,299 –> 00:01:12,210
حداقل برای آموزش
25
00:01:12,210 –> 00:01:14,850
برای شما در ویندوز و مک باشد.
26
00:01:14,850 –> 00:01:16,799
من o را مرتب می کنم f فرض می کند که شما
27
00:01:16,799 –> 00:01:19,020
توزیع آناکوندا پایتون را اجرا می کنید و
28
00:01:19,020 –> 00:01:22,340
بنابراین اگر ناوبر آناکوندا را باز کنید،
29
00:01:22,340 –> 00:01:24,360
اگر اولین بار است که آن را باز می
30
00:01:24,360 –> 00:01:26,369
کنید و ممکن است کمی طول بکشد،
31
00:01:26,369 –> 00:01:28,080
اما یک دکمه در
32
00:01:28,080 –> 00:01:29,610
آن وجود دارد. که میگوید Jupiter notebook یا
33
00:01:29,610 –> 00:01:32,520
Jupiter lab و یکبار کلیک میکنید که
34
00:01:32,520 –> 00:01:36,360
مرورگر باید چیزی را که میخواهم نشان دهم باز کند
35
00:01:36,360 –> 00:01:37,439
، کمی متفاوت است
36
00:01:37,439 –> 00:01:44,579
زیرا این یک ماشین لینوکس است، اما من
37
00:01:44,579 –> 00:01:47,689
فقط تمام این موارد تصادفی دیگر را
38
00:01:47,689 –> 00:01:50,100
قبل از اینکه چیزی که از آن متاسفم نشان داده شود پنهان میکنم. روی
39
00:01:50,100 –> 00:01:52,250
صفحه نمایش
40
00:01:52,380 –> 00:01:55,540
[Music
41
00:02:13,380 –> 00:02:16,750
] خیلی خوب است، بنابراین اگر از Anaconda the
42
00:02:16,750 –> 00:02:18,670
Navigator استفاده می کنید و روی آزمایشگاه مشتری یا مرکز مشتری کلیک می کنید، در
43
00:02:18,670 –> 00:02:23,020
نهایت ممکن
44
00:02:23,020 –> 00:02:24,340
است صفحه ای مانند این را دریافت کنید، اگر
45
00:02:24,340 –> 00:02:26,880
روی Jupiter lab کلیک کنید، منظورم مرکز مشتری است
46
00:02:26,880 –> 00:02:28,030
متاسفم
47
00:02:28,030 –> 00:02:31,959
دفترچه یادداشت مشتری اگر می خواهید یک
48
00:02:31,959 –> 00:02:35,350
خارجی جدید وجود دارد که می توانید با آن بازی کنید
49
00:02:35,350 –> 00:02:38,140
به نام Jupiter lab، من احتمالاً در نهایت
50
00:02:38,140 –> 00:02:40,360
از آزمایشگاه مشتری برای این
51
00:02:40,360 –> 00:02:43,900
آموزش استفاده خواهم کرد و آزمایشگاه مشتری می دانید که
52
00:02:43,900 –> 00:02:45,040
می توانید آن را مانند
53
00:02:45,040 –> 00:02:47,380
تکرار بعدی نوت بوک در نظر بگیرید. سیستم آن
54
00:02:47,380 –> 00:02:50,440
بسیار مفید است زیرا
55
00:02:50,440 –> 00:02:52,480
دسترسی راحتتری به همه چیز
56
00:02:52,480 –> 00:02:54,340
خواهید داشت، بنابراین میتوانید فوراً فایلهای خود را مرور کنید،
57
00:02:54,340 –> 00:02:56,890
چیزی که واقعاً جالب است این است که فایلهای CSV
58
00:02:56,890 –> 00:02:58,239
نیز میتوانند بهعنوان صفحهگسترده در
59
00:02:58,239 –> 00:02:59,800
آزمایشگاه Jupiter ارائه شوند که اگر فقط بازی میکنید واقعاً مفید است.
60
00:02:59,800 –> 00:03:00,940
در اطراف با داده ها،
61
00:03:00,940 –> 00:03:05,800
چیزی که واقعاً مفید است این است که می
62
00:03:05,800 –> 00:03:07,480
توانید چندین نوت بوک را همزمان باز داشته
63
00:03:07,480 –> 00:03:10,570
باشید و می توانید مانند دو نما
64
00:03:10,570 –> 00:03:11,980
از یک چیز مشابه داشته باشید که واقعاً
65
00:03:11,980 –> 00:03:13,630
مفید است که مانند یکی از چیزهایی بود که
66
00:03:13,630 –> 00:03:15,010
مردم همیشه از آن شکایت می کردند.
67
00:03:15,010 –> 00:03:18,340
اگر
68
00:03:18,340 –> 00:03:20,769
هنوز با آن بازی نکردهاید،
69
00:03:20,769 –> 00:03:24,010
پیشنهاد میکنم آن را بررسی کنید، بنابراین امیدوارم
70
00:03:24,010 –> 00:03:31,800
همه آن را راهاندازی کنند
71
00:03:31,800 –> 00:03:33,850
و کاملاً متوجه این
72
00:03:33,850 –> 00:03:35,950
آشفتگی شده باشند، فراموش کردم که یادداشتهایم را
73
00:03:35,950 –> 00:03:38,400
برای کل دوره
74
00:03:48,260 –> 00:03:50,840
برای آن دسته از شما بچههایی که سوالی
75
00:03:50,840 –> 00:03:53,700
76
00:03:53,700 –> 00:03:55,740
دارید راحت دستتان را بلند کنید یک نفر با میکروفون به سمت شما میدود و
77
00:03:55,740 –> 00:03:58,140
میتوانید در وسط صحبت را کاملاً قطع کنید
78
00:03:58,140 –> 00:04:01,530
79
00:04:01,530 –> 00:04:04,530
.
80
00:04:04,530 –> 00:04:11,520
درست کردن یادداشت هایم، اوه که
81
00:04:11,520 –> 00:04:24,000
مفید نیست، رندر درست کار می کند، بنابراین
82
00:04:24,000 –> 00:04:26,810
این یک آموزش بسیار مقدماتی است، بنابراین اگر
83
00:04:26,810 –> 00:04:28,950
قبلاً با پانداها کار نکرده
84
00:04:28,950 –> 00:04:31,740
اید یا با داده های جدولی در
85
00:04:31,740 –> 00:04:33,540
پایتون کار نکرده اید، این معمولاً
86
00:04:33,540 –> 00:04:36,930
مخاطب هدف من است.
87
00:04:36,930 –> 00:04:39,270
تفاوت اصلی در مورد این یکی این است که من
88
00:04:39,270 –> 00:04:40,890
از خیلی چیزها رد میشوم و مستقیماً به بخش
89
00:04:40,890 –> 00:04:43,530
واقعی دادههای Tidy Tidying
90
00:04:43,530 –> 00:04:47,970
آن میرسم که به نظرم بیشترین پسند را داشت
91
00:04:47,970 –> 00:04:49,380
و به همین دلیل بود که
92
00:04:49,380 –> 00:04:51,930
مانند Python یا Python استفاده کردم. انجام
93
00:04:51,930 –> 00:04:53,490
تجزیه و تحلیل فقط به این دلیل که انجام این دستکاری داده ها
94
00:04:53,490 –> 00:04:56,780
برای من به نوعی جادویی بود،
95
00:04:56,780 –> 00:05:00,440
بنابراین این سرعت کلی است
96
00:05:00,440 –> 00:05:03,600
که اگر
97
00:05:03,600 –> 00:05:05,250
آموزش های دیگری را که ارائه داده ام دیده باشید،
98
00:05:05,250 –> 00:05:06,960
متوجه خواهید شد که مانند من تقریباً می پرم. از
99
00:05:06,960 –> 00:05:09,260
مانند فصل اول – مانند فصل شش، اما
100
00:05:09,260 –> 00:05:11,910
ما حفرهها را در طول مسیر پوشش میدهیم، بنابراین زیاد نگران این موضوع
101
00:05:11,910 –> 00:05:14,640
نباشید، بنابراین امیدوارم
102
00:05:14,640 –> 00:05:17,420
که مجموعه دادهها را دانلود
103
00:05:17,420 –> 00:05:20,010
کرده باشید و این سیستم نوت بوک را باز کنید و
104
00:05:20,010 –> 00:05:22,320
ما به نوعی زندگی میکنیم کد همراه و
105
00:05:22,320 –> 00:05:23,670
فقط همانطور که من آنها را مرور میکنم از طریق دستورات صحبت
106
00:05:23,670 –> 00:05:26,640
کنید، بنابراین پایتون با
107
00:05:26,640 –> 00:05:29,280
مجموعهای از کتابخانهها همراه است و به طور پیشفرض فقط
108
00:05:29,280 –> 00:05:31,110
برای اینکه همه چیز را سریعتر بارگذاری کند، میدانید که
109
00:05:31,110 –> 00:05:33,030
آنها همه چیز را یکباره بارگذاری نمیکنند،
110
00:05:33,030 –> 00:05:35,760
بنابراین ما باید اوپ خود را وارد کنیم. اجازه دهید من
111
00:05:35,760 –> 00:05:41,070
این را بسازم. بزرگتر است، بنابراین باید کتابخانهها را وارد کنیم،
112
00:05:41,070 –> 00:05:43,140
بنابراین کتابخانهای که
113
00:05:43,140 –> 00:05:45,480
استفاده از آن را از دست میدهیم pandas نامیده میشود و این
114
00:05:45,480 –> 00:05:47,790
کتابخانه ما برای خواندن در دادههای جدولی است
115
00:05:47,790 –> 00:05:51,090
و بنابراین اگر بخواهیم اکنون میتوانیم از پانداها استفاده کنیم،
116
00:05:51,090 –> 00:05:52,740
آنها یک عملکرد ویژه در آنجا دارند
117
00:05:52,740 –> 00:05:55,919
به نام خواندن. CSV برای خواندن در فایلهای CSV، بنابراین
118
00:05:55,919 –> 00:05:58,530
ما میتوانیم آنچه را که در آن بارگذاری میکنیم به یک متغیر اختصاص دهیم،
119
00:05:58,530 –> 00:06:00,570
بنابراین آن را DF یا قاب داده مینامیم
120
00:06:00,570 –> 00:06:01,320
121
00:06:01,320 –> 00:06:04,890
و در پایتون وقتی در
122
00:06:04,890 –> 00:06:06,150
کتابدار بارگیری میکنید، میخواهید تابعی را
123
00:06:06,150 –> 00:06:08,250
در کتابخانه فراخوانی کنید، از این
124
00:06:08,250 –> 00:06:09,450
علامت نقطه استفاده کنید. بنابراین ما در این
125
00:06:09,450 –> 00:06:11,430
کتابخانه پانداها میگفتیم که میخواهیم از یک
126
00:06:11,430 –> 00:06:14,550
تابع واقعاً خاص از آن استفاده کنیم و
127
00:06:14,550 –> 00:06:15,750
تابعی که میخواهیم استفاده کنیم خواندن CSV نامیده میشود
128
00:06:15,750 –> 00:06:18,210
و اگر نمیپرسید چگونه
129
00:06:18,210 –> 00:06:19,980
آن چیزی را به نمایش گذاشتم، کلید تب را بزنید
130
00:06:19,980 –> 00:06:23,760
و آن را به صورت خودکار برای
131
00:06:23,760 –> 00:06:27,990
شما انجام می دهد بنابراین در خواندن CSV if اگر زبانه shift را
132
00:06:27,990 –> 00:06:29,790
در نوتبوک بزنید،
133
00:06:29,790 –> 00:06:32,070
امضای تابع را برای شما بالا میآورد و اولین
134
00:06:32,070 –> 00:06:34,050
چیزی که میگیرد مسیر فایل
135
00:06:34,050 –> 00:06:36,180
یا بافر است، بنابراین به
136
00:06:36,180 –> 00:06:40,940
مسیر فایل یا فایلی اشاره میکند که میخواهیم
137
00:06:43,520 –> 00:06:47,520
از عبارت Ooh فراموش کردم استفاده کنیم.
138
00:06:47,520 –> 00:06:50,910
اگر در سیستم نوت بوک مشتری هستید، باید یک کار مهم دیگر انجام
139
00:06:50,910 –> 00:06:54,330
دهید،
140
00:06:54,330 –> 00:06:58,680
در حال حاضر من در پوشه داده هستم، بنابراین قبلاً دیدید
141
00:06:58,680 –> 00:07:00,930
که ما در ابتدا اینجا بودیم،
142
00:07:00,930 –> 00:07:03,330
روی داده کلیک کردم و سپس یک
143
00:07:03,330 –> 00:07:07,170
نوت بوک جدید در اینجا ایجاد کردم. درست است، پس این همان کاری بود که من
144
00:07:07,170 –> 00:07:09,060
انجام دادم، بنابراین وقتی مانند نقطه اسلش ضربه می زنم، به
145
00:07:09,060 –> 00:07:10,650
این معنی است که فهرست فعلی خود را در سربرگ ضربه نگاه می کنم،
146
00:07:10,650 –> 00:07:12,660
تمام مجموعه های داده ای
147
00:07:12,660 –> 00:07:15,540
که دارم در آنجا هستند و در
148
00:07:15,540 –> 00:07:16,800
نوت بوک بعدی به شما نشان خواهم داد که وقتی شما را جابجا می کنید چه اتفاقی می افتد.
149
00:07:16,800 –> 00:07:18,150
نوت بوک را در یک پوشه دیگر قرار دهید،
150
00:07:18,150 –> 00:07:21,240
بنابراین اولین مجموعه داده ای که می خواهیم
151
00:07:21,240 –> 00:07:24,230
به آن نگاه کنیم Gapminder TSV نامیده می شود و
152
00:07:24,230 –> 00:07:27,240
می توانید با پسوند ببینید که
153
00:07:27,240 –> 00:07:29,790
این یک فایل مقدار جدا شده از تب است و با کاما
154
00:07:29,790 –> 00:07:32,310
جدا نشده است، بنابراین ما در واقع باید به
155
00:07:32,310 –> 00:07:35,690
خواندن CSV یک پارامتر متفاوت به نام آن بدهیم.
156
00:07:35,690 –> 00:07:38,880
کاسبرگ بریده بریده کلید بنابراین bac کلید kslash و به
157
00:07:38,880 –> 00:07:41,340
این صورت است که به پانداها میگوییم هی بهطور
158
00:07:41,340 –> 00:07:43,020
پیشفرض فایلهای CSV را میخوانید یا فایلهای مشخص شده را نظر میدهید،
159
00:07:43,020 –> 00:07:45,930
اما در این مثال ما
160
00:07:45,930 –> 00:07:50,780
در واقع یک فایل جداشده از تب داریم، بنابراین
161
00:07:50,780 –> 00:07:53,280
این چیز قاب داده در پایتون یک
162
00:07:53,280 –> 00:07:56,160
شی است و اگر بخواهیم میتوانیم
163
00:07:56,160 –> 00:07:58,470
تمام DF را پرینت کنید و ما فقط
164
00:07:58,470 –> 00:08:01,160
کل مجموعه داده های ریخته شده روی صفحه
165
00:08:01,160 –> 00:08:03,990
166
00:08:03,990 –> 00:08:06,120
را به ما می دهیم، اما یک راه واقعا راحت این روش است که head نام دارد، بنابراین می گوییم هد DF
167
00:08:06,120 –> 00:08:07,560
با براکت های گرد، فقط پنج ردیف اول را به ما می دهد
168
00:08:07,560 –> 00:08:09,150
و هنگامی که
169
00:08:09,150 –> 00:08:10,560
برای اولین بار در مجموعه دادهها بارگیری مجدد میکنید،
170
00:08:10,560 –> 00:08:11,910
این واقعاً مفید است زیرا
171
00:08:11,910 –> 00:08:13,320
واقعاً میخواهید مطمئن شوید که مانند
172
00:08:13,320 –> 00:08:15,599
ستون شما واقعاً مانند کلنی شما
173
00:08:15,599 –> 00:08:17,969
به درستی بارگیری شده است، گاهی اوقات مجموعه دادههایی
174
00:08:17,969 –> 00:08:19,529
مانند ردیف اول مانند یک ستون خالی هستند
175
00:08:19,529 –> 00:08:22,409
که در این صورت مانند و آنچه ممکن است
176
00:08:22,409 –> 00:08:24,300
به درستی بارگیری نشود یا شاید شما
177
00:08:24,300 –> 00:08:25,770
اصلاً ستونی در مجموعه داده خود نداشته
178
00:08:25,770 –> 00:08:27,419
باشید و پانداها به طور پیش فرض
179
00:08:27,419 –> 00:08:29,279
ردیف اول را مانند نام ستون در نظر می گیرند، بنابراین
180
00:08:29,279 –> 00:08:31,889
ممکن است با چیزی نامطلوب مواجه شوید تا
181
00:08:31,889 –> 00:08:33,179
همیشه بخواهید مانند Hea نگاه کنید. d فقط برای
182
00:08:33,179 –> 00:08:35,818
اینکه مطمئن شویم همه چیز به درستی بارگذاری شده است،
183
00:08:35,818 –> 00:08:39,599
بنابراین اگر به مجموعه داده های خود نگاه کنیم، یک
184
00:08:39,599 –> 00:08:41,969
قاب داده در پانداها واقعاً دارای سه
185
00:08:41,969 –> 00:08:42,809
جزء مختلف
186
00:08:42,809 –> 00:08:44,399
است، نام ستون ها در بالا
187
00:08:44,399 –> 00:08:47,069
وجود دارد، این شاخص در سمت چپ وجود دارد، بنابراین در
188
00:08:47,069 –> 00:08:48,509
این مورد ایندیس واقعاً است. جاده
189
00:08:48,509 –> 00:08:51,300
شماره ردیف را نامگذاری می کند و سپس
190
00:08:51,300 –> 00:08:54,540
مانند بدنه قاب داده وجود دارد و
191
00:08:54,540 –> 00:08:56,819
اگر زمانی به آن ضربه بزنید می توانید به آن
192
00:08:56,819 –> 00:08:58,800
سه مؤلفه هر طور که می خواهید دسترسی داشته باشید
193
00:08:58,800 –> 00:09:02,610
تا بتوانیم ستون های DF را بگوییم و این
194
00:09:02,610 –> 00:09:04,380
فقط ستون های مجموعه داده ما را به
195
00:09:04,380 –> 00:09:06,180
شما می دهد. متوجه میشویم که ستونها
196
00:09:06,180 –> 00:09:08,279
براکت ندارند، فقط یک ویژگی
197
00:09:08,279 –> 00:09:10,079
از قاب داده است، در واقع مانند
198
00:09:10,079 –> 00:09:13,079
تابعی نیست که فراخوانی میشود، اگر بخواهیم
199
00:09:13,079 –> 00:09:14,970
به ردیف نقل قول-unquote دسترسی داشته باشیم،
200
00:09:14,970 –> 00:09:18,959
شاخص نقطهای DF خود را نامگذاری میکند و به این
201
00:09:18,959 –> 00:09:21,750
ترتیب بخش شاخص را دریافت میکنید. بنابراین، اگر
202
00:09:21,750 –> 00:09:23,370
پانداها را پایین بیاورید و با
203
00:09:23,370 –> 00:09:25,470
دادههای سری زمانی زیادی کار کنید،
204
00:09:25,470 –> 00:09:27,000
مانند روز را به عنوان شاخص تنظیم
205
00:09:27,000 –> 00:09:29,399
میکنید تا بتوانید در زمان روز به ردیفهای مختلف دسترسی به مجموعه دادههای خود دسترسی داشته باشید.
206
00:09:29,399 –> 00:09:32,310
207
00:09:32,310 –> 00:09:34,259
و سپس در وسط درست اینجا
208
00:09:34,259 –> 00:09:36,029
مانند بدنه واقعی قاب داده ما
209
00:09:36,029 –> 00:09:40,319
که مقادیر نامیده می شود و بنابراین
210
00:09:40,319 –> 00:09:42,509
اگر نیاز دارید این یکی از راه های این است مانند هی من
211
00:09:42,509 –> 00:09:44,250
سعی می کنم این شی قاب داده را بگیرم
212
00:09:44,250 –> 00:09:45,779
و آن را به این کتابخانه دیگر و
213
00:09:45,779 –> 00:09:47,459
این کتابخانه دیگر پمپ کنم آیا
214
00:09:47,459 –> 00:09:49,980
میداند یک قاب داده چیست و در
215
00:09:49,980 –> 00:09:52,259
آن و مانند آرایههای numpy کار میکند، به
216
00:09:52,259 –> 00:09:54,240
این ترتیب است که شما اساساً مانند
217
00:09:54,240 –> 00:09:56,279
نسخه آرایهای numpy مجموعه دادههای شما
218
00:09:56,279 –> 00:09:59,399
خوب میشوید، بنابراین زمانی که با آن کار میکردید باید این کار را انجام دهید.
219
00:09:59,399 –> 00:10:00,360
220
00:10:00,360 –> 00:10:02,069
scikit-learn همیشه وجود دارد، اما آنها به
221
00:10:02,069 –> 00:10:03,959
نوعی توانایی کار با
222
00:10:03,959 –> 00:10:05,310
اشیاء قاب داده پانداها را دارند، اما
223
00:10:05,310 –> 00:10:07,319
گاهی اوقات به خصوص اگر با اعدادی کار می کنید
224
00:10:07,319 –> 00:10:10,079
که فرض می کنند همه چیز یک
225
00:10:10,079 –> 00:10:12,060
آرایه بی رنگ است و بنابراین گاهی
226
00:10:12,060 –> 00:10:13,889
اوقات مجبور می شوید فقط برای بدست آوردن از مقادیر نقطه استفاده
227
00:10:13,889 –> 00:10:16,949
کنید. هنگامی که اغلب با پایتون کار می کنید،
228
00:10:16,949 –> 00:10:20,250
مجموعه داده های شما یک چیز دیگر این است که
229
00:10:20,250 –> 00:10:23,639
230
00:10:23,639 –> 00:10:27,750
این تابع نوع است که واقعاً مفید است
231
00:10:27,750 –> 00:10:28,980
زمانی که در پایتون کار
232
00:10:28,980 –> 00:10:32,160
می کنید، با خطای عجیبی روبرو می شوید و فقط
233
00:10:32,160 –> 00:10:34,199
می خواهید o بدانید که چرا و نوع
234
00:10:34,199 –> 00:10:35,730
اشیاء شما چیست، بنابراین می توانید اینجا را ببینید
235
00:10:35,730 –> 00:10:37,889
که این شیء قاب داده
236
00:10:37,889 –> 00:10:43,980
پاندا است، قاب داده پاندا را دقیقاً اینجا می بینید،
237
00:10:43,980 –> 00:10:45,779
بنابراین وقتی
238
00:10:45,779 –> 00:10:47,070
دوست دارید برای اولین بار مجموعه داده های خود را بارگیری کنید، چه کار دیگری انجام می دهید.
239
00:10:47,070 –> 00:10:49,170
زمان خوب، این ویژگی
240
00:10:49,170 –> 00:10:51,420
به نام shape وجود دارد و
241
00:10:51,420 –> 00:10:53,970
تعداد سطرها و ستونها را در مجموعه دادههای شما به شما میدهد، بنابراین
242
00:10:53,970 –> 00:10:55,470
این مجموعه داده این مجموعه داده Gapminder
243
00:10:55,470 –> 00:10:58,709
دارای 1704 ردیف و شش ستون است
244
00:10:58,709 –> 00:11:00,329
و اگر بتوانید تصور کنید که
245
00:11:00,329 –> 00:11:02,449
میلیونها ردیف یا صدها ستون
246
00:11:02,449 –> 00:11:05,699
به جای بررسی هر کدام و یکی از
247
00:11:05,699 –> 00:11:06,899
آنها، میدانید که این یک راه سریع برای
248
00:11:06,899 –> 00:11:08,329
اطمینان از اینکه آیا من دادههایم را به درستی دریافت کردهام
249
00:11:08,329 –> 00:11:11,310
اگر در حال خواندن دادههایی از
250
00:11:11,310 –> 00:11:13,380
ابزارهای مشابه هستیم، این چیزها معمولاً
251
00:11:13,380 –> 00:11:15,570
واقعاً خاص هستند، مانند هر
252
00:11:15,570 –> 00:11:17,220
بار یک مجموعه داده
253
00:11:17,220 –> 00:11:19,079
300 سطر و پنج ستون است و این
254
00:11:19,079 –> 00:11:20,850
یکی از راههایی است که میتوانید بررسی کنید که آیا نور
255
00:11:20,850 –> 00:11:23,100
دستگاه دوست ندارد
256
00:11:23,100 –> 00:11:26,160
مجموعه دادههای بدی را برای شما تخلیه کند، چه اتفاقی میافتد
257
00:11:26,160 –> 00:11:29,209
گاهی اوقات فراموش میکنید این ویژگیها را نیز فراموش میکنید.
258
00:11:29,209 –> 00:11:31,829
گاهی
259
00:11:31,829 –> 00:11:33,360
اوقات ستون هایی با براکت های گرد می گذارم و
260
00:11:33,360 –> 00:11:36,690
شما ممکن است فراموش کنید و بنابراین اگر در
261
00:11:36,690 –> 00:11:37,949
نهایت کاری مانند شکل نقطه DF
262
00:11:37,949 –> 00:11:39,720
با براکت های گرد انجام دهید به این معنی مانند هی من
263
00:11:39,720 –> 00:11:41,370
تابع شکل را در
264
00:11:41,370 –> 00:11:42,899
قاب داده فراخوانی می کنم نه فقط ویژگی shape
265
00:11:42,899 –> 00:11:45,420
شما یک پیغام خطایی شبیه به این دریافت خواهید کرد،
266
00:11:45,420 –> 00:11:47,550
در این مورد میگوید این یک
267
00:11:47,550 –> 00:11:49,139
شی چندگانه است که قابل فراخوانی نیست، زیرا
268
00:11:49,139 –> 00:11:51,300
دلایلی که ما به عقب برمیگردیم این
269
00:11:51,300 –> 00:11:52,920
است که تاپل را بهعنوان فهرست پایتون در نظر
270
00:11:52,920 –> 00:11:55,110
بگیرید که نمیتوانید آن را تغییر دهید.
271
00:11:55,110 –> 00:11:56,819
نمی داند این به عنوان یک
272
00:11:56,819 –> 00:11:59,190
تابع به چه معناست، آیا به همین دلیل است که شما
273
00:11:59,190 –> 00:12:01,790
یک خطای مشابه دریافت می کنید،
274
00:12:02,149 –> 00:12:06,899
بنابراین موارد دیگر که اگر واقعاً تعداد زیادی ستون ندارید، انجام می دهید
275
00:12:06,899 –> 00:12:08,670
، یک
276
00:12:08,670 –> 00:12:10,350
چیز واقعاً مفید این است که فقط بگویید هی به
277
00:12:10,350 –> 00:12:12,600
من اطلاعات این قاب داده و
278
00:12:12,600 –> 00:12:14,310
این نوع ردیف اول را به شما می دهد، بنابراین
279
00:12:14,310 –> 00:12:16,589
به ما می گوید که قاب داده
280
00:12:16,589 –> 00:12:20,339
ما 1704 سطر داریم و آنها از صفر تا 1703 برچسب گذاری شده اند،
281
00:12:20,339 –> 00:12:23,579
بنابراین این برچسب همان شاخصی است
282
00:12:23,579 –> 00:12:26,610
که قبلاً و سپس در اینجا مشاهده کردیم.
283
00:12:26,610 –> 00:12:28,740
وسط آن به همه ما کمک می کند lumns بنابراین
284
00:12:28,740 –> 00:12:30,470
در سمت چپ به ما میدهد به
285
00:12:30,470 –> 00:12:32,910
ما میگوید شش ستون اینجا در
286
00:12:32,910 –> 00:12:35,040
سمت چپ وجود دارد، نام ستون در
287
00:12:35,040 –> 00:12:37,110
مرکز تعداد اشیاء غیر پوچ را به ما میدهد،
288
00:12:37,110 –> 00:12:39,390
بنابراین در این مورد میتوانید ببینید
289
00:12:39,390 –> 00:12:41,130
که مانند hey we هیچ داده گمشده
290
00:12:41,130 –> 00:12:42,550
ای در مجموعه داده های ما
291
00:12:42,550 –> 00:12:44,800
ندارید و در سمت راست
292
00:12:44,800 –> 00:12:47,290
نوع اطلاعات ذخیره شده در آن
293
00:12:47,290 –> 00:12:49,450
ستون را به ما می گوید، بنابراین اگر شیء را در پاندا ببینید به
294
00:12:49,450 –> 00:12:51,120
این معنی است که یک شی رشته معمولی است
295
00:12:51,120 –> 00:12:53,890
اما می توانید در این مجموعه داده ببینید. ما
296
00:12:53,890 –> 00:12:55,780
اعداد صحیح داریم، اعداد ممیز شناور
297
00:12:55,780 –> 00:12:58,050
نیز داریم و انواع دیگری نیز در
298
00:12:58,050 –> 00:13:01,270
پانداها وجود دارد، بنابراین اگر با
299
00:13:01,270 –> 00:13:04,180
زبانهای آماری دیگر
300
00:13:04,180 –> 00:13:06,340
مانند فاکتوری کار کنید، خواهید دید که به عنوان
301
00:13:06,340 –> 00:13:14,020
یک دسته در پایتون یا پانداها کدگذاری
302
00:13:14,020 –> 00:13:16,840
شده است. بیایید در واقع کاری را
303
00:13:16,840 –> 00:13:18,700
با مجموعه دادههای خود انجام دهیم، اجازه دهید شروع به فیلتر کردن
304
00:13:18,700 –> 00:13:20,200
و برش دادن دادههای خود کنیم
305
00:13:20,200 –> 00:13:23,610
تا از مقدمه اصلی این چیزها عبور کنیم،
306
00:13:23,610 –> 00:13:26,140
بنابراین اگر فقط یک ستون
307
00:13:26,140 –> 00:13:29,470
از مجموعه دادههای خود را میخواستیم، میتوانیم مجموعه دادههای خود را با
308
00:13:29,470 –> 00:13:32,050
استفاده از براکتهای مربعی آنقدر مربع بگیریم. براکت ها به صورت
309
00:13:32,050 –> 00:13:37,570
کلی است Python چگونه برخی از
310
00:13:37,570 –> 00:13:40,720
زیرمجموعههای زیرمجموعه را انجام میدهد و اگر میخواهیم برای
311
00:13:40,720 –> 00:13:43,180
مثال ستون کشور
312
00:13:43,180 –> 00:13:44,620
را در کشور رشته در پرانتز
313
00:13:44,620 –> 00:13:47,620
قرار دهیم و
314
00:13:47,620 –> 00:13:55,120
ستون کشور را درست به ما میدهد تا کاری که میتوانیم انجام دهیم این
315
00:13:55,120 –> 00:13:56,920
است که میتوانیم این را برداریم و ذخیره کنیم. این به
316
00:13:56,920 –> 00:14:00,610
سمت راست متغیر است، بنابراین میتوانیم بگوییم کشور
317
00:14:00,610 –> 00:14:02,830
میدانی فریم همان دستوری است که
318
00:14:02,830 –> 00:14:07,090
قبل از آن دیدیم، بنابراین اگر بخواهیم
319
00:14:07,090 –> 00:14:08,620
به
320
00:14:08,620 –> 00:14:10,600
جای همه آنها فقط به دو سطر اول نگاه کنیم، میتوانیم به آن
321
00:14:10,600 –> 00:14:13,450
نقطه سر بگوییم. یک
322
00:14:13,450 –> 00:14:16,750
چیز مهم این است که اگر یک ستون در یک قاب داده دارید به نوع آن نگاه کنیم،
323
00:14:16,750 –> 00:14:19,420
324
00:14:19,420 –> 00:14:22,660
آنچه برمی گردد یک سری است، بنابراین می
325
00:14:22,660 –> 00:14:24,640
توانید یک قاب داده را به عنوان یک دسته
326
00:14:24,640 –> 00:14:26,920
ستون در نظر بگیرید که هر ستون یک سری است،
327
00:14:26,920 –> 00:14:28,540
خوب است. چگونه این دو کلمه در نهایت
328
00:14:28,540 –> 00:14:30,820
با هم کار می کنند و شما می توانید
329
00:14:30,820 –> 00:14:35,320
یک سری را تقریباً مانند یک numpy مانند یک
330
00:14:35,320 –> 00:14:37,480
آرایه numpy یک بعدی شگفت انگیز در نظر بگیرید،
331
00:14:37,480 –> 00:14:45,100
درست است، بنابراین اگر ستون های بیشتری در مجموعه داده خود بخواهیم چه اتفاقی می افتد،
332
00:14:45,100 –> 00:14:49,630
متأسفیم، بیایید ببینیم
333
00:14:49,630 –> 00:14:52,390
این زیر مجموعه است،
334
00:14:52,390 –> 00:14:54,530
بنابراین گاهی اوقات چیزی که شما دارید می خواهم انجام دهم مانند
335
00:14:54,530 –> 00:14:55,790
سلام، من این مجموعه داده غول پیکر را دارم،
336
00:14:55,790 –> 00:14:57,770
اما مانند همه این
337
00:14:57,770 –> 00:14:59,450
ستون های دیگر به آن اهمیت نمی دهم، من فقط به زیر مجموعه روی
338
00:14:59,450 –> 00:15:01,520
این ستون ها اهمیت می دهم، بنابراین آنچه می توانید در پایتون انجام دهید این
339
00:15:01,520 –> 00:15:03,560
است که اگر می خواهید چندین چیز را با نام مشخص کنید.
340
00:15:03,560 –> 00:15:06,470
در یک
341
00:15:06,470 –> 00:15:09,410
لیست پایتون، بنابراین ما این مجموعه بیرونی از
342
00:15:09,410 –> 00:15:10,610
براکتهای مربع را داریم که واقعاً به
343
00:15:10,610 –> 00:15:12,200
پایتون میگوید هی من میخواهم چیزی را زیرمجموعه قرار دهم
344
00:15:12,200 –> 00:15:15,050
و سپس فهرستی در پایتون مجموعه دیگری
345
00:15:15,050 –> 00:15:17,420
از براکتهای مربع است، به همین دلیل است که
346
00:15:17,420 –> 00:15:18,800
اگر میخواهید دو براکت را ببینید.
347
00:15:18,800 –> 00:15:20,270
تلاش برای بیرون کشیدن چندین ستون
348
00:15:20,270 –> 00:15:22,490
به طور همزمان و بنابراین در اینجا اگر
349
00:15:22,490 –> 00:15:35,480
قاره کشور و سال را میخواهیم به این
350
00:15:35,480 –> 00:15:37,180
دلیل است که املای آن را اشتباه نوشتم،
351
00:15:37,180 –> 00:15:39,590
بنابراین اگر چندین ستون میخواستیم و
352
00:15:39,590 –> 00:15:41,450
فقط سعی میکنیم آن را با
353
00:15:41,450 –> 00:15:43,220
نام ستونهای واقعی مشخص کنیم. ما میتوانیم
354
00:15:43,220 –> 00:15:45,920
آن را در یک لیست پایتون قرار دهیم و سپس
355
00:15:45,920 –> 00:15:48,800
آن شی فهرست را در نحوه زیرمجموعهبندی فریمهای داده قرار دهیم،
356
00:15:48,800 –> 00:15:55,090
یک چیز دیگر را در نظر داشته باشیم،
357
00:15:55,600 –> 00:15:59,600
اگر پانداها را انجام دهیم،
358
00:15:59,600 –> 00:16:02,030
نسخههای زیرخط دوبل زیرخط را انجام میدهیم،
359
00:16:02,030 –> 00:16:03,920
به این ترتیب نسخه فعلی پانداهایی که
360
00:16:03,920 –> 00:16:05,810
هستید را دریافت میکنید. wor با این
361
00:16:05,810 –> 00:16:07,280
کار وقتی شروع به گوگلکردن کنید و
362
00:16:07,280 –> 00:16:09,220
سعی کنید از Stack Overflow کمک بگیرید بسیار مهم میشود
363
00:16:09,220 –> 00:16:13,990
که گاهی اوقات api خراب میشود و
364
00:16:13,990 –> 00:16:17,090
امیدواریم که پاسخ Stack Overflow
365
00:16:17,090 –> 00:16:18,620
نسخه پانداهایی را که استفاده میکنند به شما بدهد
366
00:16:18,620 –> 00:16:20,150
یا امیدواریم راهحل دیگری وجود داشته باشد
367
00:16:20,150 –> 00:16:22,340
که از چیزی استفاده میکند.
368
00:16:22,340 –> 00:16:27,920
مدرنتر است، بنابراین ما ستونها را زیرمجموعهای میکنیم،
369
00:16:27,920 –> 00:16:29,560
بنابراین در مورد
370
00:16:29,560 –> 00:16:32,180
ردیفها، سه روش مختلف
371
00:16:32,180 –> 00:16:34,340
در API واقعی پایتون وجود دارد که چگونه میتوانید زیر
372
00:16:34,340 –> 00:16:36,740
373
00:16:36,740 –> 00:16:40,160
374
00:16:40,160 –> 00:16:43,280
مجموعهای از ردیفهای دو تا از آنها را پیشنهاد کنید.
375
00:16:43,280 –> 00:16:45,440
بنابراین من هر سه آنها را پوشش خواهم داد و سپس
376
00:16:45,440 –> 00:16:47,090
می دانید فقط به شما می گویم که فقط به دو مورد نیاز
377
00:16:47,090 –> 00:16:48,530
دارید و واقعاً باید با یکی از
378
00:16:48,530 –> 00:16:52,220
آنها کار کنید، بنابراین چگونه می توانیم جاده های خاصی را بدست آوریم
379
00:16:52,220 –> 00:16:54,200
که ایده آل هستند، می توانید اینجا ببینید که
380
00:16:54,200 –> 00:16:56,330
این شاخص وجود دارد که ما درست در مورد آن صحبت کردیم،
381
00:16:56,330 –> 00:16:58,070
بنابراین این مکان شاخص از
382
00:16:58,070 –> 00:16:59,720
قوانین مهم این است که چگونه ردیف های زیر مجموعه را می کنیم،
383
00:16:59,720 –> 00:17:02,390
زیرا به این صورت است که ما
384
00:17:02,390 –> 00:17:04,910
یک ردیف خاص را در مجموعه داده های خود فراخوانی می کنیم،
385
00:17:04,910 –> 00:17:09,750
بنابراین اگر برای مثال می خواستیم آن را فراخوانی کنیم.
386
00:17:09,750 –> 00:17:14,099
میدانید که ردیف سوم در مجموعه داده ما است،
387
00:17:14,099 –> 00:17:16,290
اما ما سعی میکنیم آن را
388
00:17:16,290 –> 00:17:19,260
با همان رشتهای که
389
00:17:19,260 –> 00:17:22,950
روی صفحه میبینید ارجاع دهیم، راهی وجود دارد که میتوانیم
390
00:17:22,950 –> 00:17:25,829
دادهها را با استفاده از LOC برای اساساً
391
00:17:25,829 –> 00:17:28,920
موقعیت مکانی زیرمجموعهبندی کنیم و اگر آن را بدهیم یک مقدار به
392
00:17:28,920 –> 00:17:32,640
عنوان مثال برای آن در آن شاخص به نظر می رسد
393
00:17:32,640 –> 00:17:35,520
و می بیند که هی چه چیزی با این تماس مطابقت دارد
394
00:17:35,520 –> 00:17:39,000
– درست است که واقعاً
395
00:17:39,000 –> 00:17:43,470
مانند شاخصی نیست که ردیف دوم
396
00:17:43,470 –> 00:17:45,060
به دنبال چیزی است که با
397
00:17:45,060 –> 00:17:48,540
نماد مطابقت دارد – درست است و این مقداری دارد
398
00:17:48,540 –> 00:17:50,910
ما واقعاً در
399
00:17:50,910 –> 00:17:53,070
این دوره یا در این آموزش به آن نخواهیم پرداخت، اما اگر
400
00:17:53,070 –> 00:17:55,710
دوست دارید دادههای الحاقی مانند اتصال ردیف شروع به
401
00:17:55,710 –> 00:17:59,010
یکدیگر را داشته باشید، میتوانید
402
00:17:59,010 –> 00:18:00,990
این وضعیت را داشته باشید که این فهرست ردیف
403
00:18:00,990 –> 00:18:03,600
تکراری است و اگر بگویید LOC –
404
00:18:03,600 –> 00:18:05,520
در واقع دو ردیف به عقب برمیگردید. به جای
405
00:18:05,520 –> 00:18:07,620
یک، زیرا واقعاً شبیه
406
00:18:07,620 –> 00:18:10,080
آنچه در اینجا چاپ شده
407
00:18:10,080 –> 00:18:18,720
است، یعنی نوشتن مانند آن کاراکتر – بنابراین اگر
408
00:18:18,720 –> 00:18:21,120
میخواهیم چندین ردیف را برگردانیم، درست
409
00:18:21,120 –> 00:18:22,980
مانند آنچه با ستونها انجام دادیم،
410
00:18:22,980 –> 00:18:25,860
مجموعه را در لیست پایتون قرار میدهیم. اگر
411
00:18:25,860 –> 00:18:29,160
بخواهیم و مثلاً 0، یک قاب داده
412
00:18:29,160 –> 00:18:31,500
را با 2 و 0 به ترتیبی که
413
00:18:31,500 –> 00:18:33,990
میخواهیم برمیگردانیم و دوباره این LOC است
414
00:18:33,990 –> 00:18:36,200
و در واقع تقریباً مانند
415
00:18:36,200 –> 00:18:38,610
تطبیق کاراکترها انجام میدهد، مثل من به
416
00:18:38,610 –> 00:18:42,750
دنبال چیزی به نام – بنابراین راه دیگری که
417
00:18:42,750 –> 00:18:46,020
میتوانیم فریمهای داده را زیرمجموعه قرار دهیم، استفاده از
418
00:18:46,020 –> 00:18:49,920
چیزی به نام I look so I’ll oak است
419
00:18:49,920 –> 00:18:51,810
و I مخفف شاخص است، بنابراین اینجا جایی است
420
00:18:51,810 –> 00:18:53,820
که ما در واقع شروع به شمارش
421
00:18:53,820 –> 00:18:55,950
از 0 میکنیم و سپس میگوییم که
422
00:18:55,950 –> 00:18:57,780
جاده ای که ما در حال تلاش برای رسیدن به آن هستیم، بنابراین اگر
423
00:18:57,780 –> 00:19:00,810
بگویم من بلوط خواهم داشت – این واقعاً می خواهد
424
00:19:00,810 –> 00:19:02,520
به شما نشان دهم که این مجموعه داده شبیه به چه شکلی است
425
00:19:02,520 –> 00:19:05,340
– واقعاً می گوید
426
00:19:05,340 –> 00:19:08,310
من 0 1 2 می گیرم که این موقعیت شاخص است
427
00:19:08,310 –> 00:19:11,070
که ما می خواهیم و این همان جاده ای است که
428
00:19:11,070 –> 00:19:13,980
به عقب کشیده می شود، بنابراین
429
00:19:13,980 –> 00:19:16,050
430
00:19:16,050 –> 00:19:18,480
در این مثال تفاوت ظریفی بین این دو وجود دارد، زیرا
431
00:19:18,480 –> 00:19:20,190
شاخص واقعاً همان چیزی است که
432
00:19:20,190 –> 00:19:21,510
شماره ردیف دارد، تشخیص آن کمی سخت
433
00:19:21,510 –> 00:19:23,100
است، اما می توانید تصور کنید اگر شروع به
434
00:19:23,100 –> 00:19:24,420
کار با مجموعه داده ها کنید و
435
00:19:24,420 –> 00:19:26,760
گاهی اوقات می خواهید فقط آنها را ترکیب کنید
436
00:19:26,760 –> 00:19:28,440
چیزی که برچسب گذاری می شود و گاهی اوقات شما می خواهید
437
00:19:28,440 –> 00:19:31,680
مانند موقعیت واقعی در سومین یا
438
00:19:31,680 –> 00:19:40,200
فهرست دو در مجموعه داده های خود را به آخرین راه
439
00:19:40,200 –> 00:19:41,580
اگر در اسناد نگاه کنید
440
00:19:41,580 –> 00:19:45,080
، این راه برای دسترسی به ردیف ها و ردیف هایی
441
00:19:45,080 –> 00:19:50,370
به نام I X یا X وجود دارد و در اینجا اگر سعی کنید
442
00:19:50,370 –> 00:19:54,810
انجام دهید. هر چیزی در X یا IX به شما نشان می
443
00:19:54,810 –> 00:19:57,900
دهد که این یک هشدار انکار غول بزرگ است
444
00:19:57,900 –> 00:20:00,900
و همچنین می گوید لطفاً از LOC استفاده کنید
445
00:20:00,900 –> 00:20:04,350
یا به جای آن I loc کنید من
446
00:20:04,350 –> 00:20:06,450
ترتیب دقیق را به خاطر نمی آورم اما فکر می کنم به نوعی
447
00:20:06,450 –> 00:20:09,840
در آن کار می کند که انگار کار می کند. شما ابتدا از LOC استفاده می کنید
448
00:20:09,840 –> 00:20:11,250
و اگر آنها نتوانند این کار را انجام دهند
449
00:20:11,250 –> 00:20:14,250
، در قسمت I. I look right نمایش داده می شود و
450
00:20:14,250 –> 00:20:15,750
بنابراین می توانید ببینید که به نوعی مبهم است
451
00:20:15,750 –> 00:20:17,700
و به همین دلیل است که می
452
00:20:17,700 –> 00:20:19,410
گویند هی این کار را نکنید به هیچ وجه
453
00:20:19,410 –> 00:20:21,180
ممکن است به پایه های کد قدیمی برخورد کنید که
454
00:20:21,180 –> 00:20:23,760
در واقع از IX استفاده می کنند و می دانید که وقتی
455
00:20:23,760 –> 00:20:25,470
آن را می بینید سعی کنید آن را درست کنید یا با آن شخص
456
00:20:25,470 –> 00:20:27,840
صحبت کنید مانند برچسب
457
00:20:27,840 –> 00:20:29,970
سطر یا موقعیت شاخص واقعی
458
00:20:29,970 –> 00:20:32,790
ردیف درست و فقط
459
00:20:32,790 –> 00:20:33,840
به نوعی کد خود را
460
00:20:33,840 –> 00:20:35,160
با گفتن این جمله که هی ما این
461
00:20:35,160 –> 00:20:36,690
نفریم این مبهم است، اجازه دهید از
462
00:20:36,690 –> 00:20:43,320
شر آن خلاص شویم، بنابراین چگونه میتوانیم چندین ردیف
463
00:20:43,320 –> 00:20:45,180
و ستون به دست آوریم که فرض کنید میخواهیم
464
00:20:45,180 –> 00:20:46,710
ستونهای خود را زیرمجموعه قرار دهیم و همچنین
465
00:20:46,710 –> 00:20:51,690
فیلتر کردن بر اساس ردیفها را شروع کنیم تا در
466
00:20:51,690 –> 00:20:54,000
نهایت از LOC برای زیرمجموعه ردیفها
467
00:20:54,000 –> 00:20:57,510
و ستونها استفاده کنید. و اگر
468
00:20:57,510 –> 00:20:59,010
واقعاً میخواهید در مورد
469
00:20:59,010 –> 00:21:00,090
نحوه تایپ این موارد
470
00:21:00,090 –> 00:21:03,090
LOC صحبت کنید، اگر روی آن کار کردهاید،
471
00:21:03,090 –> 00:21:05,550
نماد واقعاً شبیه به آن است،
472
00:21:05,550 –> 00:21:07,260
میتوانید یک کاما داشته باشید و بخشی
473
00:21:07,260 –> 00:21:08,550
در سمت چپ کاما وجود دارد و قسمتی به
474
00:21:08,550 –> 00:21:10,920
سمت راست و بالای کاما نحوه تعیین
475
00:21:10,920 –> 00:21:13,140
ردیفهای خود در سمت
476
00:21:13,140 –> 00:21:15,150
چپ کاما و سپس نحوه
477
00:21:15,150 –> 00:21:17,400
تعیین یا زیر مجموعه ستونهای خود در
478
00:21:17,400 –> 00:21:20,820
سمت راست کاما است، بنابراین اگر در
479
00:21:20,820 –> 00:21:24,150
پایتون متأسفیم اگر ما اوه، اگر به عنوان مثال
480
00:21:24,150 –> 00:21:26,460
فقط میخواهیم همه ستونها
481
00:21:26,460 –> 00:21:30,090
را بگیریم و همه ردیفها را نگه داریم، میتوانیم این
482
00:21:30,090 –> 00:21:31,750
نماد برش را این فراخوانی را قرار دهیم
483
00:21:31,750 –> 00:21:32,770
که فقط میگوید هی همه چیز را به من بده
484
00:21:32,770 –> 00:21:34,810
اینجا و این فقط میگوید hey
485
00:21:34,810 –> 00:21:37,060
همه سطرها را به من بده و سپس ادامه
486
00:21:37,060 –> 00:21:39,250
سمت راست را اگر ضرب بخواهیم
487
00:21:39,250 –> 00:21:41,050
ستونها چندین ستون را به خاطر میآورند که
488
00:21:41,050 –> 00:21:49,840
میتوانیم در لیست پایتون قرار دهیم، میتوانیم
489
00:21:49,840 –> 00:21:51,310
تمام ردیفهای مجموعه دادههای خود را دریافت کنیم و سپس به درستی
490
00:21:51,310 –> 00:21:53,710
بر اساس ستونها فیلتر کنیم،
491
00:21:53,710 –> 00:21:55,540
اما این نماد را میدانید که
492
00:21:55,540 –> 00:21:57,970
در این مورد واقعاً احمقانه است، زیرا میتوانیم
493
00:21:57,970 –> 00:21:59,440
فقط داشته باشیم.
494
00:21:59,440 –> 00:22:01,990
برای شروع از نماد دو براکت مربع
495
00:22:01,990 –> 00:22:03,820
استفاده کردیم، اما این مزیتهایی دارد، زیرا اکنون میتوانیم
496
00:22:03,820 –> 00:22:06,550
زیرمجموعههای بولی
497
00:22:06,550 –> 00:22:10,630
ردیفهای خود را به طور همزمان بشناسیم، بنابراین چه
498
00:22:10,630 –> 00:22:15,850
شکلی به نظر میرسد، فرض کنید
499
00:22:15,850 –> 00:22:20,340
ما قاب دادهای را میخواستیم که آن را پایهگذاری میکنیم. خارج
500
00:22:20,340 –> 00:22:23,410
از برچسب شاخص و در اینجا فرض کنید
501
00:22:23,410 –> 00:22:27,400
میخواستیم سال 1967 را
502
00:22:27,400 –> 00:22:29,560
بدانید، پس چگونه مشخص کنیم که همه ردیفها را میخواهیم
503
00:22:29,560 –> 00:22:32,440
که سال 1967 باشد، بنابراین واقعاً میتوانیم
504
00:22:32,440 –> 00:22:36,340
بگوییم هی DF ما ستون سال
505
00:22:36,340 –> 00:22:41,670
را میگیریم و میخواهیم برای اطمینان از اینکه سال 1967 6
506
00:22:41,670 –> 00:22:45,790
1967 است و سپس اگر سال و
507
00:22:45,790 –> 00:22:50,440
جمعیت را میخواهیم، میتوانیم برای تم
508
00:22:50,440 –> 00:22:53,440
م ردیفهایی که ستون سالی ما 1967 است فیلتری انجام دهیم و س
509
00:22:53,440 –> 00:22:58,050
س فقط ستونهای خاص را زیر مجموعه قرار ده
510
00:23:03,810 –> 00:23:08,790
511
00:23:08,790 –> 00:23:11,080
م. به عنوان مثال ما یک مورد دیگر انجام خواهیم داد
512
00:23:11,080 –> 00:23:13,480
به عنوان مثال، اگر میخواهید این کار را انجام دهید،
513
00:23:13,480 –> 00:23:15,520
سعی میکنید این تنظیمات فرعی بولی را انجام دهید
514
00:23:15,520 –> 00:23:20,700
و میخواهید برای مثال
515
00:23:20,700 –> 00:23:23,380
شرایط چندگانه یا چندین حالت بولی را انجام دهید
516
00:23:23,380 –> 00:23:27,340
، ترفند این است که باید هر
517
00:23:27,340 –> 00:23:29,380
عبارت جداگانه را در مجموعهای از
518
00:23:29,380 –> 00:23:33,220
براکتهای گرد بپیچید، بنابراین بیایید بگوییم ما سال مورد نظر
519
00:23:33,220 –> 00:23:42,580
یعنی 1967 و سپس DF Pop بزرگتر
520
00:23:42,580 –> 00:23:45,840
از من نمی
521
00:23:47,920 –> 00:23:54,170
دانم این 1/2 میلیون چیست که کمی کم به نظر می رسد
522
00:23:54,170 –> 00:23:56,540
شاید این کار
523
00:23:56,540 –> 00:24:00,740
چیز جالب دیگری در مورد اعداد پایتون
524
00:24:00,740 –> 00:24:04,190
مانند 10 یا هزار باشد، بیایید از
525
00:24:04,190 –> 00:24:06,320
هزار هزار استفاده کنیم. شما در واقع می توانید
526
00:24:06,320 –> 00:24:08,090
به عنوان یک نشانگر بصری از این خط زیر برای
527
00:24:08,090 –> 00:24:10,040
اعداد صحیح استفاده کنید و همان
528
00:24:10,040 –> 00:24:12,020
چیزی را به درستی نشان می دهد، بنابراین اگر
529
00:24:12,020 –> 00:24:13,760
برای کمک به
530
00:24:13,760 –> 00:24:15,830
تفکیک اعداد خود مانند معادل کاما نیاز دارید، پایتون یک
531
00:24:15,830 –> 00:24:17,450
زیرخط صفر صفر صفر همان چیزی
532
00:24:17,450 –> 00:24:21,140
را که هزار است می بیند. امیدوارم خواندن
533
00:24:21,140 –> 00:24:22,760
کد شما کمی آسانتر شود، بنابراین
534
00:24:22,760 –> 00:24:26,390
من این دو حالت بولی را دارم و اگر
535
00:24:26,390 –> 00:24:28,280
میخواهیم هر دو درست باشند،
536
00:24:28,280 –> 00:24:30,380
میتوانیم از علامت علامت استفاده کنیم و اگر میخواهید
537
00:24:30,380 –> 00:24:33,320
در یا از این لوله عمودی برای o استفاده کنید. r
538
00:24:33,320 –> 00:24:36,350
و دلیل اینکه نماد
539
00:24:36,350 –> 00:24:40,780
به این شکل در میآید، جایی که باید به
540
00:24:40,780 –> 00:24:43,490
جای پایتون معمولی a و D از براکتهای گرد و علامت علامت استفاده
541
00:24:43,490 –> 00:24:45,740
کنید،
542
00:24:45,740 –> 00:24:47,570
واقعاً در حال مقایسه بیتی است و به
543
00:24:47,570 –> 00:24:51,100
همین دلیل است که من کد را انجام دادم خیلی جالب به نظر میرسد.
544
00:24:51,730 –> 00:24:55,190
545
00:24:55,190 –> 00:24:56,810
بخش های واقعی چون ما اکنون
546
00:24:56,810 –> 00:25:01,970
با مقدمه تمام شده ایم، بنابراین اگر
547
00:25:01,970 –> 00:25:06,500
مجموعه داده ها را دانلود کردید یا آن
548
00:25:06,500 –> 00:25:11,840
پوشه پوشه ای به نام notebook وجود دارد، پوشه ای به نام notebook وجود دارد،
549
00:25:11,840 –> 00:25:13,610
بنابراین بیایید
550
00:25:13,610 –> 00:25:15,320
به پوشه notebooks برویم و سپس یک
551
00:25:15,320 –> 00:25:19,010
نوت بوک Jupiter جدید ایجاد کنیم. در آنجا است بنابراین
552
00:25:19,010 –> 00:25:20,720
اولین نوت بوک آنها من می توانم نام آن را تغییر
553
00:25:20,720 –> 00:25:24,500
دهم و این مقدمه را صدا می زنم و سپس دومی را درست می
554
00:25:24,500 –> 00:25:28,700
گویم بنابراین
555
00:25:28,700 –> 00:25:30,890
کلید اینجا این است که من اکنون در یک
556
00:25:30,890 –> 00:25:33,800
پوشه متفاوت از جایی هستم که همه مجموعه های داده در آن
557
00:25:33,800 –> 00:25:35,660
ذخیره می شوند. واقعاً فقط چند
558
00:25:35,660 –> 00:25:37,850
پیامد از نحوه بارگیری یا
559
00:25:37,850 –> 00:25:43,030
یافتن مجموعه داده های خود دارد، اما قبل از اینکه به آنجا برویم
560
00:25:45,570 –> 00:25:48,149
و من این پیوند را در مخزن github قرار
561
00:25:48,149 –> 00:25:50,369
می دهم تا شما بچه ها بتوانید آن را پیدا کنید، اما
562
00:25:50,369 –> 00:25:53,309
اجازه دهید فقط در مورد داده های مرتب صحبت کنیم و
563
00:25:53,309 –> 00:25:54,869
چه کار می کند. این بدان معناست که وقتی مجموعه دادههای شما
564
00:25:54,869 –> 00:25:57,809
نقل قول – بدون نقل قول درست است و
565
00:25:57,809 –> 00:25:59,369
بنابراین این مقاله واقعاً زیبا از هدلی
566
00:25:59,369 –> 00:26:01,919
ویکهام وجود دارد که او از دنیای ما آمده است، اما
567
00:26:01,919 –> 00:26:03,809
شما میدانید که مواردی از این دست
568
00:26:03,809 –> 00:26:06,389
کاملاً مرتبط هستند، زبان آگنوستیک است و بنابراین
569
00:26:06,389 –> 00:26:07,409
داشتن مشابه به چه معناست.
570
00:26:07,409 –> 00:26:09,269
مجموعه داده های پاک درست است و این به
571
00:26:09,269 –> 00:26:10,470
نوعی دلیلی است که این مقاله در مورد
572
00:26:10,470 –> 00:26:12,090
آن صحبت می کند، هی ما این دو روز را
573
00:26:12,090 –> 00:26:14,940
داریم که با جدول 1 و جدول 2 تعریف شده است
574
00:26:14,940 –> 00:26:17,639
و می دانید
575
00:26:17,639 –> 00:26:19,799
اگر در مورد ردیف ها و ستون ها صحبت کنیم،
576
00:26:19,799 –> 00:26:20,970
کدام یک بهتر است. و این همان چیزی است که این
577
00:26:20,970 –> 00:26:22,229
مقاله در مورد آن صحبت می کند، مثلاً ما در واقع به
578
00:26:22,229 –> 00:26:24,629
کلمات بهتری برای این چیزها
579
00:26:24,629 –> 00:26:27,929
نیاز داریم و سپس او همچنین می گوید خوب
580
00:26:27,929 –> 00:26:29,999
این دو چیز حاوی اطلاعات یکسانی هستند،
581
00:26:29,999 –> 00:26:31,799
اما
582
00:26:31,799 –> 00:26:34,320
نسخه دیگری از این مجموعه داده در جدول 3 و
583
00:26:34,320 –> 00:26:37,289
این وجود دارد. مانند نسخه واقعی یا
584
00:26:37,289 –> 00:26:40,080
تمیز این مجموعه داده است و
585
00:26:40,080 –> 00:26:42,090
چرا می توانید تصور کنید که فرض کنید می خواهید
586
00:26:42,090 –> 00:26:45,450
مدلی را با یک مدل آماری مطابقت دهید که مانند این است که
587
00:26:45,450 –> 00:26:47,489
شما برخی از نتایج را بر اساس
588
00:26:47,489 –> 00:26:49,139
درمان درست می دانید اکنون میتوانید
589
00:26:49,139 –> 00:26:51,119
مدلی را که نتیجه
590
00:26:51,119 –> 00:26:54,059
آن Y است و درمان X شماست را بپسندید، درست
591
00:26:54,059 –> 00:26:56,039
مثل اینکه یک نظر برای آن داشته
592
00:26:56,039 –> 00:26:58,019
باشید، در حالی که مجموعه دادههایی مانند این را میشناسید،
593
00:26:58,019 –> 00:26:59,190
نمیتوانید واقعاً مانند آنچه
594
00:26:59,190 –> 00:27:00,869
ستون است ندارید که مانند متغیر پاسخ من است
595
00:27:00,869 –> 00:27:02,190
و سپس ستونی برای
596
00:27:02,190 –> 00:27:04,830
ورودی های من درست است، بنابراین این
597
00:27:04,830 –> 00:27:06,840
یک نشانه بصری برای دوست داشتن خوب است
598
00:27:06,840 –> 00:27:08,879
، وقتی داده ها تمیز هستند به چه معناست،
599
00:27:08,879 –> 00:27:10,499
چیز دیگر مانند زمانی است که
600
00:27:10,499 –> 00:27:12,809
داده های خود را واقعاً مانند یک فرمت مرتب
601
00:27:12,809 –> 00:27:14,369
پایینتر است، بنابراین اگر فقط دادهها را پردازش میکنید،
602
00:27:14,369 –> 00:27:15,779
این یک هدف بسیار خوب است برای
603
00:27:15,779 –> 00:27:17,129
اینکه مجموعه دادههای نهایی شما چگونه باید
604
00:27:17,129 –> 00:27:19,229
باشد اگر مجموعه دادهها و قالببندیهای خود را به این شکل دریافت کنید،
605
00:27:19,229 –> 00:27:21,119
تبدیل آن
606
00:27:21,119 –> 00:27:23,009
به هر چیزی که نیاز دارید بسیار آسان است. این
607
00:27:23,009 –> 00:27:24,629
نسخه از مجموعه دادههای ما ممکن است
608
00:27:24,629 –> 00:27:26,129
برای مدلهای آماری خوب باشد، اما
609
00:27:26,129 –> 00:27:28,049
اگر میخواهید جدولی از
610
00:27:28,049 –> 00:27:29,999
نتایج را مانند یکی از این دو شکل نشان دهید،
611
00:27:29,999 –> 00:27:31,979
احتمالاً بسیار بهتر است مانند یک
612
00:27:31,979 –> 00:27:33,720
فرد خاص، شما واقعاً میتوانید به راحتی آن را بررسی کنید.
613
00:27:33,720 –> 00:27:36,450
الف و درمان B
614
00:27:36,450 –> 00:27:38,279
اما اینجا کمی سخت تر است، مثلا هی
615
00:27:38,279 –> 00:27:39,989
من دنبال جین دو می گردم
616
00:27:39,989 –> 00:27:41,460
617
00:27:41,460 –> 00:27:43,739
618
00:27:43,739 –> 00:27:45,119
619
00:27:45,119 –> 00:27:47,999
.
620
00:27:47,999 –> 00:27:49,259
بهتر از دیگری همه آنها
621
00:27:49,259 –> 00:27:51,599
اهداف متفاوتی دارند، اما نکته کلیدی این است
622
00:27:51,599 –> 00:27:53,009
که وقتی داده های خود را در قالب تمیز یا مرتب دریافت می کنید،
623
00:27:53,009 –> 00:27:56,609
تبدیل آنها به یکدیگر بسیار آسان است
624
00:27:56,609 –> 00:27:57,989
و این همان چیزی است که ما
625
00:27:57,989 –> 00:28:00,200
در
626
00:28:00,210 –> 00:28:02,549
مورد تعریف رسمی داده های Tidy
627
00:28:02,549 –> 00:28:04,409
صحبت خواهیم کرد. هادلی ویکهام در مقاله خود در مورد اینکه
628
00:28:04,409 –> 00:28:06,779
هر متغیر یک ستون
629
00:28:06,779 –> 00:28:08,909
را تشکیل می دهد هر مشاهده یک ردیف را تشکیل می دهد هر نوع
630
00:28:08,909 –> 00:28:11,549
واحد مشاهده ای که یک جدول را تشکیل می دهد
631
00:28:11,549 –> 00:28:12,900
احتمالاً واقعاً فقط در مورد دو مورد اول صحبت می کند
632
00:28:12,900 –> 00:28:14,549
بنابراین برای هر
633
00:28:14,549 –> 00:28:16,500
متغیری که یک ستون را تشکیل می دهد چه معنایی دارد که هر مشاهده
634
00:28:16,500 –> 00:28:19,799
یک ردیف را تشکیل می دهد. بیایید به این
635
00:28:19,799 –> 00:28:20,909
نسخه در اینجا نگاه کنیم، می توانید ببینید که ما یک
636
00:28:20,909 –> 00:28:22,590
ستون به نام نام داریم، یک ستون به نام
637
00:28:22,590 –> 00:28:24,659
ستون درمان به نام نتیجه سمت راست، بنابراین
638
00:28:24,659 –> 00:28:26,909
آنها سه متغیر جداگانه هستند که
639
00:28:26,909 –> 00:28:28,620
به این معنی است که آنها سه متغیر جداگانه هستند.
640
00:28:28,620 –> 00:28:31,440
الف وارد مدلی میشود که میخواهیم
641
00:28:31,440 –> 00:28:34,470
تعریف کنیم و در هر مشاهده یک
642
00:28:34,470 –> 00:28:36,450
ردیف درست را تشکیل میدهد، بنابراین برای یک فرد معین،
643
00:28:36,450 –> 00:28:39,360
ارزش درمانی او را داریم و
644
00:28:39,360 –> 00:28:44,580
نتیجه آنها کمی بیشتر در
645
00:28:44,580 –> 00:28:50,549
این مقاله دادهها نامرتب است، در بسیاری از موارد به هم ریخته است.
646
00:28:50,549 –> 00:28:53,190
راههای متفاوتی وجود دارد، اما اگر
647
00:28:53,190 –> 00:28:55,100
فرآیند
648
00:28:55,100 –> 00:28:57,299
تمیز کردن یا مرتب کردن مجموعههای
649
00:28:57,299 –> 00:29:03,539
دادهتان را نیز انجام دهید، احتمالاً
650
00:29:03,539 –> 00:29:05,399
سه مشکل اول را به درستی از سر میبرید، بنابراین این
651
00:29:05,399 –> 00:29:07,679
چیزی است که در این
652
00:29:07,679 –> 00:29:10,110
آموزش به آن خواهیم پرداخت. سه
653
00:29:10,110 –> 00:29:13,529
چیز همانطور که در این مقاله تعریف شده است و
654
00:29:13,529 –> 00:29:15,000
اگر به خواندن این مقاله پایان دهید
655
00:29:15,000 –> 00:29:16,380
در واقع کار با
656
00:29:16,380 –> 00:29:18,510
مجموعه داده های مشابه را دوست خواهید داشت به جز یکی از آنها،
657
00:29:18,510 –> 00:29:19,590
واقعاً نیازی نیست
658
00:29:19,590 –> 00:29:23,669
تا زمانی که به فصل 4 برسید کل مطلب را بخوانید.
659
00:29:23,669 –> 00:29:27,840
یا در پایان بله، اجازه دهید بخش
660
00:29:27,840 –> 00:29:29,580
4 را دریافت کنم که احتمالاً مانند همه چیزهایی است که باید
661
00:29:29,580 –> 00:29:31,919
بدانید، بقیه واقعاً مختص ما هستند،
662
00:29:31,919 –> 00:29:34,200
اما اگر فقط می خواهید بفهمید که
663
00:29:34,200 –> 00:29:35,580
مانند هی به چه معناست که داده
664
00:29:35,580 –> 00:29:37,799
ها مانند نقل قول-بدون نقل قول خوب هستند، اول
665
00:29:37,799 –> 00:29:39,630
تی بخش 3 واقعاً تمام چیزی است که برای خواندن درست نیاز دارید،
666
00:29:39,630 –> 00:29:43,679
بنابراین ما این
667
00:29:43,679 –> 00:29:49,049
نوت بوک دیگر را داریم به ما اطلاع دهید شروع به
668
00:29:49,049 –> 00:29:51,450
پردازش داده های ما کنید، این یک
669
00:29:51,450 –> 00:29:53,760
نوت بوک جدید است، بنابراین باید کتابخانه های خود را دوباره وارد کنیم،
670
00:29:53,760 –> 00:29:56,549
یکی دیگر از راه هایی که می
671
00:29:56,549 –> 00:30:00,690
توانید کتابخانه ها را وارد کنید استفاده از این است. به عنوان
672
00:30:00,690 –> 00:30:03,149
دستور بنابراین ما میتوانیم بگوییم
673
00:30:03,149 –> 00:30:05,820
پانداها را بهعنوان PD وارد کنید و میتوانید ببینید چه چیزی
674
00:30:05,820 –> 00:30:08,669
به ما اجازه میدهد انجام دهیم این است که اکنون میتوانیم بهجای
675
00:30:08,669 –> 00:30:11,460
نوشتن PA و das dot چیزی که
676
00:30:11,460 –> 00:30:12,360
اکنون میتوانیم بگوییم P dot
677
00:30:12,360 –> 00:30:14,039
بنابراین این فقط راهی است که به آن میگویند
678
00:30:14,039 –> 00:30:17,370
نام مستعار و این فقط به شما کمک می کند
679
00:30:17,370 –> 00:30:18,809
تایپ خود را ساده کنید تا مجبور نباشید آنقدر تایپ کنید،
680
00:30:18,809 –> 00:30:21,269
بنابراین اولین مجموعه داده
681
00:30:21,269 –> 00:30:23,159
از مرکز تحقیقات Pew می آید و
682
00:30:23,159 –> 00:30:25,500
اکنون از PD dot دلیل CSV به جای
683
00:30:25,500 –> 00:30:29,460
پانداها که CSV را نمی خوانند برای بارگذاری اولین ما استفاده می کند.
684
00:30:29,460 –> 00:30:32,549
مجموعه دادهها، بنابراین در این مثال، اگر به
685
00:30:32,549 –> 00:30:35,669
ساختار پوشهام نگاه کنیم، من چیزهایم را
686
00:30:35,669 –> 00:30:38,279
در این پوشهها در پوشه نوتبوکها دارم، اما
687
00:30:38,279 –> 00:30:40,799
مجموعه دادهها واقعاً از این نوتبوک
688
00:30:40,799 –> 00:30:43,860
است، یک پوشه بالا و پایین در یک
689
00:30:43,860 –> 00:30:45,330
پوشه داده است و سپس مجموعه دادههای من اینجاست.
690
00:30:45,330 –> 00:30:48,000
درست است به جای اینکه فقط تایپ کنید
691
00:30:48,000 –> 00:30:50,399
Gapminder مانند قبل، اکنون
692
00:30:50,399 –> 00:30:52,350
باید دو نقطه بگوییم که می گوید هی برو یک
693
00:30:52,350 –> 00:30:55,740
پوشه به بالا و سپس به پوشه داده پایین برو
694
00:30:55,740 –> 00:30:59,039
و سپس مجموعه داده PUE csv را جستجو کنیم
695
00:30:59,039 –> 00:31:05,639
، بنابراین اگر به سر این
696
00:31:05,639 –> 00:31:07,799
مجموعه داده نگاه کنیم این است ابتدا این
697
00:31:07,799 –> 00:31:09,809
دقیقاً همان مجموعه دادهای است که در آن مقاله نشان داده شده است،
698
00:31:09,809 –> 00:31:12,720
اما میتوانید در اینجا نمونهای
699
00:31:12,720 –> 00:31:15,779
از مجموعه دادهای را ببینید که مرتب نیست، اما
700
00:31:15,779 –> 00:31:17,760
واقعاً عالی است از این نظر که شما
701
00:31:17,760 –> 00:31:21,240
چیزی را میدانید که در یک گزارش نشان میدهید، بنابراین
702
00:31:21,240 –> 00:31:23,010
برای یک دین خاص و دوباره یک
703
00:31:23,010 –> 00:31:24,360
براکت درآمد بدهید، فکر میکنم این مانند
704
00:31:24,360 –> 00:31:29,220
تعداد افراد است و بنابراین اگر
705
00:31:29,220 –> 00:31:32,010
به این مقاله برگردیم،
706
00:31:32,010 –> 00:31:34,559
مشکل چیست که سه مشکلی که سر
707
00:31:34,559 –> 00:31:37,860
ستونها را پوشش میدهیم، مقادیر هستند
708
00:31:37,860 –> 00:31:39,690
و نه نام متغیرها، به چه
709
00:31:39,690 –> 00:31:42,539
معناست. اگر به ستونهای ما نگاه کنید،
710
00:31:42,539 –> 00:31:44,460
میبینید که ما دستهای از ستونها داریم
711
00:31:44,460 –> 00:31:45,889
که در واقع براکتهای درآمدی هستند
712
00:31:45,889 –> 00:31:49,279
و واقعاً باید در یک ستون باشد
713
00:31:49,279 –> 00:31:52,080
که به آن درآمد میگویند و سپس در
714
00:31:52,080 –> 00:31:52,980
سمت راست احتمالاً
715
00:31:52,980 –> 00:31:56,039
باید مانند یک ستون شمارش داشته باشیم. فقط برای
716
00:31:56,039 –> 00:31:57,750
یک گرم با وجود دین و براکت درآمد
717
00:31:57,750 –> 00:32:05,580
، شمارش درست است، بنابراین چگونه
718
00:32:05,580 –> 00:32:09,059
میتوانیم این نوع مشکل را برطرف کنیم، اگر مقاله را میخوانید که به نوعی مبهم است،
719
00:32:09,059 –> 00:32:11,010
این مفهوم مانند دادههای طولانی و دادههای گسترده وجود دارد،
720
00:32:11,010 –> 00:32:13,380
721
00:32:13,380 –> 00:32:15,120
اما من هنوز باید
722
00:32:15,120 –> 00:32:16,230
از آن استفاده کنم زیرا اینگونه است افراد پایگاه داده
723
00:32:16,230 –> 00:32:18,210
همچنین در مورد چیزهایی صحبت می کنند، بنابراین شما می
724
00:32:18,210 –> 00:32:19,980
توانید داده های طولانی را مانند ردیف های بسیار بیشتر در نظر
725
00:32:19,980 –> 00:32:22,860
بگیرید، زیرا طولانی است در مقابل داده Y
726
00:32:22,860 –> 00:32:25,289
که فقط یک دسته از ستون ها درست است، بنابراین در
727
00:32:25,289 –> 00:32:26,460
این مورد این نمونه
728
00:32:26,460 –> 00:32:28,320
ای از داده های گسترده است زیرا ما یک دسته از داده ها داریم.
729
00:32:28,320 –> 00:32:31,710
ستونهایی که ما واقعاً میخواهیم به
730
00:32:31,710 –> 00:32:35,399
فرمت طولانی تبدیل شوند، بنابراین امیدوارم
731
00:32:35,399 –> 00:32:37,049
اگر کد را به شما نشان دهم و آن را اجرا کنم، کمی منطقیتر خواهد بود
732
00:32:37,049 –> 00:32:39,600
، بنابراین اگر از
733
00:32:39,600 –> 00:32:41,700
دادههای Y مانند دادههای Y به دادههای طولانی میرویم و به
734
00:32:41,700 –> 00:32:42,840
همین دلیل است که تابع به این شکل نامگذاری شده
735
00:32:42,840 –> 00:32:45,240
است. می توانید به این فکر کنید که اگر
736
00:32:45,240 –> 00:32:47,039
یک شمشیر دارید و می خواهید شمشیر را ذوب کنید،
737
00:32:47,039 –> 00:32:47,549
738
00:32:47,549 –> 00:32:50,639
شمشیر از طریق پاک کردن طولانی در امتداد می رود، بنابراین
739
00:32:50,639 –> 00:32:53,240
عملکردی که ما استفاده می کنیم ذوب نامیده می شود،
740
00:32:53,240 –> 00:32:56,100
بنابراین پانداها عملکردی به نام ذوب دارند،
741
00:32:56,100 –> 00:32:58,139
زیرا ما از پهن می رویم. به طولانی
742
00:32:58,139 –> 00:33:00,960
و ذوب اگر ما لوس k در امضای تابع،
743
00:33:00,960 –> 00:33:04,019
بنابراین اگر زبانه shift را فشار دهید،
744
00:33:04,019 –> 00:33:06,029
اولین شی که می گیرد یک قاب داده است و
745
00:33:06,029 –> 00:33:08,369
بنابراین قاب داده ای را که می خواهیم ذوب کنیم
746
00:33:08,369 –> 00:33:11,909
pew یا PW نامیده می شود و سپس یک
747
00:33:11,909 –> 00:33:15,470
سری پارامتر دیگر در آنجا وجود دارد، بنابراین
748
00:33:15,470 –> 00:33:17,879
یکی از آن پارامترها نامیده می شود. شناسه
749
00:33:17,879 –> 00:33:23,309
VARها و ID VARها اساساً کاری که
750
00:33:23,309 –> 00:33:24,720
میخواهید انجام دهید این است که سعی میکنید
751
00:33:24,720 –> 00:33:26,340
دستهای از ستونها را بردارید و آنها را
752
00:33:26,340 –> 00:33:29,100
به یک ستون در سمت راست تبدیل کنید، بنابراین
753
00:33:29,100 –> 00:33:31,139
از سفید به طولانی تبدیل میشوید، و ID var اساساً این است
754
00:33:31,139 –> 00:33:32,909
که میگوید هی چه چیزی چیست؟
755
00:33:32,909 –> 00:33:34,559
ستون یا ستون هایی هستند که نمی
756
00:33:34,559 –> 00:33:36,869
خواهید درست آنها را لمس کنید و در این
757
00:33:36,869 –> 00:33:38,850
مثال، ما نمی خواهیم
758
00:33:38,850 –> 00:33:40,769
ستون دین را به حال خود رها کنیم، در واقع می خواهیم
759
00:33:40,769 –> 00:33:46,049
همه ستون های دیگر را ذوب
760
00:33:46,049 –> 00:33:47,700
کنیم تا بتوانیم چیزی شبیه به ID VAR ها بگوییم. بهعنوان
761
00:33:47,700 –> 00:33:49,200
دین به معنای ستونی است
762
00:33:49,200 –> 00:33:53,940
که نمیخواهیم تغییر کند، بنابراین اجازه دهید
763
00:33:53,940 –> 00:33:58,019
آن را در متغیری به نام pew long ذخیره کنم و
764
00:33:58,019 –> 00:34:01,259
اگر اکنون به آن نگاه کنیم – همه آن
765
00:34:01,259 –> 00:34:03,360
ستونهایی که توسط ID VAR مشخص نشدهاند،
766
00:34:03,360 –> 00:34:06,749
بنابراین دین و ما آنها
767
00:34:06,749 –> 00:34:09,389
را به طور پیش فرض تبدیل کرده یا آنها را طولانی به یک ستون تبدیل کرده است
768
00:34:09,389 –> 00:34:12,510
به آن مقدار نهایی متغیر
769
00:34:12,510 –> 00:34:15,899
می گویند، بنابراین اگر من از head استفاده نکنم، امیدوارم این
770
00:34:15,899 –> 00:34:18,418
نشان دهد که می توانید ببینید برای یک مذهب خاص،
771
00:34:18,418 –> 00:34:20,399
ما یک دسته درآمد داریم و سپس مانند
772
00:34:20,399 –> 00:34:22,770
حساب درست و این نسخه مرتب
773
00:34:22,770 –> 00:34:25,429
از مجموعه داده درست است که
774
00:34:25,429 –> 00:34:28,589
هر کدام داریم. ستون یک متغیر است بنابراین مذهب در
775
00:34:28,589 –> 00:34:30,899
این مورد مقدار متغیر و مقدار هر
776
00:34:30,899 –> 00:34:34,309
ردیف اکنون یک مشاهده است
777
00:34:37,360 –> 00:34:46,210
سگان آه شاخص D&C ما منحصر به فرد است
778
00:34:46,210 –> 00:34:51,850
من معتقدم که شاخص ها منحصر به فرد هستند من
779
00:34:51,850 –> 00:34:53,980
هرگز نباید در موقعیتی قرار
780
00:34:53,980 –> 00:34:56,139
بگیرم که مثل زمانی که با شاخص ها بازی می کردم
781
00:34:56,139 –> 00:34:58,930
من این کار را انجام میدهم بنابراین
782
00:34:58,930 –> 00:35:02,860
پاسخ واقعی سؤال شما را نمیدانم، اما
783
00:35:02,860 –> 00:35:08,320
منتظر بمانید تا ببینم ممکن است همه چیز درست باشد،
784
00:35:08,320 –> 00:35:12,100
بنابراین مانند شاخص تنظیم مجدد وجود ندارد، بله
785
00:35:12,100 –> 00:35:13,270
، نمیدانم ممکن است با آن بازی کنم.
786
00:35:13,270 –> 00:35:19,930
پس از آن خیلی خوب است، بنابراین اگر
787
00:35:19,930 –> 00:35:21,580
به هر چیزی نگاه کنیم که شما
788
00:35:21,580 –> 00:35:23,560
یک ID مشخص نکرده اید، VAR ها به
789
00:35:23,560 –> 00:35:27,790
پارامتر دیگری به نام نوارهای ارزش وارد می
790
00:35:27,790 –> 00:35:30,430
شوند، بنابراین این تابع واقعاً دو چیز
791
00:35:30,430 –> 00:35:33,250
میله شناسه و نوار مقدار و هر آنچه را که
792
00:35:33,250 –> 00:35:35,020
در نوارهای مقدار مشخص می کنید، می گیرد. اگر شما هدایت ID
793
00:35:35,020 –> 00:35:37,540
نوارهایی که به تنهایی در آن قرار دارند و
794
00:35:37,540 –> 00:35:38,980
بالعکس بسیار خوب است، بنابراین شما هیچ
795
00:35:38,980 –> 00:35:40,660
چیز سادهتر یا کوتاهتری برای تایپ نداشته
796
00:35:40,660 –> 00:35:43,300
باشید، این همان چیزی است که استفاده میکنید، همچنین میتوانید
797
00:35:43,300 –> 00:35:44,740
از هر دوی آنها استفاده کنید، اگر میخواهید
798
00:35:44,740 –> 00:35:47,680
ستونهای زیر مجموعه را همزمان تنظیم کنید. زمان اما
799
00:35:47,680 –> 00:35:50,380
دو پارامتر دیگر در اینجا
800
00:35:50,380 –> 00:35:52,180
نام var و نام مقدار به این صورت است که ما
801
00:35:52,180 –> 00:35:55,150
متغیر مقدار پیشفرض و ستونهای مقدار را
802
00:35:55,150 –> 00:35:59,200
درست تغییر میدهیم، بنابراین اگر
803
00:35:59,200 –> 00:36:02,560
همان قطعه کد را برداریم و بگوییم نام var
804
00:36:02,560 –> 00:36:10,600
اکنون درآمد است، میتوانیم بگوییم مقدار نام
805
00:36:10,600 –> 00:36:16,510
نیز اگر به مجموعه دادههای خود نگاه کنیم، در
806
00:36:16,510 –> 00:36:19,680
واقع نام برخی از
807
00:36:19,680 –> 00:36:27,820
متغیرهای معقول را برای ما به حساب نمیآوریم، بنابراین بله،
808
00:36:27,820 –> 00:36:29,170
بنابراین اگر زمانی در این
809
00:36:29,170 –> 00:36:30,220
موقعیت قرار گرفتید، زمانی که یک دسته
810
00:36:30,220 –> 00:36:31,480
ستون در آنجا دارید، مانند hey، آنها به
811
00:36:31,480 –> 00:36:33,850
وضوح شبیه متغیرها هستند. من میخواهم
812
00:36:33,850 –> 00:36:35,830
مدلی را وارد کنم که تنها کاری که باید انجام دهید
813
00:36:35,830 –> 00:36:40,270
این است که مجموعه دادههای خود را در حالت ذوب قرار دهید
814
00:36:40,270 –> 00:36:42,280
، ستونهایی را که میخواهیم ثابت کنیم یا ستونهایی را
815
00:36:42,280 –> 00:36:44,080
که میخواهیم ذوب شوند، مشخص کنند و سپس
816
00:36:44,080 –> 00:36:47,110
مجموعه دادههای مرتب خود را درست داشته باشید، بنابراین اکنون میتوانید کاری انجام دهید
817
00:36:47,110 –> 00:36:48,580
که به نوعی مانند یک
818
00:36:48,580 –> 00:36:49,300
دین خاص
819
00:36:49,300 –> 00:36:54,340
مانند پیشبینی تعداد یا چیزی
820
00:36:54,340 –> 00:36:55,870
شبیه به یک مدل وحشتناک است
821
00:36:55,870 –> 00:36:57,400
که میخواهید با آن مطابقت کنید، اما این چیزی است
822
00:36:57,400 –> 00:36:59,230
که میتوانید به خوبی انجام دهید، بنابراین
823
00:36:59,230 –> 00:37:02,320
اگر بخواهیم با ستونهای بیشتری کار کنیم چه اتفاقی میافتد تا
824
00:37:02,320 –> 00:37:04,270
مجموعه داده دیگری
825
00:37:04,270 –> 00:37:12,550
در مجموعه دادهها وجود داشته باشد. مجموعه داده
826
00:37:12,550 –> 00:37:17,530
ای است به نام بیلبورد نقطه CSV و این ما
827
00:37:17,530 –> 00:37:19,240
واقعاً همان مشکل را داریم، فقط
828
00:37:19,240 –> 00:37:20,680
ستون های بسیار بیشتری داریم، بنابراین
829
00:37:20,680 –> 00:37:23,320
بیایید به هر ردیفی نگاه کنیم که
830
00:37:23,320 –> 00:37:26,320
یک سال زمان آهنگ هنرمند وارد می شود، بنابراین
831
00:37:26,320 –> 00:37:29,140
اینها همه آهنگ های سال 2000 هستند و سپس
832
00:37:29,140 –> 00:37:31,450
ما رتبهبندی بیلبورد آن را
833
00:37:31,450 –> 00:37:33,160
مانند هفته اول داریم، فکر میکنم همه چیز مشخص
834
00:37:33,160 –> 00:37:36,460
است – مانند هفته 72 و بنابراین این همان
835
00:37:36,460 –> 00:37:38,350
مشکلی است که قبلاً داریم، بنابراین آنچه
836
00:37:38,350 –> 00:37:39,790
واقعاً میخواهیم مانند ستونی به نام
837
00:37:39,790 –> 00:37:42,040
شماره هفته است که شبیه هفته است.
838
00:37:42,040 –> 00:37:43,780
یکی تا 72 و سپس
839
00:37:43,780 –> 00:37:46,510
رتبه واقعی درست است، بنابراین میتوانید کاری را
840
00:37:46,510 –> 00:37:48,820
انجام دهید که میدانید برای یک هفته معین
841
00:37:48,820 –> 00:37:51,880
پیشبینی کنید مانند مقدار واقعی یا
842
00:37:51,880 –> 00:37:56,410
چیزی، بنابراین این همان مشکلی
843
00:37:56,410 –> 00:37:57,490
است که قبل از داشتن یک دسته
844
00:37:57,490 –> 00:38:01,090
ستون t با آن روبرو هستیم. کلاه به جای متغیرها مقادیر
845
00:38:01,090 –> 00:38:02,740
درستی هستند، بنابراین اگر به مقاله برگردید،
846
00:38:02,740 –> 00:38:04,420
ما هنوز در این ستون هستیم، سرصفحهها
847
00:38:04,420 –> 00:38:05,980
یا مقادیر، مشکل نام متغیرها نیست،
848
00:38:05,980 –> 00:38:08,140
این فقط یک نسخه بزرگتر از آن
849
00:38:08,140 –> 00:38:12,610
مشکل است، بنابراین چگونه این را ذوب کنیم تا
850
00:38:12,610 –> 00:38:17,040
از همان استفاده کنیم. عملکرد ذوب
851
00:38:19,020 –> 00:38:23,890
لب های راست ذوب می شود من فقط
852
00:38:23,890 –> 00:38:26,170
با شکستن خط خود بسیار سخاوتمند خواهم بود تا
853
00:38:26,170 –> 00:38:28,690
از صفحه خارج نشود بنابراین
854
00:38:28,690 –> 00:38:30,310
کد دقیقاً مانند قبل است درست است
855
00:38:30,310 –> 00:38:31,870
بنابراین اگر بخواهیم مجموعه داده را ذوب کنیم
856
00:38:31,870 –> 00:38:33,370
اولین چیزی که می گویید این است مثلاً
857
00:38:33,370 –> 00:38:35,680
هی دیشی که میخواهید ذوب شود چیست، بنابراین
858
00:38:35,680 –> 00:38:37,090
اولین پارامتر مجموعه دادهها خواهد بود
859
00:38:37,090 –> 00:38:39,850
و سپس قبل از اینکه
860
00:38:39,850 –> 00:38:43,720
ID’d ما را مشخص کردیم، فقط در دین قرار دادیم، اما در
861
00:38:43,720 –> 00:38:50,830
این مورد واقعاً میخواهیم نگه داریم،
862
00:38:50,830 –> 00:38:52,540
واقعاً میخواهیم سال نگه دارید
863
00:38:52,540 –> 00:38:54,430
تاریخ آهنگ هنرمندان وارد شده مانند
864
00:38:54,430 –> 00:38:55,420
دو ستون دیگر که نمیخواهیم
865
00:38:55,420 –> 00:38:58,960
تغییر دهیم و کارهای دیگری که انجام میدهیم، بنابراین
866
00:38:58,960 –> 00:39:03,750
اینجا میتوانیم فقط در اینجا
867
00:39:03,750 –> 00:39:13,990
قرار دهیم تاریخ آهنگ هنرمندان کاملاً وارد شده است، بنابراین
868
00:39:13,990 –> 00:39:15,520
این ستونهایی هستند که ما انجام نمیدهیم. نمی خواهم
869
00:39:15,520 –> 00:39:17,740
و بعد همه بقیه که هفته
870
00:39:17,740 –> 00:39:20,080
1 تا 72 است، آن ها ستون هایی هستند که
871
00:39:20,080 –> 00:39:22,510
قرار است ذوب شوند، بنابراین
872
00:39:22,510 –> 00:39:24,850
نیازی نیست پارامتر VARs مقدار را
873
00:39:24,850 –> 00:39:27,400
در این مورد قرار دهیم و سپس فقط برای گرد
874
00:39:27,400 –> 00:39:29,080
کردن مثال، اجازه دهید وقتی این کار را انجام داد،
875
00:39:29,080 –> 00:39:33,190
اجازه دهید مانند ایجاد کنیم. نامهای معقول برای
876
00:39:33,190 –> 00:39:35,260
این چیزها، بنابراین ما
877
00:39:35,260 –> 00:39:37,420
ستونها را صدا میزنیم که نام ستونها اکنون
878
00:39:37,420 –> 00:39:40,060
در یک ستون به نام هفته قرار میگیرند و سپس
879
00:39:40,060 –> 00:39:47,260
نام ارزش را همین حالا آن رتبهبندی میخوانیم،
880
00:39:47,260 –> 00:39:50,290
بنابراین اگر به مجموعه دادههای ما
881
00:39:50,290 –> 00:39:52,330
نگاه کنید، آهنگ هنرمندان شما را دریافت میکنیم. تاریخ زمانی وارد شده
882
00:39:52,330 –> 00:39:54,550
برای یک هفته معین امتیاز آن آهنگ چقدر است
883
00:39:54,550 –> 00:39:57,840
درست
884
00:40:02,880 –> 00:40:05,260
چرا ممکن است بخواهید دوباره کاری شبیه به
885
00:40:05,260 –> 00:40:07,240
این را انجام دهید، می توانید این کار را برای اهداف مدل سازی
886
00:40:07,240 –> 00:40:08,890
انجام دهید این در واقع تعریف
887
00:40:08,890 –> 00:40:12,520
داده های ID پسندیده است اگر با
888
00:40:12,520 –> 00:40:15,400
پایگاه های داده کار می کنید پایگاه داده داده و فرمت طولانی را ترجیح می دهید
889
00:40:15,400 –> 00:40:18,400
بنابراین قبل از اینکه چیزی را در
890
00:40:18,400 –> 00:40:19,930
یک پایگاه داده رها کنید، احتمالاً در نهایت
891
00:40:19,930 –> 00:40:20,980
کاری شبیه به این را انجام خواهید داد،
892
00:40:20,980 –> 00:40:23,080
من این مثال را داشتم که در آن
893
00:40:23,080 –> 00:40:27,220
مجموعه دادهای مانند این مجموعه داده 1000 در 1000 ردیف داشتیم و
894
00:40:27,220 –> 00:40:28,869
سعی میکنیم آن را در Postgres بیاندازیم و
895
00:40:28,869 –> 00:40:30,160
واقعاً این واقعیت را دوست نداشت. در زمانی که ما
896
00:40:30,160 –> 00:40:32,170
سعی میکردیم در یک مجموعه داده یا یک جدول قرار دهیم،
897
00:40:32,170 –> 00:40:33,940
من هزار ردیف و هزار ستون
898
00:40:33,940 –> 00:40:36,220
داشتم و بنابراین کاری که باید انجام میدادم این بود که در
899
00:40:36,220 –> 00:40:40,180
واقع این
900
00:40:40,180 –> 00:40:42,580
شیء را به چندین شیء هزار ردیفی با دو
901
00:40:42,580 –> 00:40:44,440
ستون تبدیل کنم و سپس و سپس
902
00:40:44,440 –> 00:40:48,790
درست است، بنابراین چیزهای مختلف به اشکال مختلف نیاز دارند
903
00:40:48,790 –> 00:40:50,290
، اما شما همچنین به پایگاه دادهها فکر میکنید،
904
00:40:50,290 –> 00:40:52,690
این نیز برای قالببندی
905
00:40:52,690 –> 00:40:59,740
پایگاههای اطلاعاتی است که ترجیح میدهند کارها را به خوبی انجام دهند،
906
00:40:59,740 –> 00:41:05,920
بنابراین شکل را به خاطر بسپارید، بنابراین
907
00:41:05,920 –> 00:41:08,200
شکل بیلبورد این مجموعه داده بیلبورد واقعاً در
908
00:41:08,200 –> 00:41:14,490
ابتدا 317 ردیف و 81 ستون داشت
909
00:41:16,920 –> 00:41:26,410
که من تماس میگیرم. این یادداشت را ببینید بله بله، بنابراین
910
00:41:26,410 –> 00:41:29,020
من فقط همان چیزی را که گفتم صحبت می کنم، بنابراین
911
00:41:29,020 –> 00:41:31,030
اگر به دو شکل دو
912
00:41:31,030 –> 00:41:34,780
مجموعه داده نگاه کنید، متوجه خواهید شد که ردیف های یکی از دیگری
913
00:41:34,780 –> 00:41:38,320
بسیار بیشتر از دیگری است، درست گاهی اوقات
914
00:41:38,320 –> 00:41:40,210
این اتفاقی می افتد که شما
915
00:41:40,210 –> 00:41:41,650
سعی میکنم دادهها را مرتب کنم،
916
00:41:41,650 –> 00:41:42,940
مثل اوه، قبلاً فقط صد
917
00:41:42,940 –> 00:41:45,099
ردیف داشتم، من یک میلیون حلقه
918
00:41:45,099 –> 00:41:47,349
دارم، این تعداد سلول واقعاً یکسان است، اما یکی از آنها
919
00:41:47,349 –> 00:41:49,510
قطعاً از نظر
920
00:41:49,510 –> 00:41:51,609
قالب برای ذخیرهسازی دادهها و فقط
921
00:41:51,609 –> 00:42:01,000
مدلسازی مطلوبتر است. به طور کلی خیلی خوب است،
922
00:42:01,000 –> 00:42:04,810
پس بیایید برویم، بنابراین معمولاً PD است
923
00:42:04,810 –> 00:42:06,010
که ذوب می شود، این همان کاری است که وقتی
924
00:42:06,010 –> 00:42:07,450
اولین مشکل را دارید انجام می دهید، مثلاً من
925
00:42:07,450 –> 00:42:08,650
یک دسته ستون دارم، فقط می خواهم
926
00:42:08,650 –> 00:42:11,380
آن را ذوب کنم، چه اتفاقی می افتد اگر
927
00:42:11,380 –> 00:42:13,869
چند