فیلم آموزشی: دانیل چن: تمیز کردن و مرتب کردن داده ها در پانداها | PyData DC 2018 با زیرنویس فارسی - فیلمهای python | ویدئو های آموزش پایتون

در این مطلب، ویدئو دانیل چن: تمیز کردن و مرتب کردن داده ها در پانداها | PyData DC 2018 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:27:22

تصاویر این ویدئو:

قسمتی از زیرنویس این فیلم:

1
00:00:00,659 –> 00:00:02,929
بنابراین، کسانی از شما که وارد

2
00:00:02,929 –> 00:00:06,660
این سایت می‌شوید، مخزن github برای

3
00:00:06,660 –> 00:00:08,670
همه چیزهایی است که ما روی آن کار خواهیم کرد، بنابراین

4
00:00:08,670 –> 00:00:10,740
حتی بعد از آموزش نوت‌بوک‌ها

5
00:00:10,740 –> 00:00:13,860
، همه آنها را اینجا منتشر می‌کنم،

6
00:00:13,860 –> 00:00:15,900
کاری که می‌خواهم انجام دهید این است که اگر می‌توانید بروید به

7
00:00:15,900 –> 00:00:19,109
پیوندی که در اینجا هایلایت شده است و

8
00:00:19,109 –> 00:00:21,320
اگر راه خود را درباره github نمی‌دانید،

9
00:00:21,320 –> 00:00:24,060
می‌توانید روی این دکمه سبز رنگ اینجا

10
00:00:24,060 –> 00:00:27,029
کلیک کنید و روی download zip کلیک کنید و

11
00:00:27,029 –> 00:00:28,470
حداقل همه چیز در

12
00:00:28,470 –> 00:00:31,320
مهم‌ترین بخش مربوط به آن دانلود می‌شود زیرا

13
00:00:31,320 –> 00:00:33,120
مجموعه داده‌های ما با آنها کار خواهم کرد،

14
00:00:33,120 –> 00:00:34,950
همه در این مخزن ذخیره می شوند، بنابراین اگر می

15
00:00:34,950 –> 00:00:38,040
خواهید دنبال کنید، حداقل می توانید

16
00:00:38,040 –> 00:00:52,440
آن راه را دنبال کنید، بنابراین من فقط

17
00:00:52,440 –> 00:00:55,520
کمی در مورد راه اندازی صحبت خواهم کرد، بنابراین

18
00:00:55,520 –> 00:00:57,690
وقتی این را دانلود کردید، اگر

19
00:00:57,690 –> 00:00:59,910
I’ll را دانلود کنید فرض کنید نسخه زیپ آن را دانلود کرده

20
00:00:59,910 –> 00:01:01,379
اید و من تصور نمی کنم

21
00:01:01,379 –> 00:01:03,000
که همه افراد حاضر در اتاق می دانند

22
00:01:03,000 –> 00:01:07,229
آن را در جایی که راحت است از حالت فشرده خارج کنید،

23
00:01:07,229 –> 00:01:09,299
بنابراین دسکتاپ احتمالاً مکانی مفید

24
00:01:09,299 –> 00:01:12,210
حداقل برای آموزش

25
00:01:12,210 –> 00:01:14,850
برای شما در ویندوز و مک باشد.

26
00:01:14,850 –> 00:01:16,799
من o را مرتب می کنم f فرض می کند که شما

27
00:01:16,799 –> 00:01:19,020
توزیع آناکوندا پایتون را اجرا می کنید و

28
00:01:19,020 –> 00:01:22,340
بنابراین اگر ناوبر آناکوندا را باز کنید،

29
00:01:22,340 –> 00:01:24,360
اگر اولین بار است که آن را باز می

30
00:01:24,360 –> 00:01:26,369
کنید و ممکن است کمی طول بکشد،

31
00:01:26,369 –> 00:01:28,080
اما یک دکمه در

32
00:01:28,080 –> 00:01:29,610
آن وجود دارد. که می‌گوید Jupiter notebook یا

33
00:01:29,610 –> 00:01:32,520
Jupiter lab و یکبار کلیک می‌کنید که

34
00:01:32,520 –> 00:01:36,360
مرورگر باید چیزی را که می‌خواهم نشان دهم باز کند

35
00:01:36,360 –> 00:01:37,439
، کمی متفاوت است

36
00:01:37,439 –> 00:01:44,579
زیرا این یک ماشین لینوکس است، اما من

37
00:01:44,579 –> 00:01:47,689
فقط تمام این موارد تصادفی دیگر را

38
00:01:47,689 –> 00:01:50,100
قبل از اینکه چیزی که از آن متاسفم نشان داده شود پنهان می‌کنم. روی

39
00:01:50,100 –> 00:01:52,250
صفحه نمایش

40
00:01:52,380 –> 00:01:55,540
[Music

41
00:02:13,380 –> 00:02:16,750
] خیلی خوب است، بنابراین اگر از Anaconda the

42
00:02:16,750 –> 00:02:18,670
Navigator استفاده می کنید و روی آزمایشگاه مشتری یا مرکز مشتری کلیک می کنید، در

43
00:02:18,670 –> 00:02:23,020
نهایت ممکن

44
00:02:23,020 –> 00:02:24,340
است صفحه ای مانند این را دریافت کنید، اگر

45
00:02:24,340 –> 00:02:26,880
روی Jupiter lab کلیک کنید، منظورم مرکز مشتری است

46
00:02:26,880 –> 00:02:28,030
متاسفم

47
00:02:28,030 –> 00:02:31,959
دفترچه یادداشت مشتری اگر می خواهید یک

48
00:02:31,959 –> 00:02:35,350
خارجی جدید وجود دارد که می توانید با آن بازی کنید

49
00:02:35,350 –> 00:02:38,140
به نام Jupiter lab، من احتمالاً در نهایت

50
00:02:38,140 –> 00:02:40,360
از آزمایشگاه مشتری برای این

51
00:02:40,360 –> 00:02:43,900
آموزش استفاده خواهم کرد و آزمایشگاه مشتری می دانید که

52
00:02:43,900 –> 00:02:45,040
می توانید آن را مانند

53
00:02:45,040 –> 00:02:47,380
تکرار بعدی نوت بوک در نظر بگیرید. سیستم آن

54
00:02:47,380 –> 00:02:50,440
بسیار مفید است زیرا

55
00:02:50,440 –> 00:02:52,480
دسترسی راحت‌تری به همه چیز

56
00:02:52,480 –> 00:02:54,340
خواهید داشت، بنابراین می‌توانید فوراً فایل‌های خود را مرور کنید،

57
00:02:54,340 –> 00:02:56,890
چیزی که واقعاً جالب است این است که فایل‌های CSV

58
00:02:56,890 –> 00:02:58,239
نیز می‌توانند به‌عنوان صفحه‌گسترده در

59
00:02:58,239 –> 00:02:59,800
آزمایشگاه Jupiter ارائه شوند که اگر فقط بازی می‌کنید واقعاً مفید است.

60
00:02:59,800 –> 00:03:00,940
در اطراف با داده ها،

61
00:03:00,940 –> 00:03:05,800
چیزی که واقعاً مفید است این است که می

62
00:03:05,800 –> 00:03:07,480
توانید چندین نوت بوک را همزمان باز داشته

63
00:03:07,480 –> 00:03:10,570
باشید و می توانید مانند دو نما

64
00:03:10,570 –> 00:03:11,980
از یک چیز مشابه داشته باشید که واقعاً

65
00:03:11,980 –> 00:03:13,630
مفید است که مانند یکی از چیزهایی بود که

66
00:03:13,630 –> 00:03:15,010
مردم همیشه از آن شکایت می کردند.

67
00:03:15,010 –> 00:03:18,340
اگر

68
00:03:18,340 –> 00:03:20,769
هنوز با آن بازی نکرده‌اید،

69
00:03:20,769 –> 00:03:24,010
پیشنهاد می‌کنم آن را بررسی کنید، بنابراین امیدوارم

70
00:03:24,010 –> 00:03:31,800
همه آن را راه‌اندازی کنند

71
00:03:31,800 –> 00:03:33,850
و کاملاً متوجه این

72
00:03:33,850 –> 00:03:35,950
آشفتگی شده باشند، فراموش کردم که یادداشت‌هایم را

73
00:03:35,950 –> 00:03:38,400
برای کل دوره

74
00:03:48,260 –> 00:03:50,840
برای آن دسته از شما بچه‌هایی که سوالی

75
00:03:50,840 –> 00:03:53,700

76
00:03:53,700 –> 00:03:55,740
دارید راحت دستتان را بلند کنید یک نفر با میکروفون به سمت شما می‌دود و

77
00:03:55,740 –> 00:03:58,140
می‌توانید در وسط صحبت را کاملاً قطع کنید

78
00:03:58,140 –> 00:04:01,530

79
00:04:01,530 –> 00:04:04,530
.

80
00:04:04,530 –> 00:04:11,520
درست کردن یادداشت هایم، اوه که

81
00:04:11,520 –> 00:04:24,000
مفید نیست، رندر درست کار می کند، بنابراین

82
00:04:24,000 –> 00:04:26,810
این یک آموزش بسیار مقدماتی است، بنابراین اگر

83
00:04:26,810 –> 00:04:28,950
قبلاً با پانداها کار نکرده

84
00:04:28,950 –> 00:04:31,740
اید یا با داده های جدولی در

85
00:04:31,740 –> 00:04:33,540
پایتون کار نکرده اید، این معمولاً

86
00:04:33,540 –> 00:04:36,930
مخاطب هدف من است.

87
00:04:36,930 –> 00:04:39,270
تفاوت اصلی در مورد این یکی این است که من

88
00:04:39,270 –> 00:04:40,890
از خیلی چیزها رد می‌شوم و مستقیماً به بخش

89
00:04:40,890 –> 00:04:43,530
واقعی داده‌های Tidy Tidying

90
00:04:43,530 –> 00:04:47,970
آن می‌رسم که به نظرم بیشترین پسند را داشت

91
00:04:47,970 –> 00:04:49,380
و به همین دلیل بود که

92
00:04:49,380 –> 00:04:51,930
مانند Python یا Python استفاده کردم. انجام

93
00:04:51,930 –> 00:04:53,490
تجزیه و تحلیل فقط به این دلیل که انجام این دستکاری داده ها

94
00:04:53,490 –> 00:04:56,780
برای من به نوعی جادویی بود،

95
00:04:56,780 –> 00:05:00,440
بنابراین این سرعت کلی است

96
00:05:00,440 –> 00:05:03,600
که اگر

97
00:05:03,600 –> 00:05:05,250
آموزش های دیگری را که ارائه داده ام دیده باشید،

98
00:05:05,250 –> 00:05:06,960
متوجه خواهید شد که مانند من تقریباً می پرم. از

99
00:05:06,960 –> 00:05:09,260
مانند فصل اول – مانند فصل شش، اما

100
00:05:09,260 –> 00:05:11,910
ما حفره‌ها را در طول مسیر پوشش می‌دهیم، بنابراین زیاد نگران این موضوع

101
00:05:11,910 –> 00:05:14,640
نباشید، بنابراین امیدوارم

102
00:05:14,640 –> 00:05:17,420
که مجموعه داده‌ها را دانلود

103
00:05:17,420 –> 00:05:20,010
کرده باشید و این سیستم نوت بوک را باز کنید و

104
00:05:20,010 –> 00:05:22,320
ما به نوعی زندگی می‌کنیم کد همراه و

105
00:05:22,320 –> 00:05:23,670
فقط همانطور که من آنها را مرور می‌کنم از طریق دستورات صحبت

106
00:05:23,670 –> 00:05:26,640
کنید، بنابراین پایتون با

107
00:05:26,640 –> 00:05:29,280
مجموعه‌ای از کتابخانه‌ها همراه است و به طور پیش‌فرض فقط

108
00:05:29,280 –> 00:05:31,110
برای اینکه همه چیز را سریع‌تر بارگذاری کند، می‌دانید که

109
00:05:31,110 –> 00:05:33,030
آنها همه چیز را یکباره بارگذاری نمی‌کنند،

110
00:05:33,030 –> 00:05:35,760
بنابراین ما باید اوپ خود را وارد کنیم. اجازه دهید من

111
00:05:35,760 –> 00:05:41,070
این را بسازم. بزرگتر است، بنابراین باید کتابخانه‌ها را وارد کنیم،

112
00:05:41,070 –> 00:05:43,140
بنابراین کتابخانه‌ای که

113
00:05:43,140 –> 00:05:45,480
استفاده از آن را از دست می‌دهیم pandas نامیده می‌شود و این

114
00:05:45,480 –> 00:05:47,790
کتابخانه ما برای خواندن در داده‌های جدولی است

115
00:05:47,790 –> 00:05:51,090
و بنابراین اگر بخواهیم اکنون می‌توانیم از پانداها استفاده کنیم،

116
00:05:51,090 –> 00:05:52,740
آنها یک عملکرد ویژه در آنجا دارند

117
00:05:52,740 –> 00:05:55,919
به نام خواندن. CSV برای خواندن در فایل‌های CSV، بنابراین

118
00:05:55,919 –> 00:05:58,530
ما می‌توانیم آنچه را که در آن بارگذاری می‌کنیم به یک متغیر اختصاص دهیم،

119
00:05:58,530 –> 00:06:00,570
بنابراین آن را DF یا قاب داده می‌نامیم

120
00:06:00,570 –> 00:06:01,320

121
00:06:01,320 –> 00:06:04,890
و در پایتون وقتی در

122
00:06:04,890 –> 00:06:06,150
کتابدار بارگیری می‌کنید، می‌خواهید تابعی را

123
00:06:06,150 –> 00:06:08,250
در کتابخانه فراخوانی کنید، از این

124
00:06:08,250 –> 00:06:09,450
علامت نقطه استفاده کنید. بنابراین ما در این

125
00:06:09,450 –> 00:06:11,430
کتابخانه پانداها می‌گفتیم که می‌خواهیم از یک

126
00:06:11,430 –> 00:06:14,550
تابع واقعاً خاص از آن استفاده کنیم و

127
00:06:14,550 –> 00:06:15,750
تابعی که می‌خواهیم استفاده کنیم خواندن CSV نامیده می‌شود

128
00:06:15,750 –> 00:06:18,210
و اگر نمی‌پرسید چگونه

129
00:06:18,210 –> 00:06:19,980
آن چیزی را به نمایش گذاشتم، کلید تب را بزنید

130
00:06:19,980 –> 00:06:23,760
و آن را به صورت خودکار برای

131
00:06:23,760 –> 00:06:27,990
شما انجام می دهد بنابراین در خواندن CSV if اگر زبانه shift را

132
00:06:27,990 –> 00:06:29,790
در نوت‌بوک بزنید،

133
00:06:29,790 –> 00:06:32,070
امضای تابع را برای شما بالا می‌آورد و اولین

134
00:06:32,070 –> 00:06:34,050
چیزی که می‌گیرد مسیر فایل

135
00:06:34,050 –> 00:06:36,180
یا بافر است، بنابراین به

136
00:06:36,180 –> 00:06:40,940
مسیر فایل یا فایلی اشاره می‌کند که می‌خواهیم

137
00:06:43,520 –> 00:06:47,520
از عبارت Ooh فراموش کردم استفاده کنیم.

138
00:06:47,520 –> 00:06:50,910
اگر در سیستم نوت بوک مشتری هستید، باید یک کار مهم دیگر انجام

139
00:06:50,910 –> 00:06:54,330
دهید،

140
00:06:54,330 –> 00:06:58,680
در حال حاضر من در پوشه داده هستم، بنابراین قبلاً دیدید

141
00:06:58,680 –> 00:07:00,930
که ما در ابتدا اینجا بودیم،

142
00:07:00,930 –> 00:07:03,330
روی داده کلیک کردم و سپس یک

143
00:07:03,330 –> 00:07:07,170
نوت بوک جدید در اینجا ایجاد کردم. درست است، پس این همان کاری بود که من

144
00:07:07,170 –> 00:07:09,060
انجام دادم، بنابراین وقتی مانند نقطه اسلش ضربه می زنم، به

145
00:07:09,060 –> 00:07:10,650
این معنی است که فهرست فعلی خود را در سربرگ ضربه نگاه می کنم،

146
00:07:10,650 –> 00:07:12,660
تمام مجموعه های داده ای

147
00:07:12,660 –> 00:07:15,540
که دارم در آنجا هستند و در

148
00:07:15,540 –> 00:07:16,800
نوت بوک بعدی به شما نشان خواهم داد که وقتی شما را جابجا می کنید چه اتفاقی می افتد.

149
00:07:16,800 –> 00:07:18,150
نوت بوک را در یک پوشه دیگر قرار دهید،

150
00:07:18,150 –> 00:07:21,240
بنابراین اولین مجموعه داده ای که می خواهیم

151
00:07:21,240 –> 00:07:24,230
به آن نگاه کنیم Gapminder TSV نامیده می شود و

152
00:07:24,230 –> 00:07:27,240
می توانید با پسوند ببینید که

153
00:07:27,240 –> 00:07:29,790
این یک فایل مقدار جدا شده از تب است و با کاما

154
00:07:29,790 –> 00:07:32,310
جدا نشده است، بنابراین ما در واقع باید به

155
00:07:32,310 –> 00:07:35,690
خواندن CSV یک پارامتر متفاوت به نام آن بدهیم.

156
00:07:35,690 –> 00:07:38,880
کاسبرگ بریده بریده کلید بنابراین bac کلید kslash و به

157
00:07:38,880 –> 00:07:41,340
این صورت است که به پانداها می‌گوییم هی به‌طور

158
00:07:41,340 –> 00:07:43,020
پیش‌فرض فایل‌های CSV را می‌خوانید یا فایل‌های مشخص شده را نظر می‌دهید،

159
00:07:43,020 –> 00:07:45,930
اما در این مثال ما

160
00:07:45,930 –> 00:07:50,780
در واقع یک فایل جداشده از تب داریم، بنابراین

161
00:07:50,780 –> 00:07:53,280
این چیز قاب داده در پایتون یک

162
00:07:53,280 –> 00:07:56,160
شی است و اگر بخواهیم می‌توانیم

163
00:07:56,160 –> 00:07:58,470
تمام DF را پرینت کنید و ما فقط

164
00:07:58,470 –> 00:08:01,160
کل مجموعه داده های ریخته شده روی صفحه

165
00:08:01,160 –> 00:08:03,990

166
00:08:03,990 –> 00:08:06,120
را به ما می دهیم، اما یک راه واقعا راحت این روش است که head نام دارد، بنابراین می گوییم هد DF

167
00:08:06,120 –> 00:08:07,560
با براکت های گرد، فقط پنج ردیف اول را به ما می دهد

168
00:08:07,560 –> 00:08:09,150
و هنگامی که

169
00:08:09,150 –> 00:08:10,560
برای اولین بار در مجموعه داده‌ها بارگیری مجدد می‌کنید،

170
00:08:10,560 –> 00:08:11,910
این واقعاً مفید است زیرا

171
00:08:11,910 –> 00:08:13,320
واقعاً می‌خواهید مطمئن شوید که مانند

172
00:08:13,320 –> 00:08:15,599
ستون شما واقعاً مانند کلنی شما

173
00:08:15,599 –> 00:08:17,969
به درستی بارگیری شده است، گاهی اوقات مجموعه داده‌هایی

174
00:08:17,969 –> 00:08:19,529
مانند ردیف اول مانند یک ستون خالی هستند

175
00:08:19,529 –> 00:08:22,409
که در این صورت مانند و آنچه ممکن است

176
00:08:22,409 –> 00:08:24,300
به درستی بارگیری نشود یا شاید شما

177
00:08:24,300 –> 00:08:25,770
اصلاً ستونی در مجموعه داده خود نداشته

178
00:08:25,770 –> 00:08:27,419
باشید و پانداها به طور پیش فرض

179
00:08:27,419 –> 00:08:29,279
ردیف اول را مانند نام ستون در نظر می گیرند، بنابراین

180
00:08:29,279 –> 00:08:31,889
ممکن است با چیزی نامطلوب مواجه شوید تا

181
00:08:31,889 –> 00:08:33,179
همیشه بخواهید مانند Hea نگاه کنید. d فقط برای

182
00:08:33,179 –> 00:08:35,818
اینکه مطمئن شویم همه چیز به درستی بارگذاری شده است،

183
00:08:35,818 –> 00:08:39,599
بنابراین اگر به مجموعه داده های خود نگاه کنیم، یک

184
00:08:39,599 –> 00:08:41,969
قاب داده در پانداها واقعاً دارای سه

185
00:08:41,969 –> 00:08:42,809
جزء مختلف

186
00:08:42,809 –> 00:08:44,399
است، نام ستون ها در بالا

187
00:08:44,399 –> 00:08:47,069
وجود دارد، این شاخص در سمت چپ وجود دارد، بنابراین در

188
00:08:47,069 –> 00:08:48,509
این مورد ایندیس واقعاً است. جاده

189
00:08:48,509 –> 00:08:51,300
شماره ردیف را نامگذاری می کند و سپس

190
00:08:51,300 –> 00:08:54,540
مانند بدنه قاب داده وجود دارد و

191
00:08:54,540 –> 00:08:56,819
اگر زمانی به آن ضربه بزنید می توانید به آن

192
00:08:56,819 –> 00:08:58,800
سه مؤلفه هر طور که می خواهید دسترسی داشته باشید

193
00:08:58,800 –> 00:09:02,610
تا بتوانیم ستون های DF را بگوییم و این

194
00:09:02,610 –> 00:09:04,380
فقط ستون های مجموعه داده ما را به

195
00:09:04,380 –> 00:09:06,180
شما می دهد. متوجه می‌شویم که ستون‌ها

196
00:09:06,180 –> 00:09:08,279
براکت ندارند، فقط یک ویژگی

197
00:09:08,279 –> 00:09:10,079
از قاب داده است، در واقع مانند

198
00:09:10,079 –> 00:09:13,079
تابعی نیست که فراخوانی می‌شود، اگر بخواهیم

199
00:09:13,079 –> 00:09:14,970
به ردیف نقل قول-unquote دسترسی داشته باشیم،

200
00:09:14,970 –> 00:09:18,959
شاخص نقطه‌ای DF خود را نام‌گذاری می‌کند و به این

201
00:09:18,959 –> 00:09:21,750
ترتیب بخش شاخص را دریافت می‌کنید. بنابراین، اگر

202
00:09:21,750 –> 00:09:23,370
پانداها را پایین بیاورید و با

203
00:09:23,370 –> 00:09:25,470
داده‌های سری زمانی زیادی کار کنید،

204
00:09:25,470 –> 00:09:27,000
مانند روز را به عنوان شاخص تنظیم

205
00:09:27,000 –> 00:09:29,399
می‌کنید تا بتوانید در زمان روز به ردیف‌های مختلف دسترسی به مجموعه داده‌های خود دسترسی داشته باشید.

206
00:09:29,399 –> 00:09:32,310

207
00:09:32,310 –> 00:09:34,259
و سپس در وسط درست اینجا

208
00:09:34,259 –> 00:09:36,029
مانند بدنه واقعی قاب داده ما

209
00:09:36,029 –> 00:09:40,319
که مقادیر نامیده می شود و بنابراین

210
00:09:40,319 –> 00:09:42,509
اگر نیاز دارید این یکی از راه های این است مانند هی من

211
00:09:42,509 –> 00:09:44,250
سعی می کنم این شی قاب داده را بگیرم

212
00:09:44,250 –> 00:09:45,779
و آن را به این کتابخانه دیگر و

213
00:09:45,779 –> 00:09:47,459
این کتابخانه دیگر پمپ کنم آیا

214
00:09:47,459 –> 00:09:49,980
می‌داند یک قاب داده چیست و در

215
00:09:49,980 –> 00:09:52,259
آن و مانند آرایه‌های numpy کار می‌کند، به

216
00:09:52,259 –> 00:09:54,240
این ترتیب است که شما اساساً مانند

217
00:09:54,240 –> 00:09:56,279
نسخه آرایه‌ای numpy مجموعه داده‌های شما

218
00:09:56,279 –> 00:09:59,399
خوب می‌شوید، بنابراین زمانی که با آن کار می‌کردید باید این کار را انجام دهید.

219
00:09:59,399 –> 00:10:00,360

220
00:10:00,360 –> 00:10:02,069
scikit-learn همیشه وجود دارد، اما آنها به

221
00:10:02,069 –> 00:10:03,959
نوعی توانایی کار با

222
00:10:03,959 –> 00:10:05,310
اشیاء قاب داده پانداها را دارند، اما

223
00:10:05,310 –> 00:10:07,319
گاهی اوقات به خصوص اگر با اعدادی کار می کنید

224
00:10:07,319 –> 00:10:10,079
که فرض می کنند همه چیز یک

225
00:10:10,079 –> 00:10:12,060
آرایه بی رنگ است و بنابراین گاهی

226
00:10:12,060 –> 00:10:13,889
اوقات مجبور می شوید فقط برای بدست آوردن از مقادیر نقطه استفاده

227
00:10:13,889 –> 00:10:16,949
کنید. هنگامی که اغلب با پایتون کار می کنید،

228
00:10:16,949 –> 00:10:20,250
مجموعه داده های شما یک چیز دیگر این است که

229
00:10:20,250 –> 00:10:23,639

230
00:10:23,639 –> 00:10:27,750
این تابع نوع است که واقعاً مفید است

231
00:10:27,750 –> 00:10:28,980
زمانی که در پایتون کار

232
00:10:28,980 –> 00:10:32,160
می کنید، با خطای عجیبی روبرو می شوید و فقط

233
00:10:32,160 –> 00:10:34,199
می خواهید o بدانید که چرا و نوع

234
00:10:34,199 –> 00:10:35,730
اشیاء شما چیست، بنابراین می توانید اینجا را ببینید

235
00:10:35,730 –> 00:10:37,889
که این شیء قاب داده

236
00:10:37,889 –> 00:10:43,980
پاندا است، قاب داده پاندا را دقیقاً اینجا می بینید،

237
00:10:43,980 –> 00:10:45,779
بنابراین وقتی

238
00:10:45,779 –> 00:10:47,070
دوست دارید برای اولین بار مجموعه داده های خود را بارگیری کنید، چه کار دیگری انجام می دهید.

239
00:10:47,070 –> 00:10:49,170
زمان خوب، این ویژگی

240
00:10:49,170 –> 00:10:51,420
به نام shape وجود دارد و

241
00:10:51,420 –> 00:10:53,970
تعداد سطرها و ستون‌ها را در مجموعه داده‌های شما به شما می‌دهد، بنابراین

242
00:10:53,970 –> 00:10:55,470
این مجموعه داده این مجموعه داده Gapminder

243
00:10:55,470 –> 00:10:58,709
دارای 1704 ردیف و شش ستون است

244
00:10:58,709 –> 00:11:00,329
و اگر بتوانید تصور کنید که

245
00:11:00,329 –> 00:11:02,449
میلیون‌ها ردیف یا صدها ستون

246
00:11:02,449 –> 00:11:05,699
به جای بررسی هر کدام و یکی از

247
00:11:05,699 –> 00:11:06,899
آنها، می‌دانید که این یک راه سریع برای

248
00:11:06,899 –> 00:11:08,329
اطمینان از اینکه آیا من داده‌هایم را به درستی دریافت کرده‌ام

249
00:11:08,329 –> 00:11:11,310
اگر در حال خواندن داده‌هایی از

250
00:11:11,310 –> 00:11:13,380
ابزارهای مشابه هستیم، این چیزها معمولاً

251
00:11:13,380 –> 00:11:15,570
واقعاً خاص هستند، مانند هر

252
00:11:15,570 –> 00:11:17,220
بار یک مجموعه داده

253
00:11:17,220 –> 00:11:19,079
300 سطر و پنج ستون است و این

254
00:11:19,079 –> 00:11:20,850
یکی از راه‌هایی است که می‌توانید بررسی کنید که آیا نور

255
00:11:20,850 –> 00:11:23,100
دستگاه دوست ندارد

256
00:11:23,100 –> 00:11:26,160
مجموعه داده‌های بدی را برای شما تخلیه کند، چه اتفاقی می‌افتد

257
00:11:26,160 –> 00:11:29,209
گاهی اوقات فراموش می‌کنید این ویژگی‌ها را نیز فراموش می‌کنید.

258
00:11:29,209 –> 00:11:31,829
گاهی

259
00:11:31,829 –> 00:11:33,360
اوقات ستون هایی با براکت های گرد می گذارم و

260
00:11:33,360 –> 00:11:36,690
شما ممکن است فراموش کنید و بنابراین اگر در

261
00:11:36,690 –> 00:11:37,949
نهایت کاری مانند شکل نقطه DF

262
00:11:37,949 –> 00:11:39,720
با براکت های گرد انجام دهید به این معنی مانند هی من

263
00:11:39,720 –> 00:11:41,370
تابع شکل را در

264
00:11:41,370 –> 00:11:42,899
قاب داده فراخوانی می کنم نه فقط ویژگی shape

265
00:11:42,899 –> 00:11:45,420
شما یک پیغام خطایی شبیه به این دریافت خواهید کرد،

266
00:11:45,420 –> 00:11:47,550
در این مورد می‌گوید این یک

267
00:11:47,550 –> 00:11:49,139
شی چندگانه است که قابل فراخوانی نیست، زیرا

268
00:11:49,139 –> 00:11:51,300
دلایلی که ما به عقب برمی‌گردیم این

269
00:11:51,300 –> 00:11:52,920
است که تاپل را به‌عنوان فهرست پایتون در نظر

270
00:11:52,920 –> 00:11:55,110
بگیرید که نمی‌توانید آن را تغییر دهید.

271
00:11:55,110 –> 00:11:56,819
نمی داند این به عنوان یک

272
00:11:56,819 –> 00:11:59,190
تابع به چه معناست، آیا به همین دلیل است که شما

273
00:11:59,190 –> 00:12:01,790
یک خطای مشابه دریافت می کنید،

274
00:12:02,149 –> 00:12:06,899
بنابراین موارد دیگر که اگر واقعاً تعداد زیادی ستون ندارید، انجام می دهید

275
00:12:06,899 –> 00:12:08,670
، یک

276
00:12:08,670 –> 00:12:10,350
چیز واقعاً مفید این است که فقط بگویید هی به

277
00:12:10,350 –> 00:12:12,600
من اطلاعات این قاب داده و

278
00:12:12,600 –> 00:12:14,310
این نوع ردیف اول را به شما می دهد، بنابراین

279
00:12:14,310 –> 00:12:16,589
به ما می گوید که قاب داده

280
00:12:16,589 –> 00:12:20,339
ما 1704 سطر داریم و آنها از صفر تا 1703 برچسب گذاری شده اند،

281
00:12:20,339 –> 00:12:23,579
بنابراین این برچسب همان شاخصی است

282
00:12:23,579 –> 00:12:26,610
که قبلاً و سپس در اینجا مشاهده کردیم.

283
00:12:26,610 –> 00:12:28,740
وسط آن به همه ما کمک می کند lumns بنابراین

284
00:12:28,740 –> 00:12:30,470
در سمت چپ به ما می‌دهد به

285
00:12:30,470 –> 00:12:32,910
ما می‌گوید شش ستون اینجا در

286
00:12:32,910 –> 00:12:35,040
سمت چپ وجود دارد، نام ستون در

287
00:12:35,040 –> 00:12:37,110
مرکز تعداد اشیاء غیر پوچ را به ما می‌دهد،

288
00:12:37,110 –> 00:12:39,390
بنابراین در این مورد می‌توانید ببینید

289
00:12:39,390 –> 00:12:41,130
که مانند hey we هیچ داده گمشده

290
00:12:41,130 –> 00:12:42,550
ای در مجموعه داده های ما

291
00:12:42,550 –> 00:12:44,800
ندارید و در سمت راست

292
00:12:44,800 –> 00:12:47,290
نوع اطلاعات ذخیره شده در آن

293
00:12:47,290 –> 00:12:49,450
ستون را به ما می گوید، بنابراین اگر شیء را در پاندا ببینید به

294
00:12:49,450 –> 00:12:51,120
این معنی است که یک شی رشته معمولی است

295
00:12:51,120 –> 00:12:53,890
اما می توانید در این مجموعه داده ببینید. ما

296
00:12:53,890 –> 00:12:55,780
اعداد صحیح داریم، اعداد ممیز شناور

297
00:12:55,780 –> 00:12:58,050
نیز داریم و انواع دیگری نیز در

298
00:12:58,050 –> 00:13:01,270
پانداها وجود دارد، بنابراین اگر با

299
00:13:01,270 –> 00:13:04,180
زبان‌های آماری دیگر

300
00:13:04,180 –> 00:13:06,340
مانند فاکتوری کار کنید، خواهید دید که به عنوان

301
00:13:06,340 –> 00:13:14,020
یک دسته در پایتون یا پانداها کدگذاری

302
00:13:14,020 –> 00:13:16,840
شده است. بیایید در واقع کاری را

303
00:13:16,840 –> 00:13:18,700
با مجموعه داده‌های خود انجام دهیم، اجازه دهید شروع به فیلتر کردن

304
00:13:18,700 –> 00:13:20,200
و برش دادن داده‌های خود کنیم

305
00:13:20,200 –> 00:13:23,610
تا از مقدمه اصلی این چیزها عبور کنیم،

306
00:13:23,610 –> 00:13:26,140
بنابراین اگر فقط یک ستون

307
00:13:26,140 –> 00:13:29,470
از مجموعه داده‌های خود را می‌خواستیم، می‌توانیم مجموعه داده‌های خود را با

308
00:13:29,470 –> 00:13:32,050
استفاده از براکت‌های مربعی آنقدر مربع بگیریم. براکت ها به صورت

309
00:13:32,050 –> 00:13:37,570
کلی است Python چگونه برخی از

310
00:13:37,570 –> 00:13:40,720
زیرمجموعه‌های زیرمجموعه را انجام می‌دهد و اگر می‌خواهیم برای

311
00:13:40,720 –> 00:13:43,180
مثال ستون کشور

312
00:13:43,180 –> 00:13:44,620
را در کشور رشته در پرانتز

313
00:13:44,620 –> 00:13:47,620
قرار دهیم و

314
00:13:47,620 –> 00:13:55,120
ستون کشور را درست به ما می‌دهد تا کاری که می‌توانیم انجام دهیم این

315
00:13:55,120 –> 00:13:56,920
است که می‌توانیم این را برداریم و ذخیره کنیم. این به

316
00:13:56,920 –> 00:14:00,610
سمت راست متغیر است، بنابراین می‌توانیم بگوییم کشور

317
00:14:00,610 –> 00:14:02,830
می‌دانی فریم همان دستوری است که

318
00:14:02,830 –> 00:14:07,090
قبل از آن دیدیم، بنابراین اگر بخواهیم

319
00:14:07,090 –> 00:14:08,620
به

320
00:14:08,620 –> 00:14:10,600
جای همه آن‌ها فقط به دو سطر اول نگاه کنیم، می‌توانیم به آن

321
00:14:10,600 –> 00:14:13,450
نقطه سر بگوییم. یک

322
00:14:13,450 –> 00:14:16,750
چیز مهم این است که اگر یک ستون در یک قاب داده دارید به نوع آن نگاه کنیم،

323
00:14:16,750 –> 00:14:19,420

324
00:14:19,420 –> 00:14:22,660
آنچه برمی گردد یک سری است، بنابراین می

325
00:14:22,660 –> 00:14:24,640
توانید یک قاب داده را به عنوان یک دسته

326
00:14:24,640 –> 00:14:26,920
ستون در نظر بگیرید که هر ستون یک سری است،

327
00:14:26,920 –> 00:14:28,540
خوب است. چگونه این دو کلمه در نهایت

328
00:14:28,540 –> 00:14:30,820
با هم کار می کنند و شما می توانید

329
00:14:30,820 –> 00:14:35,320
یک سری را تقریباً مانند یک numpy مانند یک

330
00:14:35,320 –> 00:14:37,480
آرایه numpy یک بعدی شگفت انگیز در نظر بگیرید،

331
00:14:37,480 –> 00:14:45,100
درست است، بنابراین اگر ستون های بیشتری در مجموعه داده خود بخواهیم چه اتفاقی می افتد،

332
00:14:45,100 –> 00:14:49,630
متأسفیم، بیایید ببینیم

333
00:14:49,630 –> 00:14:52,390
این زیر مجموعه است،

334
00:14:52,390 –> 00:14:54,530
بنابراین گاهی اوقات چیزی که شما دارید می خواهم انجام دهم مانند

335
00:14:54,530 –> 00:14:55,790
سلام، من این مجموعه داده غول پیکر را دارم،

336
00:14:55,790 –> 00:14:57,770
اما مانند همه این

337
00:14:57,770 –> 00:14:59,450
ستون های دیگر به آن اهمیت نمی دهم، من فقط به زیر مجموعه روی

338
00:14:59,450 –> 00:15:01,520
این ستون ها اهمیت می دهم، بنابراین آنچه می توانید در پایتون انجام دهید این

339
00:15:01,520 –> 00:15:03,560
است که اگر می خواهید چندین چیز را با نام مشخص کنید.

340
00:15:03,560 –> 00:15:06,470
در یک

341
00:15:06,470 –> 00:15:09,410
لیست پایتون، بنابراین ما این مجموعه بیرونی از

342
00:15:09,410 –> 00:15:10,610
براکت‌های مربع را داریم که واقعاً به

343
00:15:10,610 –> 00:15:12,200
پایتون می‌گوید هی من می‌خواهم چیزی را زیرمجموعه قرار دهم

344
00:15:12,200 –> 00:15:15,050
و سپس فهرستی در پایتون مجموعه دیگری

345
00:15:15,050 –> 00:15:17,420
از براکت‌های مربع است، به همین دلیل است که

346
00:15:17,420 –> 00:15:18,800
اگر می‌خواهید دو براکت را ببینید.

347
00:15:18,800 –> 00:15:20,270
تلاش برای بیرون کشیدن چندین ستون

348
00:15:20,270 –> 00:15:22,490
به طور همزمان و بنابراین در اینجا اگر

349
00:15:22,490 –> 00:15:35,480
قاره کشور و سال را می‌خواهیم به این

350
00:15:35,480 –> 00:15:37,180
دلیل است که املای آن را اشتباه نوشتم،

351
00:15:37,180 –> 00:15:39,590
بنابراین اگر چندین ستون می‌خواستیم و

352
00:15:39,590 –> 00:15:41,450
فقط سعی می‌کنیم آن را با

353
00:15:41,450 –> 00:15:43,220
نام ستون‌های واقعی مشخص کنیم. ما می‌توانیم

354
00:15:43,220 –> 00:15:45,920
آن را در یک لیست پایتون قرار دهیم و سپس

355
00:15:45,920 –> 00:15:48,800
آن شی فهرست را در نحوه زیرمجموعه‌بندی فریم‌های داده قرار دهیم،

356
00:15:48,800 –> 00:15:55,090
یک چیز دیگر را در نظر داشته باشیم،

357
00:15:55,600 –> 00:15:59,600
اگر پانداها را انجام دهیم،

358
00:15:59,600 –> 00:16:02,030
نسخه‌های زیرخط دوبل زیرخط را انجام می‌دهیم،

359
00:16:02,030 –> 00:16:03,920
به این ترتیب نسخه فعلی پانداهایی که

360
00:16:03,920 –> 00:16:05,810
هستید را دریافت می‌کنید. wor با این

361
00:16:05,810 –> 00:16:07,280
کار وقتی شروع به گوگل‌کردن کنید و

362
00:16:07,280 –> 00:16:09,220
سعی کنید از Stack Overflow کمک بگیرید بسیار مهم می‌شود

363
00:16:09,220 –> 00:16:13,990
که گاهی اوقات api خراب می‌شود و

364
00:16:13,990 –> 00:16:17,090
امیدواریم که پاسخ Stack Overflow

365
00:16:17,090 –> 00:16:18,620
نسخه پانداهایی را که استفاده می‌کنند به شما بدهد

366
00:16:18,620 –> 00:16:20,150
یا امیدواریم راه‌حل دیگری وجود داشته باشد

367
00:16:20,150 –> 00:16:22,340
که از چیزی استفاده می‌کند.

368
00:16:22,340 –> 00:16:27,920
مدرن‌تر است، بنابراین ما ستون‌ها را زیرمجموعه‌ای می‌کنیم،

369
00:16:27,920 –> 00:16:29,560
بنابراین در مورد

370
00:16:29,560 –> 00:16:32,180
ردیف‌ها، سه روش مختلف

371
00:16:32,180 –> 00:16:34,340
در API واقعی پایتون وجود دارد که چگونه می‌توانید زیر

372
00:16:34,340 –> 00:16:36,740

373
00:16:36,740 –> 00:16:40,160

374
00:16:40,160 –> 00:16:43,280
مجموعه‌ای از ردیف‌های دو تا از آنها را پیشنهاد کنید.

375
00:16:43,280 –> 00:16:45,440
بنابراین من هر سه آنها را پوشش خواهم داد و سپس

376
00:16:45,440 –> 00:16:47,090
می دانید فقط به شما می گویم که فقط به دو مورد نیاز

377
00:16:47,090 –> 00:16:48,530
دارید و واقعاً باید با یکی از

378
00:16:48,530 –> 00:16:52,220
آنها کار کنید، بنابراین چگونه می توانیم جاده های خاصی را بدست آوریم

379
00:16:52,220 –> 00:16:54,200
که ایده آل هستند، می توانید اینجا ببینید که

380
00:16:54,200 –> 00:16:56,330
این شاخص وجود دارد که ما درست در مورد آن صحبت کردیم،

381
00:16:56,330 –> 00:16:58,070
بنابراین این مکان شاخص از

382
00:16:58,070 –> 00:16:59,720
قوانین مهم این است که چگونه ردیف های زیر مجموعه را می کنیم،

383
00:16:59,720 –> 00:17:02,390
زیرا به این صورت است که ما

384
00:17:02,390 –> 00:17:04,910
یک ردیف خاص را در مجموعه داده های خود فراخوانی می کنیم،

385
00:17:04,910 –> 00:17:09,750
بنابراین اگر برای مثال می خواستیم آن را فراخوانی کنیم.

386
00:17:09,750 –> 00:17:14,099
می‌دانید که ردیف سوم در مجموعه داده ما است،

387
00:17:14,099 –> 00:17:16,290
اما ما سعی می‌کنیم آن را

388
00:17:16,290 –> 00:17:19,260
با همان رشته‌ای که

389
00:17:19,260 –> 00:17:22,950
روی صفحه می‌بینید ارجاع دهیم، راهی وجود دارد که می‌توانیم

390
00:17:22,950 –> 00:17:25,829
داده‌ها را با استفاده از LOC برای اساساً

391
00:17:25,829 –> 00:17:28,920
موقعیت مکانی زیرمجموعه‌بندی کنیم و اگر آن را بدهیم یک مقدار به

392
00:17:28,920 –> 00:17:32,640
عنوان مثال برای آن در آن شاخص به نظر می رسد

393
00:17:32,640 –> 00:17:35,520
و می بیند که هی چه چیزی با این تماس مطابقت دارد

394
00:17:35,520 –> 00:17:39,000
– درست است که واقعاً

395
00:17:39,000 –> 00:17:43,470
مانند شاخصی نیست که ردیف دوم

396
00:17:43,470 –> 00:17:45,060
به دنبال چیزی است که با

397
00:17:45,060 –> 00:17:48,540
نماد مطابقت دارد – درست است و این مقداری دارد

398
00:17:48,540 –> 00:17:50,910
ما واقعاً در

399
00:17:50,910 –> 00:17:53,070
این دوره یا در این آموزش به آن نخواهیم پرداخت، اما اگر

400
00:17:53,070 –> 00:17:55,710
دوست دارید داده‌های الحاقی مانند اتصال ردیف شروع به

401
00:17:55,710 –> 00:17:59,010
یکدیگر را داشته باشید، می‌توانید

402
00:17:59,010 –> 00:18:00,990
این وضعیت را داشته باشید که این فهرست ردیف

403
00:18:00,990 –> 00:18:03,600
تکراری است و اگر بگویید LOC –

404
00:18:03,600 –> 00:18:05,520
در واقع دو ردیف به عقب برمی‌گردید. به جای

405
00:18:05,520 –> 00:18:07,620
یک، زیرا واقعاً شبیه

406
00:18:07,620 –> 00:18:10,080
آنچه در اینجا چاپ شده

407
00:18:10,080 –> 00:18:18,720
است، یعنی نوشتن مانند آن کاراکتر – بنابراین اگر

408
00:18:18,720 –> 00:18:21,120
می‌خواهیم چندین ردیف را برگردانیم، درست

409
00:18:21,120 –> 00:18:22,980
مانند آنچه با ستون‌ها انجام دادیم،

410
00:18:22,980 –> 00:18:25,860
مجموعه را در لیست پایتون قرار می‌دهیم. اگر

411
00:18:25,860 –> 00:18:29,160
بخواهیم و مثلاً 0، یک قاب داده

412
00:18:29,160 –> 00:18:31,500
را با 2 و 0 به ترتیبی که

413
00:18:31,500 –> 00:18:33,990
می‌خواهیم برمی‌گردانیم و دوباره این LOC است

414
00:18:33,990 –> 00:18:36,200
و در واقع تقریباً مانند

415
00:18:36,200 –> 00:18:38,610
تطبیق کاراکترها انجام می‌دهد، مثل من به

416
00:18:38,610 –> 00:18:42,750
دنبال چیزی به نام – بنابراین راه دیگری که

417
00:18:42,750 –> 00:18:46,020
می‌توانیم فریم‌های داده را زیرمجموعه قرار دهیم، استفاده از

418
00:18:46,020 –> 00:18:49,920
چیزی به نام I look so I’ll oak است

419
00:18:49,920 –> 00:18:51,810
و I مخفف شاخص است، بنابراین اینجا جایی است

420
00:18:51,810 –> 00:18:53,820
که ما در واقع شروع به شمارش

421
00:18:53,820 –> 00:18:55,950
از 0 می‌کنیم و سپس می‌گوییم که

422
00:18:55,950 –> 00:18:57,780
جاده ای که ما در حال تلاش برای رسیدن به آن هستیم، بنابراین اگر

423
00:18:57,780 –> 00:19:00,810
بگویم من بلوط خواهم داشت – این واقعاً می خواهد

424
00:19:00,810 –> 00:19:02,520
به شما نشان دهم که این مجموعه داده شبیه به چه شکلی است

425
00:19:02,520 –> 00:19:05,340
– واقعاً می گوید

426
00:19:05,340 –> 00:19:08,310
من 0 1 2 می گیرم که این موقعیت شاخص است

427
00:19:08,310 –> 00:19:11,070
که ما می خواهیم و این همان جاده ای است که

428
00:19:11,070 –> 00:19:13,980
به عقب کشیده می شود، بنابراین

429
00:19:13,980 –> 00:19:16,050

430
00:19:16,050 –> 00:19:18,480
در این مثال تفاوت ظریفی بین این دو وجود دارد، زیرا

431
00:19:18,480 –> 00:19:20,190
شاخص واقعاً همان چیزی است که

432
00:19:20,190 –> 00:19:21,510
شماره ردیف دارد، تشخیص آن کمی سخت

433
00:19:21,510 –> 00:19:23,100
است، اما می توانید تصور کنید اگر شروع به

434
00:19:23,100 –> 00:19:24,420
کار با مجموعه داده ها کنید و

435
00:19:24,420 –> 00:19:26,760
گاهی اوقات می خواهید فقط آنها را ترکیب کنید

436
00:19:26,760 –> 00:19:28,440
چیزی که برچسب گذاری می شود و گاهی اوقات شما می خواهید

437
00:19:28,440 –> 00:19:31,680
مانند موقعیت واقعی در سومین یا

438
00:19:31,680 –> 00:19:40,200
فهرست دو در مجموعه داده های خود را به آخرین راه

439
00:19:40,200 –> 00:19:41,580
اگر در اسناد نگاه کنید

440
00:19:41,580 –> 00:19:45,080
، این راه برای دسترسی به ردیف ها و ردیف هایی

441
00:19:45,080 –> 00:19:50,370
به نام I X یا X وجود دارد و در اینجا اگر سعی کنید

442
00:19:50,370 –> 00:19:54,810
انجام دهید. هر چیزی در X یا IX به شما نشان می

443
00:19:54,810 –> 00:19:57,900
دهد که این یک هشدار انکار غول بزرگ است

444
00:19:57,900 –> 00:20:00,900
و همچنین می گوید لطفاً از LOC استفاده کنید

445
00:20:00,900 –> 00:20:04,350
یا به جای آن I loc کنید من

446
00:20:04,350 –> 00:20:06,450
ترتیب دقیق را به خاطر نمی آورم اما فکر می کنم به نوعی

447
00:20:06,450 –> 00:20:09,840
در آن کار می کند که انگار کار می کند. شما ابتدا از LOC استفاده می کنید

448
00:20:09,840 –> 00:20:11,250
و اگر آنها نتوانند این کار را انجام دهند

449
00:20:11,250 –> 00:20:14,250
، در قسمت I. I look right نمایش داده می شود و

450
00:20:14,250 –> 00:20:15,750
بنابراین می توانید ببینید که به نوعی مبهم است

451
00:20:15,750 –> 00:20:17,700
و به همین دلیل است که می

452
00:20:17,700 –> 00:20:19,410
گویند هی این کار را نکنید به هیچ وجه

453
00:20:19,410 –> 00:20:21,180
ممکن است به پایه های کد قدیمی برخورد کنید که

454
00:20:21,180 –> 00:20:23,760
در واقع از IX استفاده می کنند و می دانید که وقتی

455
00:20:23,760 –> 00:20:25,470
آن را می بینید سعی کنید آن را درست کنید یا با آن شخص

456
00:20:25,470 –> 00:20:27,840
صحبت کنید مانند برچسب

457
00:20:27,840 –> 00:20:29,970
سطر یا موقعیت شاخص واقعی

458
00:20:29,970 –> 00:20:32,790
ردیف درست و فقط

459
00:20:32,790 –> 00:20:33,840
به نوعی کد خود را

460
00:20:33,840 –> 00:20:35,160
با گفتن این جمله که هی ما این

461
00:20:35,160 –> 00:20:36,690
نفریم این مبهم است، اجازه دهید از

462
00:20:36,690 –> 00:20:43,320
شر آن خلاص شویم، بنابراین چگونه می‌توانیم چندین ردیف

463
00:20:43,320 –> 00:20:45,180
و ستون به دست آوریم که فرض کنید می‌خواهیم

464
00:20:45,180 –> 00:20:46,710
ستون‌های خود را زیرمجموعه قرار دهیم و همچنین

465
00:20:46,710 –> 00:20:51,690
فیلتر کردن بر اساس ردیف‌ها را شروع کنیم تا در

466
00:20:51,690 –> 00:20:54,000
نهایت از LOC برای زیرمجموعه ردیف‌ها

467
00:20:54,000 –> 00:20:57,510
و ستون‌ها استفاده کنید. و اگر

468
00:20:57,510 –> 00:20:59,010
واقعاً می‌خواهید در مورد

469
00:20:59,010 –> 00:21:00,090
نحوه تایپ این موارد

470
00:21:00,090 –> 00:21:03,090
LOC صحبت کنید، اگر روی آن کار کرده‌اید،

471
00:21:03,090 –> 00:21:05,550
نماد واقعاً شبیه به آن است،

472
00:21:05,550 –> 00:21:07,260
می‌توانید یک کاما داشته باشید و بخشی

473
00:21:07,260 –> 00:21:08,550
در سمت چپ کاما وجود دارد و قسمتی به

474
00:21:08,550 –> 00:21:10,920
سمت راست و بالای کاما نحوه تعیین

475
00:21:10,920 –> 00:21:13,140
ردیف‌های خود در سمت

476
00:21:13,140 –> 00:21:15,150
چپ کاما و سپس نحوه

477
00:21:15,150 –> 00:21:17,400
تعیین یا زیر مجموعه ستون‌های خود در

478
00:21:17,400 –> 00:21:20,820
سمت راست کاما است، بنابراین اگر در

479
00:21:20,820 –> 00:21:24,150
پایتون متأسفیم اگر ما اوه، اگر به عنوان مثال

480
00:21:24,150 –> 00:21:26,460
فقط می‌خواهیم همه ستون‌ها

481
00:21:26,460 –> 00:21:30,090
را بگیریم و همه ردیف‌ها را نگه داریم، می‌توانیم این

482
00:21:30,090 –> 00:21:31,750
نماد برش را این فراخوانی را قرار دهیم

483
00:21:31,750 –> 00:21:32,770
که فقط می‌گوید هی همه چیز را به من بده

484
00:21:32,770 –> 00:21:34,810
اینجا و این فقط می‌گوید hey

485
00:21:34,810 –> 00:21:37,060
همه سطرها را به من بده و سپس ادامه

486
00:21:37,060 –> 00:21:39,250
سمت راست را اگر ضرب بخواهیم

487
00:21:39,250 –> 00:21:41,050
ستون‌ها چندین ستون را به خاطر می‌آورند که

488
00:21:41,050 –> 00:21:49,840
می‌توانیم در لیست پایتون قرار دهیم، می‌توانیم

489
00:21:49,840 –> 00:21:51,310
تمام ردیف‌های مجموعه داده‌های خود را دریافت کنیم و سپس به درستی

490
00:21:51,310 –> 00:21:53,710
بر اساس ستون‌ها فیلتر کنیم،

491
00:21:53,710 –> 00:21:55,540
اما این نماد را می‌دانید که

492
00:21:55,540 –> 00:21:57,970
در این مورد واقعاً احمقانه است، زیرا می‌توانیم

493
00:21:57,970 –> 00:21:59,440
فقط داشته باشیم.

494
00:21:59,440 –> 00:22:01,990
برای شروع از نماد دو براکت مربع

495
00:22:01,990 –> 00:22:03,820
استفاده کردیم، اما این مزیت‌هایی دارد، زیرا اکنون می‌توانیم

496
00:22:03,820 –> 00:22:06,550
زیرمجموعه‌های بولی

497
00:22:06,550 –> 00:22:10,630
ردیف‌های خود را به طور همزمان بشناسیم، بنابراین چه

498
00:22:10,630 –> 00:22:15,850
شکلی به نظر می‌رسد، فرض کنید

499
00:22:15,850 –> 00:22:20,340
ما قاب داده‌ای را می‌خواستیم که آن را پایه‌گذاری می‌کنیم. خارج

500
00:22:20,340 –> 00:22:23,410
از برچسب شاخص و در اینجا فرض کنید

501
00:22:23,410 –> 00:22:27,400
می‌خواستیم سال 1967 را

502
00:22:27,400 –> 00:22:29,560
بدانید، پس چگونه مشخص کنیم که همه ردیف‌ها را می‌خواهیم

503
00:22:29,560 –> 00:22:32,440
که سال 1967 باشد، بنابراین واقعاً می‌توانیم

504
00:22:32,440 –> 00:22:36,340
بگوییم هی DF ما ستون سال

505
00:22:36,340 –> 00:22:41,670
را می‌گیریم و می‌خواهیم برای اطمینان از اینکه سال 1967 6

506
00:22:41,670 –> 00:22:45,790
1967 است و سپس اگر سال و

507
00:22:45,790 –> 00:22:50,440
جمعیت را می‌خواهیم، می‌توانیم برای تم

508
00:22:50,440 –> 00:22:53,440
م ردیف‌هایی که ستون سالی ما 1967 است فیلتری انجام دهیم و س

509
00:22:53,440 –> 00:22:58,050
س فقط ستون‌های خاص را زیر مجموعه قرار ده

510
00:23:03,810 –> 00:23:08,790

511
00:23:08,790 –> 00:23:11,080
م. به عنوان مثال ما یک مورد دیگر انجام خواهیم داد

512
00:23:11,080 –> 00:23:13,480
به عنوان مثال، اگر می‌خواهید این کار را انجام دهید،

513
00:23:13,480 –> 00:23:15,520
سعی می‌کنید این تنظیمات فرعی بولی را انجام دهید

514
00:23:15,520 –> 00:23:20,700
و می‌خواهید برای مثال

515
00:23:20,700 –> 00:23:23,380
شرایط چندگانه یا چندین حالت بولی را انجام دهید

516
00:23:23,380 –> 00:23:27,340
، ترفند این است که باید هر

517
00:23:27,340 –> 00:23:29,380
عبارت جداگانه را در مجموعه‌ای از

518
00:23:29,380 –> 00:23:33,220
براکت‌های گرد بپیچید، بنابراین بیایید بگوییم ما سال مورد نظر

519
00:23:33,220 –> 00:23:42,580
یعنی 1967 و سپس DF Pop بزرگتر

520
00:23:42,580 –> 00:23:45,840
از من نمی

521
00:23:47,920 –> 00:23:54,170
دانم این 1/2 میلیون چیست که کمی کم به نظر می رسد

522
00:23:54,170 –> 00:23:56,540
شاید این کار

523
00:23:56,540 –> 00:24:00,740
چیز جالب دیگری در مورد اعداد پایتون

524
00:24:00,740 –> 00:24:04,190
مانند 10 یا هزار باشد، بیایید از

525
00:24:04,190 –> 00:24:06,320
هزار هزار استفاده کنیم. شما در واقع می توانید

526
00:24:06,320 –> 00:24:08,090
به عنوان یک نشانگر بصری از این خط زیر برای

527
00:24:08,090 –> 00:24:10,040
اعداد صحیح استفاده کنید و همان

528
00:24:10,040 –> 00:24:12,020
چیزی را به درستی نشان می دهد، بنابراین اگر

529
00:24:12,020 –> 00:24:13,760
برای کمک به

530
00:24:13,760 –> 00:24:15,830
تفکیک اعداد خود مانند معادل کاما نیاز دارید، پایتون یک

531
00:24:15,830 –> 00:24:17,450
زیرخط صفر صفر صفر همان چیزی

532
00:24:17,450 –> 00:24:21,140
را که هزار است می بیند. امیدوارم خواندن

533
00:24:21,140 –> 00:24:22,760
کد شما کمی آسان‌تر شود، بنابراین

534
00:24:22,760 –> 00:24:26,390
من این دو حالت بولی را دارم و اگر

535
00:24:26,390 –> 00:24:28,280
می‌خواهیم هر دو درست باشند،

536
00:24:28,280 –> 00:24:30,380
می‌توانیم از علامت علامت استفاده کنیم و اگر می‌خواهید

537
00:24:30,380 –> 00:24:33,320
در یا از این لوله عمودی برای o استفاده کنید. r

538
00:24:33,320 –> 00:24:36,350
و دلیل اینکه نماد

539
00:24:36,350 –> 00:24:40,780
به این شکل در می‌آید، جایی که باید به

540
00:24:40,780 –> 00:24:43,490
جای پایتون معمولی a و D از براکت‌های گرد و علامت علامت استفاده

541
00:24:43,490 –> 00:24:45,740
کنید،

542
00:24:45,740 –> 00:24:47,570
واقعاً در حال مقایسه بیتی است و به

543
00:24:47,570 –> 00:24:51,100
همین دلیل است که من کد را انجام دادم خیلی جالب به نظر می‌رسد.

544
00:24:51,730 –> 00:24:55,190

545
00:24:55,190 –> 00:24:56,810
بخش های واقعی چون ما اکنون

546
00:24:56,810 –> 00:25:01,970
با مقدمه تمام شده ایم، بنابراین اگر

547
00:25:01,970 –> 00:25:06,500
مجموعه داده ها را دانلود کردید یا آن

548
00:25:06,500 –> 00:25:11,840
پوشه پوشه ای به نام notebook وجود دارد، پوشه ای به نام notebook وجود دارد،

549
00:25:11,840 –> 00:25:13,610
بنابراین بیایید

550
00:25:13,610 –> 00:25:15,320
به پوشه notebooks برویم و سپس یک

551
00:25:15,320 –> 00:25:19,010
نوت بوک Jupiter جدید ایجاد کنیم. در آنجا است بنابراین

552
00:25:19,010 –> 00:25:20,720
اولین نوت بوک آنها من می توانم نام آن را تغییر

553
00:25:20,720 –> 00:25:24,500
دهم و این مقدمه را صدا می زنم و سپس دومی را درست می

554
00:25:24,500 –> 00:25:28,700
گویم بنابراین

555
00:25:28,700 –> 00:25:30,890
کلید اینجا این است که من اکنون در یک

556
00:25:30,890 –> 00:25:33,800
پوشه متفاوت از جایی هستم که همه مجموعه های داده در آن

557
00:25:33,800 –> 00:25:35,660
ذخیره می شوند. واقعاً فقط چند

558
00:25:35,660 –> 00:25:37,850
پیامد از نحوه بارگیری یا

559
00:25:37,850 –> 00:25:43,030
یافتن مجموعه داده های خود دارد، اما قبل از اینکه به آنجا برویم

560
00:25:45,570 –> 00:25:48,149
و من این پیوند را در مخزن github قرار

561
00:25:48,149 –> 00:25:50,369
می دهم تا شما بچه ها بتوانید آن را پیدا کنید، اما

562
00:25:50,369 –> 00:25:53,309
اجازه دهید فقط در مورد داده های مرتب صحبت کنیم و

563
00:25:53,309 –> 00:25:54,869
چه کار می کند. این بدان معناست که وقتی مجموعه داده‌های شما

564
00:25:54,869 –> 00:25:57,809
نقل قول – بدون نقل قول درست است و

565
00:25:57,809 –> 00:25:59,369
بنابراین این مقاله واقعاً زیبا از هدلی

566
00:25:59,369 –> 00:26:01,919
ویکهام وجود دارد که او از دنیای ما آمده است، اما

567
00:26:01,919 –> 00:26:03,809
شما می‌دانید که مواردی از این دست

568
00:26:03,809 –> 00:26:06,389
کاملاً مرتبط هستند، زبان آگنوستیک است و بنابراین

569
00:26:06,389 –> 00:26:07,409
داشتن مشابه به چه معناست.

570
00:26:07,409 –> 00:26:09,269
مجموعه داده های پاک درست است و این به

571
00:26:09,269 –> 00:26:10,470
نوعی دلیلی است که این مقاله در مورد

572
00:26:10,470 –> 00:26:12,090
آن صحبت می کند، هی ما این دو روز را

573
00:26:12,090 –> 00:26:14,940
داریم که با جدول 1 و جدول 2 تعریف شده است

574
00:26:14,940 –> 00:26:17,639
و می دانید

575
00:26:17,639 –> 00:26:19,799
اگر در مورد ردیف ها و ستون ها صحبت کنیم،

576
00:26:19,799 –> 00:26:20,970
کدام یک بهتر است. و این همان چیزی است که این

577
00:26:20,970 –> 00:26:22,229
مقاله در مورد آن صحبت می کند، مثلاً ما در واقع به

578
00:26:22,229 –> 00:26:24,629
کلمات بهتری برای این چیزها

579
00:26:24,629 –> 00:26:27,929
نیاز داریم و سپس او همچنین می گوید خوب

580
00:26:27,929 –> 00:26:29,999
این دو چیز حاوی اطلاعات یکسانی هستند،

581
00:26:29,999 –> 00:26:31,799
اما

582
00:26:31,799 –> 00:26:34,320
نسخه دیگری از این مجموعه داده در جدول 3 و

583
00:26:34,320 –> 00:26:37,289
این وجود دارد. مانند نسخه واقعی یا

584
00:26:37,289 –> 00:26:40,080
تمیز این مجموعه داده است و

585
00:26:40,080 –> 00:26:42,090
چرا می توانید تصور کنید که فرض کنید می خواهید

586
00:26:42,090 –> 00:26:45,450
مدلی را با یک مدل آماری مطابقت دهید که مانند این است که

587
00:26:45,450 –> 00:26:47,489
شما برخی از نتایج را بر اساس

588
00:26:47,489 –> 00:26:49,139
درمان درست می دانید اکنون می‌توانید

589
00:26:49,139 –> 00:26:51,119
مدلی را که نتیجه

590
00:26:51,119 –> 00:26:54,059
آن Y است و درمان X شماست را بپسندید، درست

591
00:26:54,059 –> 00:26:56,039
مثل اینکه یک نظر برای آن داشته

592
00:26:56,039 –> 00:26:58,019
باشید، در حالی که مجموعه داده‌هایی مانند این را می‌شناسید،

593
00:26:58,019 –> 00:26:59,190
نمی‌توانید واقعاً مانند آنچه

594
00:26:59,190 –> 00:27:00,869
ستون است ندارید که مانند متغیر پاسخ من است

595
00:27:00,869 –> 00:27:02,190
و سپس ستونی برای

596
00:27:02,190 –> 00:27:04,830
ورودی های من درست است، بنابراین این

597
00:27:04,830 –> 00:27:06,840
یک نشانه بصری برای دوست داشتن خوب است

598
00:27:06,840 –> 00:27:08,879
، وقتی داده ها تمیز هستند به چه معناست،

599
00:27:08,879 –> 00:27:10,499
چیز دیگر مانند زمانی است که

600
00:27:10,499 –> 00:27:12,809
داده های خود را واقعاً مانند یک فرمت مرتب

601
00:27:12,809 –> 00:27:14,369
پایین‌تر است، بنابراین اگر فقط داده‌ها را پردازش می‌کنید،

602
00:27:14,369 –> 00:27:15,779
این یک هدف بسیار خوب است برای

603
00:27:15,779 –> 00:27:17,129
اینکه مجموعه داده‌های نهایی شما چگونه باید

604
00:27:17,129 –> 00:27:19,229
باشد اگر مجموعه داده‌ها و قالب‌بندی‌های خود را به این شکل دریافت کنید،

605
00:27:19,229 –> 00:27:21,119
تبدیل آن

606
00:27:21,119 –> 00:27:23,009
به هر چیزی که نیاز دارید بسیار آسان است. این

607
00:27:23,009 –> 00:27:24,629
نسخه از مجموعه داده‌های ما ممکن است

608
00:27:24,629 –> 00:27:26,129
برای مدل‌های آماری خوب باشد، اما

609
00:27:26,129 –> 00:27:28,049
اگر می‌خواهید جدولی از

610
00:27:28,049 –> 00:27:29,999
نتایج را مانند یکی از این دو شکل نشان دهید،

611
00:27:29,999 –> 00:27:31,979
احتمالاً بسیار بهتر است مانند یک

612
00:27:31,979 –> 00:27:33,720
فرد خاص، شما واقعاً می‌توانید به راحتی آن را بررسی کنید.

613
00:27:33,720 –> 00:27:36,450
الف و درمان B

614
00:27:36,450 –> 00:27:38,279
اما اینجا کمی سخت تر است، مثلا هی

615
00:27:38,279 –> 00:27:39,989
من دنبال جین دو می گردم

616
00:27:39,989 –> 00:27:41,460

617
00:27:41,460 –> 00:27:43,739

618
00:27:43,739 –> 00:27:45,119

619
00:27:45,119 –> 00:27:47,999
.

620
00:27:47,999 –> 00:27:49,259
بهتر از دیگری همه آنها

621
00:27:49,259 –> 00:27:51,599
اهداف متفاوتی دارند، اما نکته کلیدی این است

622
00:27:51,599 –> 00:27:53,009
که وقتی داده های خود را در قالب تمیز یا مرتب دریافت می کنید،

623
00:27:53,009 –> 00:27:56,609
تبدیل آنها به یکدیگر بسیار آسان است

624
00:27:56,609 –> 00:27:57,989
و این همان چیزی است که ما

625
00:27:57,989 –> 00:28:00,200
در

626
00:28:00,210 –> 00:28:02,549
مورد تعریف رسمی داده های Tidy

627
00:28:02,549 –> 00:28:04,409
صحبت خواهیم کرد. هادلی ویکهام در مقاله خود در مورد اینکه

628
00:28:04,409 –> 00:28:06,779
هر متغیر یک ستون

629
00:28:06,779 –> 00:28:08,909
را تشکیل می دهد هر مشاهده یک ردیف را تشکیل می دهد هر نوع

630
00:28:08,909 –> 00:28:11,549
واحد مشاهده ای که یک جدول را تشکیل می دهد

631
00:28:11,549 –> 00:28:12,900
احتمالاً واقعاً فقط در مورد دو مورد اول صحبت می کند

632
00:28:12,900 –> 00:28:14,549
بنابراین برای هر

633
00:28:14,549 –> 00:28:16,500
متغیری که یک ستون را تشکیل می دهد چه معنایی دارد که هر مشاهده

634
00:28:16,500 –> 00:28:19,799
یک ردیف را تشکیل می دهد. بیایید به این

635
00:28:19,799 –> 00:28:20,909
نسخه در اینجا نگاه کنیم، می توانید ببینید که ما یک

636
00:28:20,909 –> 00:28:22,590
ستون به نام نام داریم، یک ستون به نام

637
00:28:22,590 –> 00:28:24,659
ستون درمان به نام نتیجه سمت راست، بنابراین

638
00:28:24,659 –> 00:28:26,909
آنها سه متغیر جداگانه هستند که

639
00:28:26,909 –> 00:28:28,620
به این معنی است که آنها سه متغیر جداگانه هستند.

640
00:28:28,620 –> 00:28:31,440
الف وارد مدلی می‌شود که می‌خواهیم

641
00:28:31,440 –> 00:28:34,470
تعریف کنیم و در هر مشاهده یک

642
00:28:34,470 –> 00:28:36,450
ردیف درست را تشکیل می‌دهد، بنابراین برای یک فرد معین،

643
00:28:36,450 –> 00:28:39,360
ارزش درمانی او را داریم و

644
00:28:39,360 –> 00:28:44,580
نتیجه آن‌ها کمی بیشتر در

645
00:28:44,580 –> 00:28:50,549
این مقاله داده‌ها نامرتب است، در بسیاری از موارد به هم ریخته است.

646
00:28:50,549 –> 00:28:53,190
راه‌های متفاوتی وجود دارد، اما اگر

647
00:28:53,190 –> 00:28:55,100
فرآیند

648
00:28:55,100 –> 00:28:57,299
تمیز کردن یا مرتب کردن مجموعه‌های

649
00:28:57,299 –> 00:29:03,539
داده‌تان را نیز انجام دهید، احتمالاً

650
00:29:03,539 –> 00:29:05,399
سه مشکل اول را به درستی از سر می‌برید، بنابراین این

651
00:29:05,399 –> 00:29:07,679
چیزی است که در این

652
00:29:07,679 –> 00:29:10,110
آموزش به آن خواهیم پرداخت. سه

653
00:29:10,110 –> 00:29:13,529
چیز همانطور که در این مقاله تعریف شده است و

654
00:29:13,529 –> 00:29:15,000
اگر به خواندن این مقاله پایان دهید

655
00:29:15,000 –> 00:29:16,380
در واقع کار با

656
00:29:16,380 –> 00:29:18,510
مجموعه داده های مشابه را دوست خواهید داشت به جز یکی از آنها،

657
00:29:18,510 –> 00:29:19,590
واقعاً نیازی نیست

658
00:29:19,590 –> 00:29:23,669
تا زمانی که به فصل 4 برسید کل مطلب را بخوانید.

659
00:29:23,669 –> 00:29:27,840
یا در پایان بله، اجازه دهید بخش

660
00:29:27,840 –> 00:29:29,580
4 را دریافت کنم که احتمالاً مانند همه چیزهایی است که باید

661
00:29:29,580 –> 00:29:31,919
بدانید، بقیه واقعاً مختص ما هستند،

662
00:29:31,919 –> 00:29:34,200
اما اگر فقط می خواهید بفهمید که

663
00:29:34,200 –> 00:29:35,580
مانند هی به چه معناست که داده

664
00:29:35,580 –> 00:29:37,799
ها مانند نقل قول-بدون نقل قول خوب هستند، اول

665
00:29:37,799 –> 00:29:39,630
تی بخش 3 واقعاً تمام چیزی است که برای خواندن درست نیاز دارید،

666
00:29:39,630 –> 00:29:43,679
بنابراین ما این

667
00:29:43,679 –> 00:29:49,049
نوت بوک دیگر را داریم به ما اطلاع دهید شروع به

668
00:29:49,049 –> 00:29:51,450
پردازش داده های ما کنید، این یک

669
00:29:51,450 –> 00:29:53,760
نوت بوک جدید است، بنابراین باید کتابخانه های خود را دوباره وارد کنیم،

670
00:29:53,760 –> 00:29:56,549
یکی دیگر از راه هایی که می

671
00:29:56,549 –> 00:30:00,690
توانید کتابخانه ها را وارد کنید استفاده از این است. به عنوان

672
00:30:00,690 –> 00:30:03,149
دستور بنابراین ما می‌توانیم بگوییم

673
00:30:03,149 –> 00:30:05,820
پانداها را به‌عنوان PD وارد کنید و می‌توانید ببینید چه چیزی

674
00:30:05,820 –> 00:30:08,669
به ما اجازه می‌دهد انجام دهیم این است که اکنون می‌توانیم به‌جای

675
00:30:08,669 –> 00:30:11,460
نوشتن PA و das dot چیزی که

676
00:30:11,460 –> 00:30:12,360
اکنون می‌توانیم بگوییم P dot

677
00:30:12,360 –> 00:30:14,039
بنابراین این فقط راهی است که به آن می‌گویند

678
00:30:14,039 –> 00:30:17,370
نام مستعار و این فقط به شما کمک می کند

679
00:30:17,370 –> 00:30:18,809
تایپ خود را ساده کنید تا مجبور نباشید آنقدر تایپ کنید،

680
00:30:18,809 –> 00:30:21,269
بنابراین اولین مجموعه داده

681
00:30:21,269 –> 00:30:23,159
از مرکز تحقیقات Pew می آید و

682
00:30:23,159 –> 00:30:25,500
اکنون از PD dot دلیل CSV به جای

683
00:30:25,500 –> 00:30:29,460
پانداها که CSV را نمی خوانند برای بارگذاری اولین ما استفاده می کند.

684
00:30:29,460 –> 00:30:32,549
مجموعه داده‌ها، بنابراین در این مثال، اگر به

685
00:30:32,549 –> 00:30:35,669
ساختار پوشه‌ام نگاه کنیم، من چیزهایم را

686
00:30:35,669 –> 00:30:38,279
در این پوشه‌ها در پوشه نوت‌بوک‌ها دارم، اما

687
00:30:38,279 –> 00:30:40,799
مجموعه داده‌ها واقعاً از این نوت‌بوک

688
00:30:40,799 –> 00:30:43,860
است، یک پوشه بالا و پایین در یک

689
00:30:43,860 –> 00:30:45,330
پوشه داده است و سپس مجموعه داده‌های من اینجاست.

690
00:30:45,330 –> 00:30:48,000
درست است به جای اینکه فقط تایپ کنید

691
00:30:48,000 –> 00:30:50,399
Gapminder مانند قبل، اکنون

692
00:30:50,399 –> 00:30:52,350
باید دو نقطه بگوییم که می گوید هی برو یک

693
00:30:52,350 –> 00:30:55,740
پوشه به بالا و سپس به پوشه داده پایین برو

694
00:30:55,740 –> 00:30:59,039
و سپس مجموعه داده PUE csv را جستجو کنیم

695
00:30:59,039 –> 00:31:05,639
، بنابراین اگر به سر این

696
00:31:05,639 –> 00:31:07,799
مجموعه داده نگاه کنیم این است ابتدا این

697
00:31:07,799 –> 00:31:09,809
دقیقاً همان مجموعه داده‌ای است که در آن مقاله نشان داده شده است،

698
00:31:09,809 –> 00:31:12,720
اما می‌توانید در اینجا نمونه‌ای

699
00:31:12,720 –> 00:31:15,779
از مجموعه داده‌ای را ببینید که مرتب نیست، اما

700
00:31:15,779 –> 00:31:17,760
واقعاً عالی است از این نظر که شما

701
00:31:17,760 –> 00:31:21,240
چیزی را می‌دانید که در یک گزارش نشان می‌دهید، بنابراین

702
00:31:21,240 –> 00:31:23,010
برای یک دین خاص و دوباره یک

703
00:31:23,010 –> 00:31:24,360
براکت درآمد بدهید، فکر می‌کنم این مانند

704
00:31:24,360 –> 00:31:29,220
تعداد افراد است و بنابراین اگر

705
00:31:29,220 –> 00:31:32,010
به این مقاله برگردیم،

706
00:31:32,010 –> 00:31:34,559
مشکل چیست که سه مشکلی که سر

707
00:31:34,559 –> 00:31:37,860
ستون‌ها را پوشش می‌دهیم، مقادیر هستند

708
00:31:37,860 –> 00:31:39,690
و نه نام متغیرها، به چه

709
00:31:39,690 –> 00:31:42,539
معناست. اگر به ستون‌های ما نگاه کنید،

710
00:31:42,539 –> 00:31:44,460
می‌بینید که ما دسته‌ای از ستون‌ها داریم

711
00:31:44,460 –> 00:31:45,889
که در واقع براکت‌های درآمدی هستند

712
00:31:45,889 –> 00:31:49,279
و واقعاً باید در یک ستون باشد

713
00:31:49,279 –> 00:31:52,080
که به آن درآمد می‌گویند و سپس در

714
00:31:52,080 –> 00:31:52,980
سمت راست احتمالاً

715
00:31:52,980 –> 00:31:56,039
باید مانند یک ستون شمارش داشته باشیم. فقط برای

716
00:31:56,039 –> 00:31:57,750
یک گرم با وجود دین و براکت درآمد

717
00:31:57,750 –> 00:32:05,580
، شمارش درست است، بنابراین چگونه

718
00:32:05,580 –> 00:32:09,059
می‌توانیم این نوع مشکل را برطرف کنیم، اگر مقاله را می‌خوانید که به نوعی مبهم است،

719
00:32:09,059 –> 00:32:11,010
این مفهوم مانند داده‌های طولانی و داده‌های گسترده وجود دارد،

720
00:32:11,010 –> 00:32:13,380

721
00:32:13,380 –> 00:32:15,120
اما من هنوز باید

722
00:32:15,120 –> 00:32:16,230
از آن استفاده کنم زیرا اینگونه است افراد پایگاه داده

723
00:32:16,230 –> 00:32:18,210
همچنین در مورد چیزهایی صحبت می کنند، بنابراین شما می

724
00:32:18,210 –> 00:32:19,980
توانید داده های طولانی را مانند ردیف های بسیار بیشتر در نظر

725
00:32:19,980 –> 00:32:22,860
بگیرید، زیرا طولانی است در مقابل داده Y

726
00:32:22,860 –> 00:32:25,289
که فقط یک دسته از ستون ها درست است، بنابراین در

727
00:32:25,289 –> 00:32:26,460
این مورد این نمونه

728
00:32:26,460 –> 00:32:28,320
ای از داده های گسترده است زیرا ما یک دسته از داده ها داریم.

729
00:32:28,320 –> 00:32:31,710
ستون‌هایی که ما واقعاً می‌خواهیم به

730
00:32:31,710 –> 00:32:35,399
فرمت طولانی تبدیل شوند، بنابراین امیدوارم

731
00:32:35,399 –> 00:32:37,049
اگر کد را به شما نشان دهم و آن را اجرا کنم، کمی منطقی‌تر خواهد بود

732
00:32:37,049 –> 00:32:39,600
، بنابراین اگر از

733
00:32:39,600 –> 00:32:41,700
داده‌های Y مانند داده‌های Y به داده‌های طولانی می‌رویم و به

734
00:32:41,700 –> 00:32:42,840
همین دلیل است که تابع به این شکل نامگذاری شده

735
00:32:42,840 –> 00:32:45,240
است. می توانید به این فکر کنید که اگر

736
00:32:45,240 –> 00:32:47,039
یک شمشیر دارید و می خواهید شمشیر را ذوب کنید،

737
00:32:47,039 –> 00:32:47,549

738
00:32:47,549 –> 00:32:50,639
شمشیر از طریق پاک کردن طولانی در امتداد می رود، بنابراین

739
00:32:50,639 –> 00:32:53,240
عملکردی که ما استفاده می کنیم ذوب نامیده می شود،

740
00:32:53,240 –> 00:32:56,100
بنابراین پانداها عملکردی به نام ذوب دارند،

741
00:32:56,100 –> 00:32:58,139
زیرا ما از پهن می رویم. به طولانی

742
00:32:58,139 –> 00:33:00,960
و ذوب اگر ما لوس k در امضای تابع،

743
00:33:00,960 –> 00:33:04,019
بنابراین اگر زبانه shift را فشار دهید،

744
00:33:04,019 –> 00:33:06,029
اولین شی که می گیرد یک قاب داده است و

745
00:33:06,029 –> 00:33:08,369
بنابراین قاب داده ای را که می خواهیم ذوب کنیم

746
00:33:08,369 –> 00:33:11,909
pew یا PW نامیده می شود و سپس یک

747
00:33:11,909 –> 00:33:15,470
سری پارامتر دیگر در آنجا وجود دارد، بنابراین

748
00:33:15,470 –> 00:33:17,879
یکی از آن پارامترها نامیده می شود. شناسه

749
00:33:17,879 –> 00:33:23,309
VARها و ID VARها اساساً کاری که

750
00:33:23,309 –> 00:33:24,720
می‌خواهید انجام دهید این است که سعی می‌کنید

751
00:33:24,720 –> 00:33:26,340
دسته‌ای از ستون‌ها را بردارید و آنها را

752
00:33:26,340 –> 00:33:29,100
به یک ستون در سمت راست تبدیل کنید، بنابراین

753
00:33:29,100 –> 00:33:31,139
از سفید به طولانی تبدیل می‌شوید، و ID var اساساً این است

754
00:33:31,139 –> 00:33:32,909
که می‌گوید هی چه چیزی چیست؟

755
00:33:32,909 –> 00:33:34,559
ستون یا ستون هایی هستند که نمی

756
00:33:34,559 –> 00:33:36,869
خواهید درست آنها را لمس کنید و در این

757
00:33:36,869 –> 00:33:38,850
مثال، ما نمی خواهیم

758
00:33:38,850 –> 00:33:40,769
ستون دین را به حال خود رها کنیم، در واقع می خواهیم

759
00:33:40,769 –> 00:33:46,049
همه ستون های دیگر را ذوب

760
00:33:46,049 –> 00:33:47,700
کنیم تا بتوانیم چیزی شبیه به ID VAR ها بگوییم. به‌عنوان

761
00:33:47,700 –> 00:33:49,200
دین به معنای ستونی است

762
00:33:49,200 –> 00:33:53,940
که نمی‌خواهیم تغییر کند، بنابراین اجازه دهید

763
00:33:53,940 –> 00:33:58,019
آن را در متغیری به نام pew long ذخیره کنم و

764
00:33:58,019 –> 00:34:01,259
اگر اکنون به آن نگاه کنیم – همه آن

765
00:34:01,259 –> 00:34:03,360
ستون‌هایی که توسط ID VAR مشخص نشده‌اند،

766
00:34:03,360 –> 00:34:06,749
بنابراین دین و ما آنها

767
00:34:06,749 –> 00:34:09,389
را به طور پیش فرض تبدیل کرده یا آنها را طولانی به یک ستون تبدیل کرده است

768
00:34:09,389 –> 00:34:12,510
به آن مقدار نهایی متغیر

769
00:34:12,510 –> 00:34:15,899
می گویند، بنابراین اگر من از head استفاده نکنم، امیدوارم این

770
00:34:15,899 –> 00:34:18,418
نشان دهد که می توانید ببینید برای یک مذهب خاص،

771
00:34:18,418 –> 00:34:20,399
ما یک دسته درآمد داریم و سپس مانند

772
00:34:20,399 –> 00:34:22,770
حساب درست و این نسخه مرتب

773
00:34:22,770 –> 00:34:25,429
از مجموعه داده درست است که

774
00:34:25,429 –> 00:34:28,589
هر کدام داریم. ستون یک متغیر است بنابراین مذهب در

775
00:34:28,589 –> 00:34:30,899
این مورد مقدار متغیر و مقدار هر

776
00:34:30,899 –> 00:34:34,309
ردیف اکنون یک مشاهده است

777
00:34:37,360 –> 00:34:46,210
سگان آه شاخص D&C ما منحصر به فرد است

778
00:34:46,210 –> 00:34:51,850
من معتقدم که شاخص ها منحصر به فرد هستند من

779
00:34:51,850 –> 00:34:53,980
هرگز نباید در موقعیتی قرار

780
00:34:53,980 –> 00:34:56,139
بگیرم که مثل زمانی که با شاخص ها بازی می کردم

781
00:34:56,139 –> 00:34:58,930
من این کار را انجام می‌دهم بنابراین

782
00:34:58,930 –> 00:35:02,860
پاسخ واقعی سؤال شما را نمی‌دانم، اما

783
00:35:02,860 –> 00:35:08,320
منتظر بمانید تا ببینم ممکن است همه چیز درست باشد،

784
00:35:08,320 –> 00:35:12,100
بنابراین مانند شاخص تنظیم مجدد وجود ندارد، بله

785
00:35:12,100 –> 00:35:13,270
، نمی‌دانم ممکن است با آن بازی کنم.

786
00:35:13,270 –> 00:35:19,930
پس از آن خیلی خوب است، بنابراین اگر

787
00:35:19,930 –> 00:35:21,580
به هر چیزی نگاه کنیم که شما

788
00:35:21,580 –> 00:35:23,560
یک ID مشخص نکرده اید، VAR ها به

789
00:35:23,560 –> 00:35:27,790
پارامتر دیگری به نام نوارهای ارزش وارد می

790
00:35:27,790 –> 00:35:30,430
شوند، بنابراین این تابع واقعاً دو چیز

791
00:35:30,430 –> 00:35:33,250
میله شناسه و نوار مقدار و هر آنچه را که

792
00:35:33,250 –> 00:35:35,020
در نوارهای مقدار مشخص می کنید، می گیرد. اگر شما هدایت ID

793
00:35:35,020 –> 00:35:37,540
نوارهایی که به تنهایی در آن قرار دارند و

794
00:35:37,540 –> 00:35:38,980
بالعکس بسیار خوب است، بنابراین شما هیچ

795
00:35:38,980 –> 00:35:40,660
چیز ساده‌تر یا کوتاه‌تری برای تایپ نداشته

796
00:35:40,660 –> 00:35:43,300
باشید، این همان چیزی است که استفاده می‌کنید، همچنین می‌توانید

797
00:35:43,300 –> 00:35:44,740
از هر دوی آن‌ها استفاده کنید، اگر می‌خواهید

798
00:35:44,740 –> 00:35:47,680
ستون‌های زیر مجموعه را همزمان تنظیم کنید. زمان اما

799
00:35:47,680 –> 00:35:50,380
دو پارامتر دیگر در اینجا

800
00:35:50,380 –> 00:35:52,180
نام var و نام مقدار به این صورت است که ما

801
00:35:52,180 –> 00:35:55,150
متغیر مقدار پیش‌فرض و ستون‌های مقدار را

802
00:35:55,150 –> 00:35:59,200
درست تغییر می‌دهیم، بنابراین اگر

803
00:35:59,200 –> 00:36:02,560
همان قطعه کد را برداریم و بگوییم نام var

804
00:36:02,560 –> 00:36:10,600
اکنون درآمد است، می‌توانیم بگوییم مقدار نام

805
00:36:10,600 –> 00:36:16,510
نیز اگر به مجموعه داده‌های خود نگاه کنیم، در

806
00:36:16,510 –> 00:36:19,680
واقع نام برخی از

807
00:36:19,680 –> 00:36:27,820
متغیرهای معقول را برای ما به حساب نمی‌آوریم، بنابراین بله،

808
00:36:27,820 –> 00:36:29,170
بنابراین اگر زمانی در این

809
00:36:29,170 –> 00:36:30,220
موقعیت قرار گرفتید، زمانی که یک دسته

810
00:36:30,220 –> 00:36:31,480
ستون در آنجا دارید، مانند hey، آنها به

811
00:36:31,480 –> 00:36:33,850
وضوح شبیه متغیرها هستند. من می‌خواهم

812
00:36:33,850 –> 00:36:35,830
مدلی را وارد کنم که تنها کاری که باید انجام دهید

813
00:36:35,830 –> 00:36:40,270
این است که مجموعه داده‌های خود را در حالت ذوب قرار دهید

814
00:36:40,270 –> 00:36:42,280
، ستون‌هایی را که می‌خواهیم ثابت کنیم یا ستون‌هایی را

815
00:36:42,280 –> 00:36:44,080
که می‌خواهیم ذوب شوند، مشخص کنند و سپس

816
00:36:44,080 –> 00:36:47,110
مجموعه داده‌های مرتب خود را درست داشته باشید، بنابراین اکنون می‌توانید کاری انجام دهید

817
00:36:47,110 –> 00:36:48,580
که به نوعی مانند یک

818
00:36:48,580 –> 00:36:49,300
دین خاص

819
00:36:49,300 –> 00:36:54,340
مانند پیش‌بینی تعداد یا چیزی

820
00:36:54,340 –> 00:36:55,870
شبیه به یک مدل وحشتناک است

821
00:36:55,870 –> 00:36:57,400
که می‌خواهید با آن مطابقت کنید، اما این چیزی است

822
00:36:57,400 –> 00:36:59,230
که می‌توانید به خوبی انجام دهید، بنابراین

823
00:36:59,230 –> 00:37:02,320
اگر بخواهیم با ستون‌های بیشتری کار کنیم چه اتفاقی می‌افتد تا

824
00:37:02,320 –> 00:37:04,270
مجموعه داده دیگری

825
00:37:04,270 –> 00:37:12,550
در مجموعه داده‌ها وجود داشته باشد. مجموعه داده

826
00:37:12,550 –> 00:37:17,530
ای است به نام بیلبورد نقطه CSV و این ما

827
00:37:17,530 –> 00:37:19,240
واقعاً همان مشکل را داریم، فقط

828
00:37:19,240 –> 00:37:20,680
ستون های بسیار بیشتری داریم، بنابراین

829
00:37:20,680 –> 00:37:23,320
بیایید به هر ردیفی نگاه کنیم که

830
00:37:23,320 –> 00:37:26,320
یک سال زمان آهنگ هنرمند وارد می شود، بنابراین

831
00:37:26,320 –> 00:37:29,140
اینها همه آهنگ های سال 2000 هستند و سپس

832
00:37:29,140 –> 00:37:31,450
ما رتبه‌بندی بیلبورد آن را

833
00:37:31,450 –> 00:37:33,160
مانند هفته اول داریم، فکر می‌کنم همه چیز مشخص

834
00:37:33,160 –> 00:37:36,460
است – مانند هفته 72 و بنابراین این همان

835
00:37:36,460 –> 00:37:38,350
مشکلی است که قبلاً داریم، بنابراین آنچه

836
00:37:38,350 –> 00:37:39,790
واقعاً می‌خواهیم مانند ستونی به نام

837
00:37:39,790 –> 00:37:42,040
شماره هفته است که شبیه هفته است.

838
00:37:42,040 –> 00:37:43,780
یکی تا 72 و سپس

839
00:37:43,780 –> 00:37:46,510
رتبه واقعی درست است، بنابراین می‌توانید کاری را

840
00:37:46,510 –> 00:37:48,820
انجام دهید که می‌دانید برای یک هفته معین

841
00:37:48,820 –> 00:37:51,880
پیش‌بینی کنید مانند مقدار واقعی یا

842
00:37:51,880 –> 00:37:56,410
چیزی، بنابراین این همان مشکلی

843
00:37:56,410 –> 00:37:57,490
است که قبل از داشتن یک دسته

844
00:37:57,490 –> 00:38:01,090
ستون t با آن روبرو هستیم. کلاه به جای متغیرها مقادیر

845
00:38:01,090 –> 00:38:02,740
درستی هستند، بنابراین اگر به مقاله برگردید،

846
00:38:02,740 –> 00:38:04,420
ما هنوز در این ستون هستیم، سرصفحه‌ها

847
00:38:04,420 –> 00:38:05,980
یا مقادیر، مشکل نام متغیرها نیست،

848
00:38:05,980 –> 00:38:08,140
این فقط یک نسخه بزرگتر از آن

849
00:38:08,140 –> 00:38:12,610
مشکل است، بنابراین چگونه این را ذوب کنیم تا

850
00:38:12,610 –> 00:38:17,040
از همان استفاده کنیم. عملکرد ذوب

851
00:38:19,020 –> 00:38:23,890
لب های راست ذوب می شود من فقط

852
00:38:23,890 –> 00:38:26,170
با شکستن خط خود بسیار سخاوتمند خواهم بود تا

853
00:38:26,170 –> 00:38:28,690
از صفحه خارج نشود بنابراین

854
00:38:28,690 –> 00:38:30,310
کد دقیقاً مانند قبل است درست است

855
00:38:30,310 –> 00:38:31,870
بنابراین اگر بخواهیم مجموعه داده را ذوب کنیم

856
00:38:31,870 –> 00:38:33,370
اولین چیزی که می گویید این است مثلاً

857
00:38:33,370 –> 00:38:35,680
هی دیشی که می‌خواهید ذوب شود چیست، بنابراین

858
00:38:35,680 –> 00:38:37,090
اولین پارامتر مجموعه داده‌ها خواهد بود

859
00:38:37,090 –> 00:38:39,850
و سپس قبل از اینکه

860
00:38:39,850 –> 00:38:43,720
ID’d ما را مشخص کردیم، فقط در دین قرار دادیم، اما در

861
00:38:43,720 –> 00:38:50,830
این مورد واقعاً می‌خواهیم نگه داریم،

862
00:38:50,830 –> 00:38:52,540
واقعاً می‌خواهیم سال نگه دارید

863
00:38:52,540 –> 00:38:54,430
تاریخ آهنگ هنرمندان وارد شده مانند

864
00:38:54,430 –> 00:38:55,420
دو ستون دیگر که نمی‌خواهیم

865
00:38:55,420 –> 00:38:58,960
تغییر دهیم و کارهای دیگری که انجام می‌دهیم، بنابراین

866
00:38:58,960 –> 00:39:03,750
اینجا می‌توانیم فقط در اینجا

867
00:39:03,750 –> 00:39:13,990
قرار دهیم تاریخ آهنگ هنرمندان کاملاً وارد شده است، بنابراین

868
00:39:13,990 –> 00:39:15,520
این ستون‌هایی هستند که ما انجام نمی‌دهیم. نمی خواهم

869
00:39:15,520 –> 00:39:17,740
و بعد همه بقیه که هفته

870
00:39:17,740 –> 00:39:20,080
1 تا 72 است، آن ها ستون هایی هستند که

871
00:39:20,080 –> 00:39:22,510
قرار است ذوب شوند، بنابراین

872
00:39:22,510 –> 00:39:24,850
نیازی نیست پارامتر VARs مقدار را

873
00:39:24,850 –> 00:39:27,400
در این مورد قرار دهیم و سپس فقط برای گرد

874
00:39:27,400 –> 00:39:29,080
کردن مثال، اجازه دهید وقتی این کار را انجام داد،

875
00:39:29,080 –> 00:39:33,190
اجازه دهید مانند ایجاد کنیم. نام‌های معقول برای

876
00:39:33,190 –> 00:39:35,260
این چیزها، بنابراین ما

877
00:39:35,260 –> 00:39:37,420
ستون‌ها را صدا می‌زنیم که نام ستون‌ها اکنون

878
00:39:37,420 –> 00:39:40,060
در یک ستون به نام هفته قرار می‌گیرند و سپس

879
00:39:40,060 –> 00:39:47,260
نام ارزش را همین حالا آن رتبه‌بندی می‌خوانیم،

880
00:39:47,260 –> 00:39:50,290
بنابراین اگر به مجموعه داده‌های ما

881
00:39:50,290 –> 00:39:52,330
نگاه کنید، آهنگ هنرمندان شما را دریافت می‌کنیم. تاریخ زمانی وارد شده

882
00:39:52,330 –> 00:39:54,550
برای یک هفته معین امتیاز آن آهنگ چقدر است

883
00:39:54,550 –> 00:39:57,840
درست

884
00:40:02,880 –> 00:40:05,260
چرا ممکن است بخواهید دوباره کاری شبیه به

885
00:40:05,260 –> 00:40:07,240
این را انجام دهید، می توانید این کار را برای اهداف مدل سازی

886
00:40:07,240 –> 00:40:08,890
انجام دهید این در واقع تعریف

887
00:40:08,890 –> 00:40:12,520
داده های ID پسندیده است اگر با

888
00:40:12,520 –> 00:40:15,400
پایگاه های داده کار می کنید پایگاه داده داده و فرمت طولانی را ترجیح می دهید

889
00:40:15,400 –> 00:40:18,400
بنابراین قبل از اینکه چیزی را در

890
00:40:18,400 –> 00:40:19,930
یک پایگاه داده رها کنید، احتمالاً در نهایت

891
00:40:19,930 –> 00:40:20,980
کاری شبیه به این را انجام خواهید داد،

892
00:40:20,980 –> 00:40:23,080
من این مثال را داشتم که در آن

893
00:40:23,080 –> 00:40:27,220
مجموعه داده‌ای مانند این مجموعه داده 1000 در 1000 ردیف داشتیم و

894
00:40:27,220 –> 00:40:28,869
سعی می‌کنیم آن را در Postgres بیاندازیم و

895
00:40:28,869 –> 00:40:30,160
واقعاً این واقعیت را دوست نداشت. در زمانی که ما

896
00:40:30,160 –> 00:40:32,170
سعی می‌کردیم در یک مجموعه داده یا یک جدول قرار دهیم،

897
00:40:32,170 –> 00:40:33,940
من هزار ردیف و هزار ستون

898
00:40:33,940 –> 00:40:36,220
داشتم و بنابراین کاری که باید انجام می‌دادم این بود که در

899
00:40:36,220 –> 00:40:40,180
واقع این

900
00:40:40,180 –> 00:40:42,580
شیء را به چندین شیء هزار ردیفی با دو

901
00:40:42,580 –> 00:40:44,440
ستون تبدیل کنم و سپس و سپس

902
00:40:44,440 –> 00:40:48,790
درست است، بنابراین چیزهای مختلف به اشکال مختلف نیاز دارند

903
00:40:48,790 –> 00:40:50,290
، اما شما همچنین به پایگاه داده‌ها فکر می‌کنید،

904
00:40:50,290 –> 00:40:52,690
این نیز برای قالب‌بندی

905
00:40:52,690 –> 00:40:59,740
پایگاه‌های اطلاعاتی است که ترجیح می‌دهند کارها را به خوبی انجام دهند،

906
00:40:59,740 –> 00:41:05,920
بنابراین شکل را به خاطر بسپارید، بنابراین

907
00:41:05,920 –> 00:41:08,200
شکل بیلبورد این مجموعه داده بیلبورد واقعاً در

908
00:41:08,200 –> 00:41:14,490
ابتدا 317 ردیف و 81 ستون داشت

909
00:41:16,920 –> 00:41:26,410
که من تماس می‌گیرم. این یادداشت را ببینید بله بله، بنابراین

910
00:41:26,410 –> 00:41:29,020
من فقط همان چیزی را که گفتم صحبت می کنم، بنابراین

911
00:41:29,020 –> 00:41:31,030
اگر به دو شکل دو

912
00:41:31,030 –> 00:41:34,780
مجموعه داده نگاه کنید، متوجه خواهید شد که ردیف های یکی از دیگری

913
00:41:34,780 –> 00:41:38,320
بسیار بیشتر از دیگری است، درست گاهی اوقات

914
00:41:38,320 –> 00:41:40,210
این اتفاقی می افتد که شما

915
00:41:40,210 –> 00:41:41,650
سعی می‌کنم داده‌ها را مرتب کنم،

916
00:41:41,650 –> 00:41:42,940
مثل اوه، قبلاً فقط صد

917
00:41:42,940 –> 00:41:45,099
ردیف داشتم، من یک میلیون حلقه

918
00:41:45,099 –> 00:41:47,349
دارم، این تعداد سلول واقعاً یکسان است، اما یکی از آنها

919
00:41:47,349 –> 00:41:49,510
قطعاً از نظر

920
00:41:49,510 –> 00:41:51,609
قالب برای ذخیره‌سازی داده‌ها و فقط

921
00:41:51,609 –> 00:42:01,000
مدل‌سازی مطلوب‌تر است. به طور کلی خیلی خوب است،

922
00:42:01,000 –> 00:42:04,810
پس بیایید برویم، بنابراین معمولاً PD است

923
00:42:04,810 –> 00:42:06,010
که ذوب می شود، این همان کاری است که وقتی

924
00:42:06,010 –> 00:42:07,450
اولین مشکل را دارید انجام می دهید، مثلاً من

925
00:42:07,450 –> 00:42:08,650
یک دسته ستون دارم، فقط می خواهم

926
00:42:08,650 –> 00:42:11,380
آن را ذوب کنم، چه اتفاقی می افتد اگر

927
00:42:11,380 –> 00:42:13,869
چند

پاسخ دهید لغو پاسخ

اکانت vip

دوره آموزش پایتون

مطالب تصادفی

فیلم آموزشی: نحوه اشکال زدایی پایتون با VSCode با زیرنویس فارسی

فیلم آموزشی: با پایتون و تنسورفلو یک طبقه‌بندی کننده صوتی عمیق بسازید

فیلم آموزشی: نظرات – برنامه نویسی پایتون با زیرنویس فارسی

فیلم آموزشی: تجسم داده ها در پایتون، [ نمودار دو متغیر] آمار و تجزیه و تحلیل داده ها با پایتون🐍 با زیرنویس فارسی

فیلم آموزشی: Interactive Brokers API Python Library | پس زمینه و راه اندازی Pt. 2 با زیرنویس فارسی

فیلم آموزشی: Python 3.8 و Django 3+ را در macOS نصب کنید – 5 از 9 – نصب Django 3.0 + با زیرنویس فارسی

فیلم آموزشی: با پایتون چه کاری می توانید انجام دهید (3 چیز برتر و رازهای فریلنسینگ) با زیرنویس فارسی

فیلم آموزشی: آموزش پایتون از طریق پردازش داده در پانداها | SciPy 2020 | دانیل چن با زیرنویس فارسی

فیلم آموزشی: lonely Integer Hackerrank |عملیات بیتی |برنامه نویسی رقابتی| عملیات XOR در پایتون

فیلم آموزشی: حل یک برنامه عدد صحیح ساده با استفاده از Gurobi Python API

فیلم آموزشی: برنامه نویسی پیشرفته پایتون| ایجاد الگوی طراحی کارخانه شماره 6

فیلم آموزشی: خودکارسازی نیروی کار برای ArcGIS با پایتون با زیرنویس فارسی

فیلم آموزشی: نحوه استفاده از ویجت پیام برای بلوک های متن – آموزش رابط کاربری گرافیکی Python Tkinter #165 با زیرنویس فارسی

فیلم آموزشی: آموزش پایتون: برجسته کردن داده ها با زیرنویس فارسی

فیلم آموزشی: رمزگذاری ساده سزار در پایتون با زیرنویس فارسی

فیلم آموزشی: درختان باینری در پایتون: پیمایش مرتبه سطح با زیرنویس فارسی

پشتیبانی سایت

نماد اعتماد اینماد و زیبال

فیلم آموزشی: دانیل چن: تمیز کردن و مرتب کردن داده ها در پانداها | PyData DC 2018 با زیرنویس فارسی

برای دانلود این فیلم ، عضو vip سایت شوید.

دانلود 17000 فیلم پایتون با پرداخت 15 هزار تومان (عضویت یک ماهه)

مطالب مرتبط: