در این مطلب، ویدئو یک پروژه پایتون که داده های csv یا اکسل را به json |Datascience |Numpy|pandas|PythonLibraries تبدیل می کند. با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:18:45
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:09,599
[موسیقی]
2
00:00:09,599 –> 00:00:12,080
سلام بچه ها به این ویدیو خوش آمدید، خوب،
3
00:00:12,080 –> 00:00:13,599
بنابراین در این ویدیو آنچه قرار است اتفاق بیفتد
4
00:00:13,599 –> 00:00:17,119
این است که ما می خواهیم این داده های csv را
5
00:00:17,119 –> 00:00:20,640
به نوع داده a.json تبدیل کنیم، خوب، بنابراین چه زمانی
6
00:00:20,640 –> 00:00:22,880
برای انجام این کار مبارزه می کنیم و اوم فقط
7
00:00:22,880 –> 00:00:24,640
می خواستم شما متوجه شوید
8
00:00:24,640 –> 00:00:27,439
قبل از اینکه ادامه دهیم این داده ها چه چیزی را شامل می شوند، بنابراین
9
00:00:27,439 –> 00:00:29,599
این یک رتبه جهانی دانشگاه است،
10
00:00:29,599 –> 00:00:32,159
خوب من فکر می کنم جهانی است، بنابراین رتبه
11
00:00:32,159 –> 00:00:33,920
جهانی دانشگاه ها، بنابراین ما نام
12
00:00:33,920 –> 00:00:35,680
رتبه دانشگاه را داریم که نام آن
13
00:00:35,680 –> 00:00:38,480
کشور است، بنابراین ما همه این
14
00:00:38,480 –> 00:00:40,239
اطلاعات دیگر را در مورد آن داریم. هر یک از
15
00:00:40,239 –> 00:00:41,680
دانشگاه های
16
00:00:41,680 –> 00:00:43,760
ام بسیار خوب، بنابراین ما سعی می کنیم
17
00:00:43,760 –> 00:00:45,520
همه آنها را
18
00:00:45,520 –> 00:00:46,480
19
00:00:46,480 –> 00:00:48,000
با فرمت um json um قرار دهیم، بله خوب است،
20
00:00:48,000 –> 00:00:48,879
21
00:00:48,879 –> 00:00:50,879
پس بیایید ادامه دهیم،
22
00:00:50,879 –> 00:00:52,960
من ایده خود را باز می کنم،
23
00:00:52,960 –> 00:00:54,960
اگر دنبال می کنید اگر ویدیوهای من را دنبال کنید، از spider anaconda استفاده می کنم. شما
24
00:00:54,960 –> 00:00:56,239
ویدیوهای من
25
00:00:56,239 –> 00:00:58,239
را به خوبی دنبال نکرده اید، زمان خوبی برای دنبال کردن ویدیوهای من است
26
00:00:58,239 –> 00:01:01,840
و من چیزهای زیادی در مورد پایتون آموزش می دهم
27
00:01:01,840 –> 00:01:03,039
و امیدوارم بتوانم دانش شما را تحت تأثیر قرار
28
00:01:03,039 –> 00:01:06,240
دهم، بنابراین بیایید
29
00:01:06,240 –> 00:01:09,360
ببینیم که ابتدا از ام پانداها برای
30
00:01:09,360 –> 00:01:12,000
خواندن استفاده می کنیم. اکسل ما خوبه این یک csv است
31
00:01:12,000 –> 00:01:14,400
که از پانداها برای خواندن دادههای csv خود استفاده
32
00:01:14,400 –> 00:01:16,240
میکنیم و پس از خواندن دادههای CSV،
33
00:01:16,240 –> 00:01:18,640
آنها را دستکاری میکنیم تا این
34
00:01:18,640 –> 00:01:19,759
مقادیر
35
00:01:19,759 –> 00:01:21,840
36
00:01:21,840 –> 00:01:23,360
خالی
37
00:01:23,360 –> 00:01:25,360
را حذف کنیم، اگر مقادیر خالی وجود داشته باشد، آنها را حذف میکنیم و بعد از
38
00:01:25,360 –> 00:01:27,439
آن ما میتوانیم کاری را که باید انجام دهیم شروع
39
00:01:27,439 –> 00:01:28,720
کنیم، بنابراین من
40
00:01:28,720 –> 00:01:30,159
آن را میبندم تا دسترسی درستی به آن داشته باشیم، بسیار
41
00:01:30,159 –> 00:01:33,600
خوب، من آن را در اینجا میبندم
42
00:01:33,600 –> 00:01:35,439
و اول از همه میخواهم آن را کپی کنم
43
00:01:35,439 –> 00:01:37,600
مسیر فایل این دادهها را
44
00:01:37,600 –> 00:01:38,880
فشار
45
00:01:38,880 –> 00:01:41,119
میدهم و روی آن کلیک راست میکنم.
46
00:01:41,119 –> 00:01:43,759
47
00:01:43,759 –> 00:01:44,880
48
00:01:44,880 –> 00:01:48,240
49
00:01:48,240 –> 00:01:49,600
50
00:01:49,600 –> 00:01:51,680
فلش را بگویید و آن را
51
00:01:51,680 –> 00:01:52,720
در اینجا
52
00:01:52,720 –> 00:01:55,040
بچسبانید بسیار خوب، بنابراین این r بسیار مهم است که
53
00:01:55,040 –> 00:01:56,960
آن را نادیده بگیرید و به مفسر می گوید
54
00:01:56,960 –> 00:01:58,560
که این فقط یک
55
00:01:58,560 –> 00:02:01,119
رشته نیست، بلکه یک مسیر فایل است،
56
00:02:01,119 –> 00:02:03,920
بنابراین بیایید ادامه دهیم،
57
00:02:03,920 –> 00:02:05,600
خوب است، ترجیح می دهم تمام واردات خود را
58
00:02:05,600 –> 00:02:07,360
در بالا انجام دهم. بیشتر قسمت اسکریپت، بنابراین من
59
00:02:07,360 –> 00:02:10,479
پانداها را وارد می کنم
60
00:02:11,280 –> 00:02:13,520
و این به صورت pd
61
00:02:13,520 –> 00:02:14,720
معمولاً
62
00:02:14,720 –> 00:02:16,319
مشکلی ندارد، بنابراین
63
00:02:16,319 –> 00:02:18,319
اکنون ادامه می دهیم، بنابراین اکنون بیایید سعی کنیم اطلاعات خود را
64
00:02:18,319 –> 00:02:19,680
بخوانیم a بنابراین میخواهم بگویم دادهها
65
00:02:19,680 –> 00:02:20,840
برابر است با
66
00:02:20,840 –> 00:02:24,080
um pd dot read
67
00:02:24,080 –> 00:02:26,879
بنابراین یک csv است، بنابراین من میخواهم بگویم pd.csv
68
00:02:26,879 –> 00:02:28,640
و میخواهم بگویم از این مسیر داده بخوان،
69
00:02:28,640 –> 00:02:30,400
خوب
70
00:02:30,400 –> 00:02:31,920
حالا میتوانیم آن را چاپ کنیم تا ببینیم داده ها
71
00:02:31,920 –> 00:02:33,840
اما مطمئن هستم که
72
00:02:33,840 –> 00:02:37,040
اشکالی ندارد، بیایید فقط آن را چاپ کنیم
73
00:02:37,040 –> 00:02:40,720
تا بدانیم در مسیری
74
00:02:42,959 –> 00:02:44,640
هستیم که بسیار طولانی است، بنابراین مطمئن هستم که
75
00:02:44,640 –> 00:02:46,560
آنها را خلاصه می کند،
76
00:02:46,560 –> 00:02:48,319
خوب است، آنها را در اینجا خلاصه کرده است،
77
00:02:48,319 –> 00:02:49,760
می توانید ببینید که
78
00:02:49,760 –> 00:02:52,239
79
00:02:53,280 –> 00:02:56,160
من فکر می کنم بدون خوب،
80
00:02:56,160 –> 00:02:58,080
بیایید این را اجرا کنیم و ببینیم،
81
00:02:58,080 –> 00:02:59,680
اما خوب توصیف کنیم، بنابراین خلاصهای
82
00:02:59,680 –> 00:03:02,560
از دادههای ما در اینجا وجود دارد، بسیار خوب، پس حالا بیایید
83
00:03:02,560 –> 00:03:04,640
اکنون ادامه دهیم که دیدیم
84
00:03:04,640 –> 00:03:06,159
اتصال ما برقرار است و میتوانیم از روی
85
00:03:06,159 –> 00:03:07,360
آن بخوانیم، فقط چاپ را حذف میکنیم.
86
00:03:07,360 –> 00:03:08,720
تابع
87
00:03:08,720 –> 00:03:10,080
و اکنون کاری که ما می خواهیم انجام دهیم این
88
00:03:10,080 –> 00:03:12,319
است که هر نوع داده را می گیریم بنابراین بسیار خوب من
89
00:03:12,319 –> 00:03:13,680
هنوز هم می خواهم چیزی را ببینم که می خواهم
90
00:03:13,680 –> 00:03:17,200
همه ستون ها را ببینم بنابراین data.columns
91
00:03:17,200 –> 00:03:18,720
um من می خواهم همه ستون ها را ببینم تا
92
00:03:18,720 –> 00:03:21,519
من میتوانم آنها را خوب صدا بزنم، بنابراین من میخواهم
93
00:03:21,519 –> 00:03:25,440
um ستونها
94
00:03:25,440 –> 00:03:27,120
95
00:03:27,120 –> 00:03:29,440
96
00:03:29,440 –> 00:03:31,599
را اجرا کنم. این ستونها در اینجا
97
00:03:31,599 –> 00:03:34,000
بسیار خوب است، پس حالا بیایید با صدا زدن
98
00:03:34,000 –> 00:03:36,159
ستونها یکی یکی شروع
99
00:03:36,159 –> 00:03:38,400
کنیم، مترجم من برای پاسخ دادن زمان میبرد.
100
00:03:38,400 –> 00:03:39,599
نادیده گرفتن آن
101
00:03:39,599 –> 00:03:41,200
خوب است، بنابراین من میخواهم با گفتن
102
00:03:41,200 –> 00:03:43,840
رتبه خوب
103
00:03:43,840 –> 00:03:46,400
برابر با رتبه جهانی نقطه داده شروع کنم،
104
00:03:46,400 –> 00:03:48,959
105
00:03:50,080 –> 00:03:51,280
اکنون این رتبه جهانی به
106
00:03:51,280 –> 00:03:52,319
این
107
00:03:52,319 –> 00:03:54,239
معنی است که در داخل
108
00:03:54,239 –> 00:03:56,640
فایل داده، به دنبال رتبه جهانی پنهان
109
00:03:56,640 –> 00:03:58,560
یا ستون رتبه جهانی بگردید، خوب
110
00:03:58,560 –> 00:04:00,560
این به این معنی است، بنابراین اگر بتوانم آن را چاپ کنم
111
00:04:00,560 –> 00:04:02,720
و داده ها را ببینم. اما من میخواهم
112
00:04:02,720 –> 00:04:04,159
این چیزها را حفظ کنم، بنابراین نمیخواهم
113
00:04:04,159 –> 00:04:05,280
آنها را از بین
114
00:04:05,280 –> 00:04:07,680
115
00:04:07,680 –> 00:04:10,319
ببرم، خوب، بنابراین نام دانشگاه، بنابراین میتوانم
116
00:04:10,319 –> 00:04:13,439
نام دانشگاه را در اینجا بگویم، زیرا نقطه دادهها
117
00:04:13,439 –> 00:04:16,079
، حدس میزنم الگوی سرمایهگذاری در
118
00:04:16,079 –> 00:04:18,639
دانشگاه را
119
00:04:18,639 –> 00:04:19,839
دیدهام
120
00:04:19,839 –> 00:04:21,918
121
00:04:21,918 –> 00:04:24,639
122
00:04:24,639 –> 00:04:26,560
. کشور کشور بعدی
123
00:04:26,560 –> 00:04:29,280
،
124
00:04:54,160 –> 00:04:55,919
بنابراین اکنون که همه ستون
125
00:04:55,919 –> 00:04:57,440
ها را مشخص کرده
126
00:04:57,440 –> 00:05:00,639
ایم، اکنون می توانیم به ایجاد
127
00:05:00,639 –> 00:05:04,080
um شیء خود ادامه دهیم، بنابراین
128
00:05:04,080 –> 00:05:05,199
نام
129
00:05:05,199 –> 00:05:08,080
ما نمی تواند از آن برای ایجاد چیزی که به آن دیکشنری می گوییم استفاده کنیم
130
00:05:08,080 –> 00:05:08,840
،
131
00:05:08,840 –> 00:05:12,320
بنابراین با ما می خواهم um
132
00:05:12,320 –> 00:05:13,840
ایجاد کنیم. یک دیکشنری خالی خوب است که به
133
00:05:13,840 –> 00:05:16,479
آن محفظه داده می گویند
134
00:05:18,080 –> 00:05:20,639
135
00:05:22,400 –> 00:05:23,840
و ما از براکت های فرفری برای یک
136
00:05:23,840 –> 00:05:26,320
ظرف استفاده می کنیم خوب یا یک فرهنگ لغت
137
00:05:26,320 –> 00:05:27,280
138
00:05:27,280 –> 00:05:29,039
اکنون می خواهم راهی برای بررسی
139
00:05:29,039 –> 00:05:31,199
این عناوین بیابم و سعی می کنم
140
00:05:31,199 –> 00:05:32,400
اوه
141
00:05:32,400 –> 00:05:34,240
من می روم برای امتحان کردن،
142
00:05:34,240 –> 00:05:35,520
سعی می کنم از طریق آنها نگاه
143
00:05:35,520 –> 00:05:36,800
کنم و شروع به اضافه کردن هر یک از
144
00:05:36,800 –> 00:05:38,800
آنها به ظرف می کنم بسیار خوب، بنابراین من می خواهم
145
00:05:38,800 –> 00:05:40,400
هر دسته را به ظرف اضافه کنم،
146
00:05:40,400 –> 00:05:41,600
بنابراین دو راه برای انجام این کار وجود دارد که می توانید این کار را انجام دهید.
147
00:05:41,600 –> 00:05:42,960
از حلقه for
148
00:05:42,960 –> 00:05:44,080
149
00:05:44,080 –> 00:05:46,240
برای برای نام
150
00:05:46,240 –> 00:05:47,840
151
00:05:47,840 –> 00:05:49,600
let’s استفاده کنید بگویم رتبه من
152
00:05:49,600 –> 00:05:50,960
153
00:05:50,960 –> 00:05:52,960
و سپس برای
154
00:05:52,960 –> 00:05:54,240
155
00:05:54,240 –> 00:05:55,600
یک
156
00:05:55,600 –> 00:05:57,280
دانشگاه
157
00:05:57,280 –> 00:05:59,120
آسان است، اما من نمی خواهم آن
158
00:05:59,120 –> 00:06:01,600
را حذف کنم، زیرا گاهی اوقات ممکن است خراب شود،
159
00:06:01,600 –> 00:06:03,280
به خصوص اگر تعداد
160
00:06:03,280 –> 00:06:04,720
عناصر متفاوتی داشته باشد
161
00:06:04,720 –> 00:06:06,720
، خوب است، بنابراین من فقط
162
00:06:06,720 –> 00:06:08,880
سعی می کنم شروع کنم چاپ کردن ام
163
00:06:08,880 –> 00:06:10,880
و تعداد عناصر را در هر
164
00:06:10,880 –> 00:06:12,880
ستون ببینید خوب است، میخواهم بگویم نقطه به
165
00:06:12,880 –> 00:06:15,280
خاطر بسپار لیستهایی وجود دارد، بنابراین هر یک
166
00:06:15,280 –> 00:06:17,759
از این فهرستها هستند که طول رتبه را اضافه
167
00:06:17,759 –> 00:06:19,280
168
00:06:19,280 –> 00:06:22,319
میکنم و سپس ببینیم چه چیزی به دست میآید.
169
00:06:23,440 –> 00:06:25,360
این حدود دو هزار و ششصد و
170
00:06:25,360 –> 00:06:27,280
سه ام
171
00:06:27,280 –> 00:06:30,560
ردیف یا فیلد یا رکوردهای مربوط به
172
00:06:30,560 –> 00:06:32,160
این ستون خاص است، بیایید به جای رتبهبندیها امتحان کنیم
173
00:06:32,160 –> 00:06:33,680
، فقط میخواهم تأیید کنم که آیا
174
00:06:33,680 –> 00:06:34,400
175
00:06:34,400 –> 00:06:36,479
تعداد
176
00:06:36,479 –> 00:06:38,639
عناصر یکسانی دارند یا خیر، خوب،
177
00:06:38,639 –> 00:06:42,000
کشورهای مشابه سالها دارند.
178
00:06:43,120 –> 00:06:44,960
بسیار خوب، همانطور که می بینید آنها
179
00:06:44,960 –> 00:06:46,400
یکسان هستند، بنابراین کاری که من می خواهم انجام دهم این است
180
00:06:46,400 –> 00:06:48,240
که هر یک از آنها را بررسی می کنم و با
181
00:06:48,240 –> 00:06:50,160
انجام این کار من ضمیمه خواهم کرد، بنابراین اجازه
182
00:06:50,160 –> 00:06:51,360
دهید شروع کنیم من از یک دستور while استفاده می کنم
183
00:06:51,360 –> 00:06:53,360
خوب پس ابتدا با
184
00:06:53,360 –> 00:06:55,599
گفتن x برابر صفر
185
00:06:55,599 –> 00:06:57,440
و سپس i شروع می کنم میگویم وای
186
00:06:57,440 –> 00:07:00,240
x کمتر از طول
187
00:07:00,240 –> 00:07:01,759
اوم است، شما هشت مورد از آنها را انتخاب میکنید، بیایید بگوییم
188
00:07:01,759 –> 00:07:03,039
طول
189
00:07:03,039 –> 00:07:05,919
نام دانشگاه چه نام دانشگاه
190
00:07:06,479 –> 00:07:08,160
191
00:07:08,160 –> 00:07:09,360
192
00:07:09,360 –> 00:07:10,160
خوب است،
193
00:07:10,160 –> 00:07:12,240
بنابراین این مورد از آنها عبور میکند و
194
00:07:12,240 –> 00:07:14,319
در پایان روز من میخواهم یکی را به
195
00:07:14,319 –> 00:07:16,560
x اضافه کنم. فقط می گوییم x برابر با یک به علاوه
196
00:07:16,560 –> 00:07:19,280
x خوب یا x به علاوه یک
197
00:07:19,280 –> 00:07:21,280
خوب است، بنابراین
198
00:07:21,280 –> 00:07:23,199
آنچه را در x داریم
199
00:07:23,199 –> 00:07:25,039
تا زمانی که به عدد دوهزار و
200
00:07:25,039 –> 00:07:27,440
شصت و شش و دو هزار
201
00:07:27,440 –> 00:07:29,360
و ششصد و سی برسد، ادامه می دهد، سومی آخرین عنصر است.
202
00:07:29,360 –> 00:07:31,280
خوب است، پس در وسط
203
00:07:31,280 –> 00:07:32,479
این کد، کاری که من می خواهم انجام دهم این است
204
00:07:32,479 –> 00:07:34,240
که من شروع به اضافه کردن می کنم
205
00:07:34,240 –> 00:07:35,039
خوب،
206
00:07:35,039 –> 00:07:36,720
بنابراین می خواهم بگویم که
207
00:07:36,720 –> 00:07:38,960
208
00:07:40,319 –> 00:07:42,000
این مجموعه داده در اینجا ظرف نامیده می شود،
209
00:07:42,000 –> 00:07:45,120
بنابراین می خواهم این ظرف را بگویم
210
00:07:45,120 –> 00:07:49,199
و چگونه می توانید عناصر را به um
211
00:07:49,199 –> 00:07:51,440
به دیکشنری اضافه کنید که از این نماد استفاده می کنید
212
00:07:51,440 –> 00:07:52,879
خوب است، سپس نام
213
00:07:52,879 –> 00:07:53,919
فرهنگ لغت را
214
00:07:53,919 –> 00:07:55,520
به عناصر می دهید، اما در این مورد من قصد دارم
215
00:07:55,520 –> 00:07:59,039
با استفاده از این نصب کنم، می خواهم بگویم
216
00:08:02,400 –> 00:08:04,479
بنابراین من می خواهم بگو x
217
00:08:04,479 –> 00:08:06,639
من توضیح خواهم داد که این کد واقعاً به زودی
218
00:08:06,639 –> 00:08:09,120
برابر با 2 می شود. بنابراین اتفاقی که می افتد این است که
219
00:08:09,120 –> 00:08:11,360
این x در حال حاضر 0 است و این کار را با
220
00:08:11,360 –> 00:08:12,400
221
00:08:12,400 –> 00:08:13,680
هم مقایسه میکند، بنابراین هنوز
222
00:08:13,680 –> 00:08:15,919
از طول دانشگاه
223
00:08:15,919 –> 00:08:17,520
که 2603 است کمتر است.
224
00:08:17,520 –> 00:08:18,720
225
00:08:18,720 –> 00:08:20,639
226
00:08:20,639 –> 00:08:22,160
227
00:08:22,160 –> 00:08:24,400
اولین عنصر در
228
00:08:24,400 –> 00:08:26,240
کانتینر
229
00:08:26,240 –> 00:08:27,840
و پس از کنار گذاشتن آن، میدانید که
230
00:08:27,840 –> 00:08:29,680
دیکشنری با مقادیر کلیدی کار میکند، بنابراین
231
00:08:29,680 –> 00:08:31,520
اگر
232
00:08:31,520 –> 00:08:32,719
عناصری وجود داشته باشد، به طور طبیعی کار میکند،
233
00:08:32,719 –> 00:08:36,159
میگویم بیایید بگوییم kmusd،
234
00:08:36,159 –> 00:08:37,279
سپس
235
00:08:37,279 –> 00:08:39,919
um s داریم، سپس فهرستی از آنها را خواهم داشت. شاید
236
00:08:39,919 –> 00:08:41,200
237
00:08:41,200 –> 00:08:44,399
رتبه داشته باشم می گویم رتبه اول
238
00:08:44,399 –> 00:08:47,120
رتبه دارد پس شاید
239
00:08:47,120 –> 00:08:48,800
اسمش چیست پارامترهای دیگری
240
00:08:48,800 –> 00:08:52,399
که کشور داریم می گوییم در غنا است
241
00:08:52,399 –> 00:08:53,680
242
00:08:53,680 –> 00:08:55,200
چه چیز دیگری
243
00:08:55,2