در این مطلب، ویدئو آموزش پایتون برای تجزیه و تحلیل داده ها – راه اندازی، خواندن فایل و نمودار اول با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:33:14
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,240 –> 00:00:04,480
سلام به این ویدیو خوش آمدید
2
00:00:04,480 –> 00:00:06,720
در این ویدیو ما با
3
00:00:06,720 –> 00:00:08,639
پایتون برای تجزیه و تحلیل داده ها شروع می کنیم،
4
00:00:08,639 –> 00:00:10,320
بنابراین اگر به عنوان مثال با اکسل کار
5
00:00:10,320 –> 00:00:12,400
می کنید و همیشه فکر
6
00:00:12,400 –> 00:00:14,960
می کردید چگونه می توانم از چیزی مانند پایتون برای
7
00:00:14,960 –> 00:00:16,400
تجزیه و تحلیل داده هایم به خوبی استفاده کنم،
8
00:00:16,400 –> 00:00:18,480
این دقیقا همان چیزی است که ما شیرجه خواهیم زد.
9
00:00:18,480 –> 00:00:19,439
به
10
00:00:19,439 –> 00:00:21,119
این دلیل که ما نگاهی خواهیم داشت به اینکه چگونه
11
00:00:21,119 –> 00:00:23,439
می توانیم پایتون را به درستی راه اندازی کنیم تا مطمئن
12
00:00:23,439 –> 00:00:25,439
شویم که می توانیم از آن برای تجزیه و تحلیل داده ها استفاده
13
00:00:25,439 –> 00:00:27,199
کنیم، سپس به نحوه
14
00:00:27,199 –> 00:00:29,199
دسترسی به یک فایل csv یک مورد
15
00:00:29,199 –> 00:00:32,000
معمول اکسل برای مثال خواهیم پرداخت.
16
00:00:32,000 –> 00:00:33,840
ما میتوانیم به فایل csv دسترسی داشته باشیم
17
00:00:33,840 –> 00:00:35,840
و اینکه چگونه میتوانیم به ستونها
18
00:00:35,840 –> 00:00:37,520
یا ردیفهای خاصی در آن فایل دسترسی داشته باشیم
19
00:00:37,520 –> 00:00:39,840
و در نهایت چگونه میتوانیم نمودار سریعی را
20
00:00:39,840 –> 00:00:41,840
با استفاده از پایتون ترسیم
21
00:00:41,840 –> 00:00:44,079
کنیم که در واقع این فقط
22
00:00:44,079 –> 00:00:46,000
اصول اولیه است، اما شما باید به نحوی شروع کنید،
23
00:00:46,000 –> 00:00:48,000
بنابراین بیایید شروع کنیم.
24
00:00:48,000 –> 00:00:48,719
با هم
25
00:00:48,719 –> 00:00:51,440
در این ویدیو
26
00:00:52,640 –> 00:00:55,440
برای شروع باید ابتدا پایتون را نصب
27
00:00:55,440 –> 00:00:56,079
28
00:00:56,079 –> 00:00:58,800
کنیم و اساساً دو گزینه برای انجام
29
00:00:58,800 –> 00:00:59,840
این کار داریم که
30
00:00:59,840 –> 00:01:02,559
یکی از این گزینه ها دانلود مستقیم
31
00:01:02,559 –> 00:01:03,199
پایتون است
32
00:01:03,199 –> 00:01:05,600
و گزینه دیگر استفاده از
33
00:01:05,600 –> 00:01:06,560
34
00:01:06,560 –> 00:01:08,159
توزیع پایتون است.
35
00:01:08,159 –> 00:01:09,600
36
00:01:09,600 –> 00:01:11,439
دانلود مستقیم به این معنی است که شما
37
00:01:11,439 –> 00:01:13,360
به python.org بروید و
38
00:01:13,360 –> 00:01:15,759
زبان python را دانلود
39
00:01:15,759 –> 00:01:16,720
40
00:01:16,720 –> 00:01:18,640
کنید و دستورالعملهای نصب را کاملاً ساده دنبال کنید،
41
00:01:18,640 –> 00:01:21,119
در واقع
42
00:01:21,119 –> 00:01:23,200
هیچ مشکلی برای انجام آن وجود
43
00:01:23,200 –> 00:01:24,799
ندارد که تنها
44
00:01:24,799 –> 00:01:27,040
مشکل مخصوصاً برای مبتدیان است. این است که
45
00:01:27,040 –> 00:01:27,920
پایتون یک
46
00:01:27,920 –> 00:01:30,159
زبان منبع باز است و پایتون یک
47
00:01:30,159 –> 00:01:31,439
زبان واقعاً قدرتمند است، به
48
00:01:31,439 –> 00:01:33,119
این معنی که می توانید از آن برای
49
00:01:33,119 –> 00:01:34,720
تجزیه و تحلیل داده ها برای یادگیری ماشین استفاده کنید
50
00:01:34,720 –> 00:01:36,640
، همچنین برای مواردی مانند توسعه وب
51
00:01:36,640 –> 00:01:38,840
یا حتی برای ایجاد برنامه های دسکتاپ، به
52
00:01:38,840 –> 00:01:41,040
این معنی است که
53
00:01:41,040 –> 00:01:43,920
استفاده از پایتون ساده وانیلی مانند
54
00:01:43,920 –> 00:01:44,240
55
00:01:44,240 –> 00:01:47,280
کد خالصی که ما داریم می تواند کار کند،
56
00:01:47,280 –> 00:01:49,119
اما بهتر است که برخی از
57
00:01:49,119 –> 00:01:50,799
58
00:01:50,799 –> 00:01:53,040
عملکردهای خاص متناسب با نیازهای شما را
59
00:01:53,040 –> 00:01:54,000
داشته باشیم
60
00:01:54,000 –> 00:01:55,759
زیرا اگر می خواهید یک صفحه وب بسازید
61
00:01:55,759 –> 00:01:57,200
یا اگر می خواهید داده ها را به خوبی تجزیه و تحلیل
62
00:01:57,200 –> 00:01:58,799
کنید،
63
00:01:58,799 –> 00:02:00,479
چیزهای مختلفی وجود دارد. که میخواهید
64
00:02:00,479 –> 00:02:00,960
65
00:02:00,960 –> 00:02:03,600
با آن زبان انجام دهید و برای آن
66
00:02:03,600 –> 00:02:06,079
پایتون بستههای مختلف زیادی ارائه میشود
67
00:02:06,079 –> 00:02:07,119
کتابخانههای d
68
00:02:07,119 –> 00:02:08,800
که چنین قابلیتهای اضافی
69
00:02:08,800 –> 00:02:10,399
و چنین
70
00:02:10,399 –> 00:02:12,239
قابلیتهای راحتی را به آن
71
00:02:12,239 –> 00:02:14,560
زبان اضافه میکنند، مشکل این است که
72
00:02:14,560 –> 00:02:16,879
نسخه دانلود مستقیم پایتون
73
00:02:16,879 –> 00:02:18,959
با این بستهها همراه
74
00:02:18,959 –> 00:02:21,360
نیست، اما با
75
00:02:21,360 –> 00:02:23,120
مدیریت بسته یکپارچه pip python
76
00:02:23,120 –> 00:02:25,280
همراه است و با دستور نصب pip فقط
77
00:02:25,280 –> 00:02:27,040
در صورتی که شما از قبل آن را در جایی جستجو کردم
78
00:02:27,040 –> 00:02:29,040
که میتوانید بستههای مختلف مورد نیاز خود را نصب کنید،
79
00:02:29,040 –> 00:02:31,200
بنابراین
80
00:02:31,200 –> 00:02:33,760
هیچ مشکلی در این مورد وجود ندارد، اما استفاده از
81
00:02:33,760 –> 00:02:35,200
توزیع پایتون
82
00:02:35,200 –> 00:02:37,360
بسیار راحتتر است، به خصوص به
83
00:02:37,360 –> 00:02:38,239
دلیل این
84
00:02:38,239 –> 00:02:40,640
بستهها، زیرا میتوانید به anaconda.com بروید،
85
00:02:40,640 –> 00:02:42,959
برای مثال
86
00:02:42,959 –> 00:02:45,840
توزیع پایتون را دانلود کنید.
87
00:02:45,840 –> 00:02:47,360
در آنجا ما در عرض چند ثانیه نگاهی به آن خواهیم داشت
88
00:02:47,360 –> 00:02:48,160
89
00:02:48,160 –> 00:02:51,200
و با آن پایتون و
90
00:02:51,200 –> 00:02:53,440
بسیاری از رایج ترین بسته
91
00:02:53,440 –> 00:02:56,160
هایی که همراه با پایتون استفاده می شوند را نصب می کنید و
92
00:02:56,160 –> 00:02:57,519
به
93
00:02:57,519 –> 00:03:00,239
دلیل راحتی بیشتر، من قطعاً
94
00:03:00,239 –> 00:03:02,560
توصیه می کنم از توزیع پایتون
95
00:03:02,560 –> 00:03:05,200
استفاده کنید. با پایتون شروع شد حالا
96
00:03:05,200 –> 00:03:07,200
بیایید با هم به سایت anaconda.com برویم و
97
00:03:07,200 –> 00:03:08,800
ببینیم این اساسا چگونه کار می کند
98
00:03:08,800 –> 00:03:10,959
از آنجایی که صادقانه بگویم کار بسیار ساده
99
00:03:10,959 –> 00:03:11,920
ای است،
100
00:03:11,920 –> 00:03:14,640
شما فقط به سایت anaconda.com بروید و اکنون می
101
00:03:14,640 –> 00:03:15,920
توانید کمی به پایین صفحه بروید،
102
00:03:15,920 –> 00:03:18,000
می توانید برخی از محصولات آناکوندا را ببینید
103
00:03:18,000 –> 00:03:20,080
و محصول مورد علاقه شما
104
00:03:20,080 –> 00:03:22,080
باید همان توزیع آناکوندا باشد،
105
00:03:22,080 –> 00:03:23,519
زیرا می بینید
106
00:03:23,519 –> 00:03:25,280
که بیشترین توزیع آناکوندا است. توزیع محبوب علم داده پایتون،
107
00:03:25,280 –> 00:03:26,720
بنابراین
108
00:03:26,720 –> 00:03:28,480
فکر می کنم در مورد ما این بدترین انتخاب
109
00:03:28,480 –> 00:03:30,879
نیست، فقط همین الان دانلود را بزنید
110
00:03:30,879 –> 00:03:31,280
111
00:03:31,280 –> 00:03:33,519
و سیستم عامل خود را انتخاب کنید در
112
00:03:33,519 –> 00:03:35,040
مورد من، این مک است
113
00:03:35,040 –> 00:03:37,120
و در اینجا می توانید
114
00:03:37,120 –> 00:03:38,480
نصب کننده را از اینجا دانلود کنید،
115
00:03:38,480 –> 00:03:40,400
پایتون 3 را انتخاب کنید. این همان
116
00:03:40,400 –> 00:03:41,599
چیزی است که من توصیه می کنم
117
00:03:41,599 –> 00:03:43,120
و سپس می توانید تصمیم بگیرید که آیا می خواهید
118
00:03:43,120 –> 00:03:44,799
از نصب کننده گرافیکی استفاده کنید
119
00:03:44,799 –> 00:03:46,799
یا از نصب کننده خط فرمان من
120
00:03:46,799 –> 00:03:48,879
از نصب کننده گرافیکی استفاده کنم این یک
121
00:03:48,879 –> 00:03:49,680
رابط زیباتر است
122
00:03:49,680 –> 00:03:51,680
و سپس می توانید به سادگی دستورالعمل های نصب را دنبال کنید
123
00:03:51,680 –> 00:03:53,280
124
00:03:53,280 –> 00:03:56,000
و با این کار شما قبلاً تمام شده اید. بنابراین
125
00:03:56,000 –> 00:03:57,840
شما اساساً اکنون آماده استفاده از پایتون هستید
126
00:03:57,840 –> 00:03:58,239
127
00:03:58,239 –> 00:04:00,319
پس از نصب این توزیع پایتون به
128
00:04:00,319 –> 00:04:01,519
129
00:04:01,519 –> 00:04:03,280
نظر می رسد بسیار عالی به نظر می رسد کاملاً آسان
130
00:04:03,280 –> 00:04:05,680
است. قبل از اینکه وارد
131
00:04:05,680 –> 00:04:07,519
کد پایتون شویم، باید به
132
00:04:07,519 –> 00:04:08,959
یک چیز دیگر فکر کنیم
133
00:04:08,959 –> 00:04:11,040
که محیط کاری که میخواهیم
134
00:04:11,040 –> 00:04:12,720
در پایتون استفاده کنیم چیست زیرا
135
00:04:12,720 –> 00:04:14,879
نوشتن کد پایتون را میتوان به
136
00:04:14,879 –> 00:04:16,639
روشهای مختلفی انجام داد.
137
00:04:16,639 –> 00:04:19,440
یکی از راههای این است که rebel rebel مخفف
138
00:04:19,440 –> 00:04:19,839
139
00:04:19,839 –> 00:04:23,040
read eval است. چاپ و حلقه را ارزیابی کنید
140
00:04:23,040 –> 00:04:25,199
و اساساً به این معنی است که ما می توانیم
141
00:04:25,199 –> 00:04:26,240
کد پایتون را
142
00:04:26,240 –> 00:04:28,960
در خط فرمان یا در ترمینال
143
00:04:28,960 –> 00:04:30,320
در مک بنویسیم.
144
00:04:30,320 –> 00:04:32,479
145
00:04:32,479 –> 00:04:34,160
146
00:04:34,160 –> 00:04:34,880
147
00:04:34,880 –> 00:04:37,360
در
148
00:04:37,360 –> 00:04:38,400
ترمینال خود
149
00:04:38,400 –> 00:04:40,800
و سپس می توانید اساساً شروع
150
00:04:40,800 –> 00:04:42,800
به نصب کنید، نیازی به نصب اضافی برای
151
00:04:42,800 –> 00:04:43,520
یک ایده
152
00:04:43,520 –> 00:04:46,320
یا ویرایشگر کد نیست،
153
00:04:46,320 –> 00:04:47,520
بلکه بیشتر یک زمین بازی کد است،
154
00:04:47,520 –> 00:04:50,240
بنابراین همانطور که گفتم
155
00:04:50,240 –> 00:04:50,880
شروع
156
00:04:50,880 –> 00:04:52,639
خوبی برای بازی کردن خوب است، اما نه آنچه
157
00:04:52,639 –> 00:04:54,240
در اینجا استفاده خواهیم کرد.
158
00:04:54,240 –> 00:04:56,720
گزینه دوم این است که از
159
00:04:56,720 –> 00:04:57,440
یک ایده
160
00:04:57,440 –> 00:05:00,639
یا یک ویرایشگر کد pycharm یا در مقابل کد استفاده کنید، برای
161
00:05:00,639 –> 00:05:02,080
مثال
162
00:05:02,080 –> 00:05:05,360
این ویرایشگرهای کد خوب هستند
163
00:05:05,360 –> 00:05:07,039
زیرا دارای برخی ویژگی های راحتی اضافی
164
00:05:07,039 –> 00:05:07,680
165
00:05:07,680 –> 00:05:10,400
مانند کنترل نسخه یا اشکال زدایی هستند. و
166
00:05:10,400 –> 00:05:12,240
مخصوصاً اگر از
167
00:05:12,240 –> 00:05:13,199
دنیای توسعه وب میآیید
168
00:05:13,199 –> 00:05:15,840
، کاملاً به چنین ویرایشگرهای کد عادت کردهاید،
169
00:05:15,840 –> 00:05:17,759
بنابراین هیچ اشکالی در مورد آنها وجود ندارد،
170
00:05:17,759 –> 00:05:20,400
زیرا میتوانید از ویرایشگرهای کد استفاده کنید، اما ما
171
00:05:20,400 –> 00:05:22,320
نمیخواهیم یک صفحه وب ایجاد کنیم، بلکه همانطور که میخواهیم.
172
00:05:22,320 –> 00:05:23,600
برای تجزیه و تحلیل داده ها
173
00:05:23,600 –> 00:05:26,560
گزینه سومی وجود دارد و در مورد من نیز
174
00:05:26,560 –> 00:05:27,919
ترجیح داده می شود،
175
00:05:27,919 –> 00:05:29,360
به خصوص اگر می خواهید
176
00:05:29,360 –> 00:05:31,280
با تجزیه و تحلیل داده ها شروع کنید و آن
177
00:05:31,280 –> 00:05:34,479
استفاده از یک نوت بوک مشتری به عنوان محیط کدنویسی ما است،
178
00:05:34,479 –> 00:05:38,000
یک نوت بوک مشتری به
179
00:05:38,000 –> 00:05:40,320
زبان ساده به معنای
180
00:05:40,320 –> 00:05:41,759
اجرای کد پایتون
181
00:05:41,759 –> 00:05:44,560
در مرورگر با یک رابط اختصاصی یا
182
00:05:44,560 –> 00:05:45,759
اختصاصی پایتون
183
00:05:45,759 –> 00:05:48,400
نکته جالب این است که
184
00:05:48,400 –> 00:05:50,080
در مرورگر اجرا می شود اما به
185
00:05:50,080 –> 00:05:53,199
صورت محلی روی دستگاه ما اجرا می شود و اگر این
186
00:05:53,199 –> 00:05:54,880
برای شما عجیب به نظر می رسد نگران نباشید
187
00:05:54,880 –> 00:05:56,560
ما در چند ثانیه به آن نگاه خواهیم کرد
188
00:05:56,560 –> 00:05:58,800
اما اطلاعات بیشتر در مورد آن را می توان
189
00:05:58,800 –> 00:06:00,720
در jupiter.org یافت
190
00:06:00,720 –> 00:06:03,120
و همانطور که گفتم نکته جالب این است که
191
00:06:03,120 –> 00:06:04,960
این یک
192
00:06:04,960 –> 00:06:08,080
رابط مرورگر تعاملی برای کد پایتون است که
193
00:06:08,080 –> 00:06:08,639
می
194
00:06:08,639 –> 00:06:11,280
توانیم ورودی و خروجی خود را همزمان
195
00:06:11,280 –> 00:06:11,840
196
00:06:11,840 –> 00:06:15,120
ببینیم، بنابراین اگر کد را وارد کنم می توانم نتیجه را ببینم
197
00:06:15,120 –> 00:06:18,000
. این کد در این
198
00:06:18,000 –> 00:06:19,039
پنجره مرورگر
199
00:06:19,039 –> 00:06:21,759
نیز شامل تصاویری است
200
00:06:21,759 –> 00:06:23,280
که در سراسر این ویدیو خواهید دید
201
00:06:23,280 –> 00:06:25,440
و بنابراین به نظر من
202
00:06:25,440 –> 00:06:27,280
بهترین محیط برای شروع با
203
00:06:27,280 –> 00:06:28,319
پایتون است،
204
00:06:28,319 –> 00:06:30,720
یک سوال دیگر این است که چگونه می توانیم
205
00:06:30,720 –> 00:06:32,319
چنین نوت بوک jupyter را به
206
00:06:32,319 –> 00:06:34,639
خوبی نصب کنیم. به jupiter.org بروید و
207
00:06:34,639 –> 00:06:36,000
آن را دانلود کنید
208
00:06:36,000 –> 00:06:39,120
یا به سادگی می توانید ترمینال یا
209
00:06:39,120 –> 00:06:40,479
خط فرمان را باز کنید
210
00:06:40,479 –> 00:06:43,759
و حالا conda list را تایپ کنید یعنی چه
211
00:06:43,759 –> 00:06:44,479
212
00:06:44,479 –> 00:06:47,759
خوب ما anaconda را نصب کردیم و همانطور که
213
00:06:47,759 –> 00:06:49,360
پایتون با این پیپ می آید
214
00:06:49,360 –> 00:06:52,400
این مدیریت بسته یکپارچه آناکوندا
215
00:06:52,400 –> 00:06:54,080
نیز یک بسته یکپارچه دارد.
216
00:06:54,080 –> 00:06:55,759
مدیر این به سادگی
217
00:06:55,759 –> 00:06:57,599
در اینجا conda نامیده می شود و با این
218
00:06:57,599 –> 00:06:58,960
دستور گوشه لیست
219
00:06:58,960 –> 00:07:02,000
و با زدن اینتر می
220
00:07:02,000 –> 00:07:05,199
توانید لیستی از تمام بسته هایی را که
221
00:07:05,199 –> 00:07:08,080
به عنوان بخشی از توزیع آناکوندا نصب کرده ایم پیدا کنید، بنابراین
222
00:07:08,080 –> 00:07:10,080
این بسته ها اکنون
223
00:07:10,080 –> 00:07:13,199
بر روی سیستم شما نصب شده اند و اگر
224
00:07:13,199 –> 00:07:16,880
کمی به بالا اسکرول کنیم. در سمت راست اینجا
225
00:07:16,880 –> 00:07:19,440
میتوانیم ببینیم که ما ژوپیتر را
226
00:07:19,440 –> 00:07:21,199
قبلا نصب کردهایم، بنابراین این دقیقاً همان نوتبوک مشتری است
227
00:07:21,199 –> 00:07:22,800
که من به آن اشاره میکردم
228
00:07:22,800 –> 00:07:24,960
و این به چه معناست برای ما پس
229
00:07:24,960 –> 00:07:25,919
این به سادگی به این معنی است
230
00:07:25,919 –> 00:07:28,000
که اکنون می توانیم بلافاصله شروع به
231
00:07:28,000 –> 00:07:29,680
نوشتن اولین کد پایتون خود
232
00:07:29,680 –> 00:07:32,639
در چنین نوت بوک ژوپیتر کنیم، زیرا
233
00:07:32,639 –> 00:07:33,520
234
00:07:33,520 –> 00:07:36,400
من یک تب جدید مانند این را
235
00:07:36,400 –> 00:07:38,080
در اینجا با تب جدید باز می کنم
236
00:07:38,080 –> 00:07:41,440
و اکنون فقط نوت بوک ژوپیتر را مانند این وارد کنید.
237
00:07:41,440 –> 00:07:44,560
اکنون دکمه enter را می
238
00:07:44,560 –> 00:07:47,520
زنیم که نوت بوک jupyter راه اندازی می شود و
239
00:07:47,520 –> 00:07:48,639
اکنون باید
240
00:07:48,639 –> 00:07:51,120
نوت بوک jupyter خود را ببینید، بنابراین این
241
00:07:51,120 –> 00:07:51,840
242
00:07:51,840 –> 00:07:55,199
پنجره مرورگر با آن رابط کاربری کاملاً خاص اجرا می
243
00:07:55,199 –> 00:07:58,560
شود در پایان من
244
00:07:58,560 –> 00:08:00,800
قبلاً در پوشه پروژه حرکت کردم، بنابراین لطفاً همین کار را انجام دهید
245
00:08:00,800 –> 00:08:02,479
زیرا می توانید
246
00:08:02,479 –> 00:08:05,440
ایجاد کنید. سپس آن نوت بوک را در پوشه
247
00:08:05,440 –> 00:08:06,879
انتخابی شما قرار دهید
248
00:08:06,879 –> 00:08:09,280
و اگر اکنون به قسمت new به
249
00:08:09,280 –> 00:08:11,520
سمت راست آن صفحه
250
00:08:11,520 –> 00:08:13,199
برویم، می توانیم یک نوت بوک جدید ایجاد کنیم
251
00:08:13,199 –> 00:08:14,319
که این همان کاری است که در عرض چند ثانیه انجام خواهیم داد
252
00:08:14,319 –> 00:08:15,039
253
00:08:15,039 –> 00:08:16,800
یا می توانید یک فایل متنی نیز ایجاد کنید. یا یک
254
00:08:16,800 –> 00:08:18,080
پوشه برای مثال
255
00:08:18,080 –> 00:08:19,680
ما نیازی نداریم که فقط بخواهیم
256
00:08:19,680 –> 00:08:21,199
یک نوت بوک رایگان پایتون ایجاد کنیم
257
00:08:21,199 –> 00:08:22,879
زیرا این نسخه پایتون است
258
00:08:22,879 –> 00:08:24,720
که ما نصب کرده ایم
259
00:08:24,720 –> 00:08:27,360
بنابراین اگر روی آن کلیک کنیم این پنجره جدید را
260
00:08:27,360 –> 00:08:28,639
با یک سلول به اصطلاح
261
00:08:28,639 –> 00:08:31,120
در h مشاهده می کنیم. قبل از اینکه سلول بخشی از
262
00:08:31,120 –> 00:08:32,799
نوت بوک jupyter است که در آن می توانیم
263
00:08:32,799 –> 00:08:33,919
کد پایتون خود را
264
00:08:33,919 –> 00:08:35,760
بنویسیم و همچنین می توانیم نام آن را در اینجا تغییر
265
00:08:35,760 –> 00:08:37,679
دهیم اگر روی untitled کلیک کنیم و شاید
266
00:08:37,679 –> 00:08:38,000
آن را
267
00:08:38,000 –> 00:08:42,000
برای تجزیه و تحلیل داده ها python بنامیم
268
00:08:42,000 –> 00:08:43,599
چیزی شبیه به آن نیازی به انجام
269
00:08:43,599 –> 00:08:45,200
این کار نیست. این است که چگونه میتوانید
270
00:08:45,200 –> 00:08:47,680
نام چنین نوتبوک jupyter را تغییر دهید و در
271
00:08:47,680 –> 00:08:49,200
اینجا ما اکنون میتوانیم
272
00:08:49,200 –> 00:08:51,760
کد پایتون خود را بنویسیم، به عنوان مثال برای شروع
273
00:08:51,760 –> 00:08:52,959
بسیار
274
00:08:52,959 –> 00:08:56,160
پیچیده، مثلاً دو بعلاوه دو مانند آن را بنویسیم
275
00:08:56,160 –> 00:08:58,080
و اکنون میتوانید یا همان run را بزنید
276
00:08:58,080 –> 00:09:00,000
یا بیایید
277
00:09:00,000 –> 00:09:03,040
شاید دو به علاوه چهار را انجام دهیم.
278
00:09:03,040 –> 00:09:05,839
Shift را بزنید و این را وارد کنید اساساً
279
00:09:05,839 –> 00:09:06,720
کد اجرا می شود
280
00:09:06,720 –> 00:09:09,440
و واقعاً مهم است که خروجی را بلافاصله در اینجا نشان می دهد، این
281
00:09:09,440 –> 00:09:11,040
282
00:09:11,040 –> 00:09:12,800
همان چیزی است که وقتی
283
00:09:12,800 –> 00:09:14,160
نگاهی به اسلاید انداختیم
284
00:09:14,160 –> 00:09:16,560
، نوت بوک به ما اجازه می دهد ورودی
285
00:09:16,560 –> 00:09:17,360
و خروجی را
286
00:09:17,360 –> 00:09:19,440
بلافاصله و در همان صفحه ببینیم و به آن اشاره کردم.
287
00:09:19,440 –> 00:09:21,200
این در واقع بسیار جالب است،
288
00:09:21,200 –> 00:09:22,800
اما دو چیز دیگر وجود دارد که
289
00:09:22,800 –> 00:09:24,640
باید آنها را تغییر دهیم یا درک کنیم
290
00:09:24,640 –> 00:09:26,959
تا در نهایت بتوانیم در کد تجزیه و تحلیل داده خود فرو برویم
291
00:09:26,959 –> 00:09:28,240
292
00:09:28,240 –> 00:09:31,120
، اولین چیز این است که ما به یک فایل ورودی و
293
00:09:31,120 –> 00:09:33,120
یک فایل منبع نیاز داریم. ما میخواهیم به خوبی به آن
294
00:09:33,120 –> 00:09:34,240
دسترسی داشته
295
00:09:34,240 –> 00:09:35,760
باشیم که میتوانید پیوندی به
296
00:09:35,760 –> 00:09:37,680
فایل منبع در زیر
297
00:09:37,680 –> 00:09:39,519
ویدیو در توضیحات ویدیو پیدا کنید، بنابراین به سادگی
298
00:09:39,519 –> 00:09:42,320
روی آن پیوند کلیک کنید و فایل را دانلود کنید
299
00:09:42,320 –> 00:09:44,720
و سپس به سادگی آن فایل را بردارید که به
300
00:09:44,720 –> 00:09:47,200
آن درآمد سود csv میگویند
301
00:09:47,200 –> 00:09:50,320
و بکشید و آن را در پوشه
302
00:09:50,320 –> 00:09:53,120
ای که نوت بوک jupyter را ایجاد کرده اید،
303
00:09:53,120 –> 00:09:54,480
در مورد من، این
304
00:09:54,480 –> 00:09:57,360
پوشه اصولی است و در این پوشه می توانید
305
00:09:57,360 –> 00:09:58,000
306
00:09:58,000 –> 00:10:02,079
این python را برای تجزیه و تحلیل داده ها، فایل ipynb را ببینید
307
00:10:02,079 –> 00:10:05,360
که نوع فایلی است که notebook jupyter
308
00:10:05,360 –> 00:10:07,360
اساساً ایجاد می کند و استفاده می کند
309
00:10:07,360 –> 00:10:09,120
و فقط کافی است آن را به داخل این پوشه بکشید.
310
00:10:09,120 –> 00:10:11,360
فایل csv سود درآمد،
311
00:10:11,360 –> 00:10:13,120
بنابراین این یک چیز بود، این اضافه
312
00:10:13,120 –> 00:10:15,279
کردن فایل منبع بود، اما یک چیز دوم نیز وجود دارد
313
00:10:15,279 –> 00:10:16,959
که باید
314
00:10:16,959 –> 00:10:18,560
قبل از اینکه بتوانیم در نهایت
315
00:10:18,560 –> 00:10:20,880
فایل CSV خود را تجزیه و تحلیل کنیم و این
316
00:10:20,880 –> 00:10:23,360
ما را به آخرین اسلاید در این ویدئو می برد،
317
00:10:23,360 –> 00:10:26,160
زیرا ما در مورد آن صحبت کردیم، باید درک کنیم. it python یک
318
00:10:26,160 –> 00:10:27,040
319
00:10:27,040 –> 00:10:30,160
زبان منبع باز است که اساساً برای هر
320
00:10:30,160 –> 00:10:30,959
هدفی ساخته شده است
321
00:10:30,959 –> 00:10:33,519
و بنابراین ما می توانیم
322
00:10:33,519 –> 00:10:36,079
بسته های اضافی را که در مورد آن صحبت کردم نصب کنیم.
323
00:10:36,079 –> 00:10:38,720
324
00:10:38,720 –> 00:10:39,680
ماژولهای داخلی
325
00:10:39,680 –> 00:10:41,680
اگر چه اگر برای کتابخانه استاندارد پایتون در گوگل جستجو کنید، میتوانید اطلاعات بیشتری در مورد آنها بیابید،
326
00:10:41,680 –> 00:10:43,440
327
00:10:43,440 –> 00:10:46,800
اما به خصوص اگر برای
328
00:10:46,800 –> 00:10:48,800
اهداف علم داده یا برای اهداف تجزیه و تحلیل دادهها،
329
00:10:48,800 –> 00:10:49,600
330
00:10:49,600 –> 00:10:52,160
331
00:10:52,160 –> 00:10:54,640
بستهها و کتابخانههای اختیاری یا شخص ثالث را نصب کنید
332
00:10:54,640 –> 00:10:56,800
، اکنون تعداد زیادی از آنها وجود دارد. کتابخانهها
333
00:10:56,800 –> 00:10:58,240
و بستههای موجود
334
00:10:58,240 –> 00:11:00,240
اما سه مورد از رایجترین مواردی که
335
00:11:00,240 –> 00:11:02,240
احتمالاً از آنها استفاده خواهید کرد
336
00:11:02,240 –> 00:11:06,480
، pandaهای numpy و matplotlib
337
00:11:06,480 –> 00:11:09,279
هستند که حالا این بستهها به خوبی چه کاری انجام میدهند.
338
00:11:09,279 –> 00:11:10,399
339
00:11:10,399 –> 00:11:12,399
340
00:11:12,399 –> 00:11:14,800
341
00:11:14,800 –> 00:11:15,839
342
00:11:15,839 –> 00:11:19,360
پانداها به ما اجازه میدهند تا
343
00:11:19,360 –> 00:11:23,360
344
00:11:23,360 –> 00:11:24,560
345
00:11:24,560 –> 00:11:26,880
ویژگیهای دستکاری و تجزیه و تحلیل دادههای بهبودیافته یا بهتر را به پایتون و matplotlib اضافه کنیم،
346
00:11:26,880 –> 00:11:28,399
اساساً به ما این امکان را میدهد که اکنون اطلاعات را تجسم
347
00:11:28,399 –> 00:11:29,600
348
00:11:29,600 –> 00:11:30,959
کنیم، اگر به
349
00:11:30,959 –> 00:11:33,120
کاری که میخواهیم انجام دهیم فکر میکنیم، میخواهیم دادهها را به خوبی تجزیه و تحلیل کنیم
350
00:11:33,120 –> 00:11:34,800
و دادههایی را تجسم کنیم که
351
00:11:34,800 –> 00:11:37,360
این بستهها انجام نمیدهند. در حال حاضر خیلی بد
352
00:11:37,360 –> 00:11:39,279
به نظر می رسد، نکته مهم در مورد این بسته ها این است
353
00:11:39,279 –> 00:11:41,680
که ما آنها را قبلاً روی سیستم خود نصب کرده ایم
354
00:11:41,680 –> 00:11:42,320
355
00:11:42,320 –> 00:11:43,760
زیرا به یاد داشته باشید آنچه در مورد
356
00:11:43,760 –> 00:11:46,240
آناکوندا گفتم که آناکوندا به طور پیشفرض
357
00:11:46,240 –> 00:11:48,640
با همه محبوبترین
358
00:11:48,640 –> 00:11:49,440
بستهها همراه است،
359
00:11:49,440 –> 00:11:52,880
بنابراین اگر به
360
00:11:52,880 –> 00:11:55,440
ترمینال خود در اینجا برگردیم، نه به آن
361
00:11:55,440 –> 00:11:57,279
قسمت، بلکه به قسمتی که
362
00:11:57,279 –> 00:11:57,760
363
00:11:57,760 –> 00:12:00,639
دستور لیست کوندا را داشتیم و همانطور که مشتری را دیدیم.
364
00:12:00,639 –> 00:12:01,279
درست در اینجا
365
00:12:01,279 –> 00:12:03,920
ما همچنین میتوانیم ببینیم که ما به عنوان مثال
366
00:12:03,920 –> 00:12:04,880
matplotlib
367
00:12:04,880 –> 00:12:08,240
را در اینجا داریم یا پانداها
368
00:12:08,240 –> 00:12:10,800
را همانجا داریم یا numpy را درست در آنجا
369
00:12:10,800 –> 00:12:11,440
370
00:12:11,440 –> 00:12:13,600
371
00:12:13,600 –> 00:12:15,680
372
00:12:15,680 –> 00:12:18,079
داریم.
373
00:12:18,079 –> 00:12:18,720
اکنون
374
00:12:18,720 –> 00:12:22,480
به پروژه ما برای انجام این کار من
375
00:12:22,480 –> 00:12:23,600
برگشتم به نوت بوک jupyter
376
00:12:23,600 –> 00:12:27,680
و اکنون می توانیم به سادگی import numpy را
377
00:12:27,680 –> 00:12:30,639
به عنوان np تایپ کنیم که این روش معمولی است که چگونه
378
00:12:30,639 –> 00:12:31,360
379
00:12:31,360 –> 00:12:33,920
numpy را به پروژه های خود وارد می کنیم و همچنین می توانیم
380
00:12:33,920 –> 00:12:34,560
381
00:12:34,560 –> 00:12:38,079
پانداها را به عنوان pd وارد
382
00:12:38,079 –> 00:12:41,200
کنیم. وارد کردن بسته pandas
383
00:12:41,200 –> 00:12:43,279
با زدن shift و enter اساساً
384
00:12:43,279 –> 00:12:44,720
این واردات به خوبی تمام می شود،
385
00:12:44,720 –> 00:12:48,160
یعنی ما اکنون می توانیم از این داده ها استفاده کنیم و به
386
00:12:48,160 –> 00:12:50,480
طور خاص از
387
00:12:50,480 –> 00:12:51,440
بسته pandas درست در اینجا
388
00:12:51,440 –> 00:12:54,639
برای دسترسی به داده های csv خود استفاده خواهیم کرد، بنابراین اجازه دهید شاید
389
00:12:54,639 –> 00:12:55,040
c همه
390
00:12:55,040 –> 00:12:56,959
این قابلیتها این قابلیت خواندن
391
00:12:56,959 –> 00:12:58,160
392
00:12:58,160 –> 00:13:01,120
محتوا شاید اینطور باشد و محتوا
393
00:13:01,120 –> 00:13:02,079
باید برابر
394
00:13:02,079 –> 00:13:05,440
با p d dot باشد، این اساساً به این معنی است که
395
00:13:05,440 –> 00:13:09,040
ما اکنون میخواهیم به تابعی دسترسی پیدا کنیم
396
00:13:09,040 –> 00:13:12,000
که در پانداها موجود است و اگر
397
00:13:12,000 –> 00:13:13,200
اکنون برگه را بزنیم،
398
00:13:13,200 –> 00:13:14,399
میتوانید عملکردهای مختلفی را پیدا کنید
399
00:13:14,399 –> 00:13:16,800
که
400
00:13:16,800 –> 00:13:19,760
اکنون در این بسته pandas پیاده سازی شده است، اگر همین جا
401
00:13:19,760 –> 00:13:21,600
کمی به پایین اسکرول
402
00:13:21,600 –> 00:13:25,760
کنیم، می توانیم این عملکرد pd.read.csv
403
00:13:25,760 –> 00:13:26,880
404
00:13:26,880 –> 00:13:29,279
را ببینیم زیرا می خواهیم به یک فایل csv دسترسی پیدا کنیم،
405
00:13:29,279 –> 00:13:30,959
این بدترین برنامه به نظر نمی رسد،
406
00:13:30,959 –> 00:13:33,279
بنابراین اگر روی آن کلیک کنیم، اساساً می توانیم
407
00:13:33,279 –> 00:13:35,440
اکنون به فایل csv دسترسی پیدا کنید،
408
00:13:35,440 –> 00:13:38,240
ما فقط باید به پایتون یا پانداها
409
00:13:38,240 –> 00:13:38,639
410
00:13:38,639 –> 00:13:41,600
نام فایل یا مسیر فایل خود را
411
00:13:41,600 –> 00:13:42,000
بگوییم که
412
00:13:42,000 –> 00:13:44,959
بیایید همین جا براکت ها را اضافه کنیم و
413
00:13:44,959 –> 00:13:45,279
اکنون
414
00:13:45,279 –> 00:13:47,680
سلول دیگری را در زیر
415
00:13:47,680 –> 00:13:49,120
اجرای فعلی خود مانند این قرار دهیم
416
00:13:49,120 –> 00:13:52,000
زیرا در مورد ما فایل نوت بوک ژوپیتر
417
00:13:52,000 –> 00:13:52,399
418
00:13:52,399 –> 00:13:54,079
و فایل منبع در همان
419
00:13:54,079 –> 00:13:55,920
پوشه در پوشه Basic قرار دارد،
420
00:13:55,920 –> 00:13:59,120
بنابراین اگر اکنون ls مانند آن را تایپ کنید، می
421
00:13:59,120 –> 00:14:00,399
بینید که ما
422
00:14:00,399 –> 00:14:02,680
فایل پایتون خود را داریم و
423
00:14:02,680 –> 00:14:04,399
فایل gainprofit.csv خود را داریم
424
00:14:04,399 –> 00:14:06,000
و دقیقاً همین نام است. که اکنون میتوانیم
425
00:14:06,000 –> 00:14:07,519
انتخاب کنیم، بنابراین آن را انتخاب کرده
426
00:14:07,519 –> 00:14:10,639
و کپی کنید و اکنون آن را دقیقاً در اینجا
427
00:14:10,639 –> 00:14:13,199
در پرانتز قرار دهید، مطمئن شوید که
428
00:14:13,199 –> 00:14:14,639
علامت نقل قول تکی نیز اضافه کنید،
429
00:14:14,639 –> 00:14:17,040
در غیر این صورت اینجا کار نمیکند و
430
00:14:17,040 –> 00:14:18,000
همچنین میتوانید
431
00:14:18,000 –> 00:14:20,320
سلول را دقیقاً در اینجا با
432
00:14:20,320 –> 00:14:21,760
ls ما انتخاب کنید. دیگر به آن نیاز ندارید
433
00:14:21,760 –> 00:14:24,880
escape را بزنید و d را دو بار فشار دهید به
434
00:14:24,880 –> 00:14:27,440
این ترتیب که این یک سلول را حذف می کند، یک
435
00:14:27,440 –> 00:14:29,040
ویژگی خوب ممکن است در برخی
436
00:14:29,040 –> 00:14:30,000
موارد مفید باشد،
437
00:14:30,000 –> 00:14:33,120
بنابراین اکنون گفتیم که
438
00:14:33,120 –> 00:14:35,600
اگر از محتوا در اینجا استفاده کنیم، می خواهیم
439
00:14:35,600 –> 00:14:37,199
محتوای این
440
00:14:37,199 –> 00:14:40,959
فایل csv را بخوانیم. پس بیایید shift و enter را فشار دهیم
441
00:14:40,959 –> 00:14:41,839
و همانطور که می بینید
442
00:14:41,839 –> 00:14:43,760
هیچ چیز در اینجا به عنوان خروجی
443
00:14:43,760 –> 00:14:45,440
همانطور که قبلا دیدیم نمایش داده نمی شود،
444
00:14:45,440 –> 00:14:48,240
اما اگر اکنون محتوایی مانند این را تایپ کنیم و
445
00:14:48,240 –> 00:14:50,320
shift را فشار داده و دوباره اینتر را فشار
446
00:14:50,320 –> 00:14:53,360
دهیم، می توانیم خروجی خروجی خود را ببینیم یا
447
00:14:53,360 –> 00:14:54,560
اساساً نه خروجی
448
00:14:54,560 –> 00:14:57,600
محتوای فایل csv
449
00:14:57,600 –> 00:15:00,079
ما میتوانیم ببینیم که هنوز هم مشکلاتی داریم،
450
00:15:00,079 –> 00:15:00,800
451
00:15:00,800 –> 00:15:03,440
زیرا ظاهراً جداکننده
452
00:15:03,440 –> 00:15:05,279
در مورد ما درست
453
00:15:05,279 –> 00:15:06,959
نیست، نکته مهم این است که علاوه بر
454
00:15:06,959 –> 00:15:08,560
اضافه کردن نام فایل
455
00:15:08,560 –> 00:15:10,639
یا مسیر شامل نام فایل در صورتی
456
00:15:10,639 –> 00:15:12,000
که فایل قرار نداشته باشد.
457
00:15:12,000 –> 00:15:14,160
در همان پوشه ای که برای
458
00:15:14,160 –> 00:15:16,320
ما وجود دارد، می توانید پارامترهای دیگری را نیز
459
00:15:16,320 –> 00:15:17,040
در اینجا اضافه کنید،
460
00:15:17,040 –> 00:15:20,160
بنابراین اگر وارد کنیم یا یک کاما اضافه کنیم
461
00:15:20,160 –> 00:15:24,079
و اکنون بگوییم sap مانند این برابر است با
462
00:15:24,079 –> 00:15:26,959
علامت نقل قول تکی، اکنون می
463
00:15:26,959 –> 00:15:27,519
464
00:15:27,519 –> 00:15:30,560
توانیم جداکننده خود را دقیقاً در اینجا تعریف کنیم.
465
00:15:30,560 –> 00:15:33,120
مورد ما این باید یک نقطه ویرگول باشد،
466
00:15:33,120 –> 00:15:35,040
بنابراین اگر نقطه ویرگول را اضافه کنیم
467
00:15:35,040 –> 00:15:38,880
و اکنون مهم است که این
468
00:15:38,880 –> 00:15:40,560
سلول را یک بار دیگر در اینجا اجرا کنید،
469
00:15:40,560 –> 00:15:41,920
مهم است که همیشه باید
470
00:15:41,920 –> 00:15:43,920
سلول ها را دوباره اجرا کنید تا مطمئن شوید
471
00:15:43,920 –> 00:15:46,079
تغییرات اعمال شده اند و اکنون یک بار دیگر این سلول را اجرا
472
00:15:46,079 –> 00:15:47,199
کنید،
473
00:15:47,199 –> 00:15:49,920
می توانید ببینید که اکنون فایل ما به درستی نمایش داده می
474
00:15:49,920 –> 00:15:51,440
شود و
475
00:15:51,440 –> 00:15:53,199
اکنون در مورد فایل ها صحبت می کنیم و به
476
00:15:53,199 –> 00:15:54,480
درستی نمایش داده می شود،
477
00:15:54,480 –> 00:15:57,360
478
00:15:57,360 –> 00:15:59,040
اگر در این سلول کلیک کنیم
479
00:15:59,040 –> 00:16:02,399
و اکنون نوع را وارد کنیم و اکنون محتوا را وارد کنیم،
480
00:16:02,399 –> 00:16:03,279
بنابراین
481
00:16:03,279 –> 00:16:05,600
نوع محتوایی را که در اینجا نمایش داده ایم
482
00:16:05,600 –> 00:16:08,320
و دوباره فشار دهید دقیقاً در اینجا چه چیزی را می بینیم. shift و enter
483
00:16:08,320 –> 00:16:10,880
سپس میتوانیم ببینیم که پانداها
484
00:16:10,880 –> 00:16:11,600
به اصطلاح یک
485
00:16:11,600 –> 00:16:14,480
دیتا فریم ایجاد کردهاند، حالا نمیخواهم زیاد
486
00:16:14,480 –> 00:16:14,800
487
00:16:14,800 –> 00:16:16,800
در جزئیات این فریمهای داده فرو بروم،
488
00:16:16,800 –> 00:16:18,720
اما نکته مهم این است که یک قاب داده
489
00:16:18,720 –> 00:16:19,360
490
00:16:19,360 –> 00:16:22,000
به سادگی دوباره این ساختار را دقیقاً در اینجا ارائه می دهد
491
00:16:22,000 –> 00:16:22,639
492
00:16:22,639 –> 00:16:25,120
بنابراین ما یک ساختار جدولی داریم و
493
00:16:25,120 –> 00:16:26,079
این مهم
494
00:16:26,079 –> 00:16:28,720
است که یک ساختار جدولی
495
00:16:28,720 –> 00:16:29,199
496
00:16:29,199 –> 00:16:32,560
497
00:16:32,560 –> 00:16:34,240
498
00:16:34,240 –> 00:16:36,320
499
00:16:36,320 –> 00:16:37,680
نمایه شده است.
500
00:16:37,680 –> 00:16:39,519
از آنجا که فایل csv دارای هدر بود،
501
00:16:39,519 –> 00:16:41,759
بنابراین سرصفحههای ما اساساً
502
00:16:41,759 –>