در این مطلب، ویدئو [پروژه پایتون] تحلیل احساسات و تجسم اخبار سهام با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:43:31
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,600 –> 00:00:03,370
سلام بچه ها چه خبر نام من avi است و
2
00:00:03,370 –> 00:00:05,470
به یک پروژه کاملاً جدید در پلتفرم کدک خوش آمدید
3
00:00:05,470 –> 00:00:07,870
این پروژه تماماً
4
00:00:07,870 –> 00:00:10,330
در مورد استفاده از تجزیه و تحلیل احساسات برای
5
00:00:10,330 –> 00:00:12,700
درک اخبار مالی و
6
00:00:12,700 –> 00:00:15,249
تصمیم گیری در مورد سهام است که هر روز
7
00:00:15,249 –> 00:00:17,500
نویسندگان در سراسر جهان مقاله ارسال می
8
00:00:17,500 –> 00:00:20,080
کنند و این یک مقاله است. پلتفرم عالی برای دیدن
9
00:00:20,080 –> 00:00:22,090
همه مقالاتی که مردم در
10
00:00:22,090 –> 00:00:24,369
مورد یک سهام پست کردهاند، چه میشود اگر به جای
11
00:00:24,369 –> 00:00:26,050
اینکه هر تیتر را مرور کنیم و
12
00:00:26,050 –> 00:00:28,240
بفهمیم به عنوان یک خبر مثبت یا
13
00:00:28,240 –> 00:00:31,210
منفی است، میتوانیم از پایتون برای تجزیه fin viscom استفاده کنیم تا
14
00:00:31,210 –> 00:00:34,120
همه این عناوین مقاله را جمعآوری کنیم
15
00:00:34,120 –> 00:00:36,610
و سپس از تجزیه و تحلیل احساسات استفاده کنیم.
16
00:00:36,610 –> 00:00:39,790
برای درک اینکه آیا میانگین گیری روزانه
17
00:00:39,790 –> 00:00:42,700
این اخبار مثبت است یا اخبار منفی،
18
00:00:42,700 –> 00:00:44,470
این یک پروژه بسیار هیجان انگیز است که از
19
00:00:44,470 –> 00:00:46,180
مجموعه کاملی از فناوری های مختلف استفاده
20
00:00:46,180 –> 00:00:48,160
می کند، ما
21
00:00:48,160 –> 00:00:50,680
با خراش دادن وب سایت و جمع
22
00:00:50,680 –> 00:00:53,350
آوری داده ها و سپس استفاده از پانداها با سوپ زیبا در پایتون شروع می کنیم.
23
00:00:53,350 –> 00:00:56,500
ماژول n ltk ما را برای
24
00:00:56,500 –> 00:00:58,420
تجزیه و تحلیل احساسات تجزیه و تحلیل و اجرا کنید و سپس آخرین اما
25
00:00:58,420 –> 00:01:00,700
مهمترین matplotlib را برای تجسم
26
00:01:00,700 –> 00:01:02,860
در پایان، این باله را خواهیم داشت. نمودار
27
00:01:02,860 –> 00:01:05,019
آلی که در آن میتوانید مشخص کنید چه شاخصهایی را
28
00:01:05,019 –> 00:01:07,210
میخواهید تجسم کنید و ما میتوانیم
29
00:01:07,210 –> 00:01:08,979
30
00:01:08,979 –> 00:01:11,590
میانگین روزانه همبستگی و تحلیل احساسات را در نحوه انجام آن سهام
31
00:01:11,590 –> 00:01:14,619
بر اساس اخبار مشاهده کنیم.
32
00:01:14,619 –> 00:01:17,049
33
00:01:17,049 –> 00:01:19,719
تجزیه و تحلیل داده
34
00:01:19,719 –> 00:01:21,899
های دستکاری و آخرین اما نه کم اهمیت ترین
35
00:01:21,899 –> 00:01:24,590
تجسم داده ها
36
00:01:24,590 –> 00:01:27,140
هی بچه ها اینجا چه خبر است و
37
00:01:27,140 –> 00:01:29,210
به Codex خوش آمدید در این ویدیو
38
00:01:29,210 –> 00:01:31,130
ما پروژه جدید خود را در مورد
39
00:01:31,130 –> 00:01:32,840
تجزیه و تحلیل احساسات سهام از
40
00:01:32,840 –> 00:01:35,030
اخبار مالی ادامه می دهیم و در این ویدیو ما
41
00:01:35,030 –> 00:01:36,979
از سوپ زیبا برای تجزیه و تحلیل
42
00:01:36,979 –> 00:01:39,020
فین ویز یک شرکت داده های مالی آنلاین استفاده می
43
00:01:39,020 –> 00:01:41,090
کنیم و عناوین
44
00:01:41,090 –> 00:01:42,799
مقالات را بر اساس شاخص های انتخابی خود دریافت می کنیم،
45
00:01:42,799 –> 00:01:45,380
بنابراین
46
00:01:45,380 –> 00:01:47,810
هدف ما در حال حاضر این است که تا
47
00:01:47,810 –> 00:01:50,240
جایی که می توانیم سرفصل های بیشتری را جمع آوری کنیم و بعد از
48
00:01:50,240 –> 00:01:52,759
آن اجرا کنیم. تجزیه و تحلیل احساسات در
49
00:01:52,759 –> 00:01:53,569
متن آن سرفصل ها
50
00:01:53,569 –> 00:01:56,509
Finley دارای
51
00:01:56,509 –> 00:01:58,369
سرفصل های مربوط به هر علامتی است که می توانیم در اینجا جستجو کنیم،
52
00:01:58,369 –> 00:02:01,700
به عنوان مثال در finn viscom می توانم ادامه دهم
53
00:02:01,700 –> 00:02:04,459
و تایپ کنم در آمازون می توانم
54
00:02:04,459 –> 00:02:06,049
تیک تیک را باز کنم و این مجموعه ای
55
00:02:06,049 –> 00:02:08,329
از داده های عددی در مورد درآمد ارزش بازار آنها
56
00:02:08,329 –> 00:02:10,549
همه چیز خوب دارد، اما در پایین
57
00:02:10,549 –> 00:02:12,739
پایین واقعاً می توانم ببینم که اگر
58
00:02:12,739 –> 00:02:15,410
اینجا را بزرگنمایی کنم، می توانم مقالاتی را ببینم که
59
00:02:15,410 –> 00:02:17,540
مرتبط ترین با من هستند. بنابراین این
60
00:02:17,540 –> 00:02:20,810
مقالات دوباره در کد منبع HTML هستند و ما
61
00:02:20,810 –> 00:02:23,000
میتوانیم در اینجا از beautifulsoup برای تجزیه آن
62
00:02:23,000 –> 00:02:25,190
کد و دریافت این مقالههای انتخابی خود استفاده کنیم،
63
00:02:25,190 –> 00:02:27,410
بنابراین اگر من ادامه دهم و منبع صفحه را مشاهده کنم
64
00:02:27,410 –> 00:02:31,639
و اکنون اگر AWS و
65
00:02:31,639 –> 00:02:35,120
فرمول 1 را جستجو کنم، با این مطابقت دارد. متن
66
00:02:35,120 –> 00:02:37,489
دقیقاً در اینجا با این پیوند مطابقت دارد
67
00:02:37,489 –> 00:02:39,920
و بنابراین هدف ما در این ویدیو این است که
68
00:02:39,920 –> 00:02:42,230
این کد HTML را تجزیه کنیم و
69
00:02:42,230 –> 00:02:44,480
عناوین مربوطه و مُهرهای زمانی را
70
00:02:44,480 –> 00:02:47,420
بهمنظور تجزیه و اعمال تجزیه و
71
00:02:47,420 –> 00:02:50,840
تحلیل احساسات بر روی آن بدست
72
00:02:50,840 –> 00:02:52,970
آوریم. اگر از ویرایشگر متفاوتی استفاده میکنید، ما ادامه میدهیم
73
00:02:52,970 –> 00:02:54,500
و یک پروژه کاملاً جدید
74
00:02:54,500 –> 00:02:56,540
و pycharm را باز میکنیم،
75
00:02:56,540 –> 00:02:58,310
با
76
00:02:58,310 –> 00:02:59,900
77
00:02:59,900 –> 00:03:01,549
خیال راحت از هر چیزی که انتخاب میکنید استفاده کنید، من از pycharm استفاده میکنم، زیرا این
78
00:03:01,549 –> 00:03:02,810
چیزی است که چندین سال از آن استفاده میکنم.
79
00:03:02,810 –> 00:03:04,910
و در اینجا من یک پوشه از قبل
80
00:03:04,910 –> 00:03:06,950
ایجاد کرده ام، می خواهم یک فایل پایتون جدید
81
00:03:06,950 –> 00:03:09,889
به نام نمای اصلی ایجاد کنم. اکنون در داخل
82
00:03:09,889 –> 00:03:12,709
این فایل به دو ماژول
83
00:03:12,709 –> 00:03:15,380
نیاز دارم، به ماژول درخواست نیاز دارم و همچنین
84
00:03:15,380 –> 00:03:18,500
به ماژول سوپ زیبای خود نیاز دارم.
85
00:03:18,500 –> 00:03:20,120
میرویم و دو چیز را
86
00:03:20,120 –> 00:03:24,680
از URL وارد میکنیم Lib dot درخواست واردات URL
87
00:03:24,680 –> 00:03:27,530
درخواست کاما را باز میکند و بعد از همه،
88
00:03:27,530 –> 00:03:30,139
ما ادامه میدهیم و از bs4 وارد میکنیم
89
00:03:30,139 –> 00:03:31,760
import beautifulsoup
90
00:03:31,760 –> 00:03:33,829
اکنون مطمئن هستم که یکی از این ماژولها
91
00:03:33,829 –> 00:03:35,360
ممکن است مجبور شوید نصب کنید و اگر این
92
00:03:35,360 –> 00:03:37,120
موردی است که به ترمینال خود بروید و
93
00:03:37,120 –> 00:03:38,220
در داخل
94
00:03:38,220 –> 00:03:39,810
ترمینال میروید و
95
00:03:39,810 –> 00:03:42,120
در اینجا تایپ میکنید Python 3 که
96
00:03:42,120 –> 00:03:43,980
نسخه پایتونی است که من از آن استفاده میکنم، ممکن است
97
00:03:43,980 –> 00:03:45,600
از Python 2 استفاده کنید، در این
98
00:03:45,600 –> 00:03:48,330
مورد Python یا فقط Python 2 و سپس ادامه دهید
99
00:03:48,330 –> 00:03:51,780
و بگویید – M pip install BS 4
100
00:03:51,780 –> 00:03:53,820
پس این دستور چگونه به نظر می رسد که
101
00:03:53,820 –> 00:03:56,490
کامل است و ما می توانیم پایتون 3 – m pip
102
00:03:56,490 –> 00:03:58,620
install BS 4 را ببینیم و اگر این کار جواب داد، ادامه می دهد و
103
00:03:58,620 –> 00:04:00,300
یک سوپ زیبا برای دستگاه شما
104
00:04:00,300 –> 00:04:02,820
نصب می کند. شما
105
00:04:02,820 –> 00:04:04,410
دیگر نباید خطای واردات را ببینید شما می گویید
106
00:04:04,410 –> 00:04:07,740
از BS 4 سوپ زیبا وارد کنید
107
00:04:07,740 –> 00:04:10,260
نکته بعدی URL ما است، بنابراین URL انتخابی ما چیست،
108
00:04:10,260 –> 00:04:10,830
109
00:04:10,830 –> 00:04:13,530
همانطور که می توانید در اینجا ببینید وقتی
110
00:04:13,530 –> 00:04:14,880
نام ticker را ارسال کردیم، به عنوان مثال
111
00:04:14,880 –> 00:04:18,540
آمازون، جلو می رود و به
112
00:04:18,540 –> 00:04:21,209
عنوان یک پارامتر در تیکر ارسال می شود. در خود URL، به
113
00:04:21,209 –> 00:04:24,030
همین سادگی، تنها کاری که باید انجام دهیم این است
114
00:04:24,030 –> 00:04:28,380
که این URL از HTTP fin viscom
115
00:04:28,380 –> 00:04:32,160
نقل قول اسلش یک علامت سوال sh X T برابر است و
116
00:04:32,160 –> 00:04:35,700
سپس میتوانیم هر نوع
117
00:04:35,700 –> 00:04:37,800
علامت علامتی را برای دریافت آن نتایج ارسال کنیم، بنابراین در این
118
00:04:37,800 –> 00:04:39,419
مورد این کار را انجام میدهیم. آمازون که اِما روشن است، در
119
00:04:39,419 –> 00:04:41,520
غیر این صورت اگر کاری مانند AMD انجام دهم،
120
00:04:41,520 –> 00:04:43,680
میتوانم دادههای مربوط به AMD
121
00:04:43,680 –> 00:04:46,590
و غیره را دریافت کنم، بنابراین به اینجا
122
00:04:46,590 –> 00:04:49,380
برمیگردم و متغیر جدیدی را تایپ میکنم
123
00:04:49,380 –> 00:04:52,110
و فعلاً URL این fin V را مینامم
124
00:04:52,110 –> 00:04:54,240
URL اشتباه باله خود را که اکنون کپی کردیم قرار دهید،
125
00:04:54,240 –> 00:04:57,270
در این مورد ممکن است
126
00:04:57,270 –> 00:04:58,169
کمی متفاوت باشد شما یک
127
00:04:58,169 –> 00:04:59,640
نام متغیر متفاوت دارید که کاملاً خوب است، اما
128
00:04:59,640 –> 00:05:02,310
این همان URL خامی است که ما به دنبال آن هستیم
129
00:05:02,310 –> 00:05:04,650
و حالا بیایید ادامه دهیم و
130
00:05:04,650 –> 00:05:06,750
بیایم با لیستی از تیکهایی که
131
00:05:06,750 –> 00:05:08,580
میخواهیم آنها را تجزیه کنیم این پروژه را ادامه میدهم
132
00:05:08,580 –> 00:05:10,470
و فهرستی از
133
00:05:10,470 –> 00:05:13,100
علامتهای متداول ایجاد میکنم که اغلب آنها را بررسی میکنم
134
00:05:13,100 –> 00:05:17,490
از جمله آمازون از جمله AMD، بیایید
135
00:05:17,490 –> 00:05:18,870
پیش برویم و موارد رایج دیگری مانند
136
00:05:18,870 –> 00:05:21,450
فیسبوک را اضافه کنیم و فکر میکنم در حال حاضر خوب است،
137
00:05:21,450 –> 00:05:23,820
بنابراین Amazon AMD و Facebook این
138
00:05:23,820 –> 00:05:26,430
سه هستند شرکتهای خارقالعادهای که میتوانید
139
00:05:26,430 –> 00:05:28,110
به دادههای سهام نگاه کنید و
140
00:05:28,110 –> 00:05:30,870
اخبار مالی را از آنها دریافت کنید، بنابراین در اینجا من ادامه میدهم
141
00:05:30,870 –> 00:05:32,940
و اکنون روی هر یک از این
142
00:05:32,940 –> 00:05:35,490
نشانهها تکرار میکنم و URL fin viz را ایجاد
143
00:05:35,490 –> 00:05:38,700
میکنم که ما ادامه میدهیم و تا چهار
144
00:05:38,700 –> 00:05:41,220
علامت را تجزیه میکنیم. در Tickers من ادامه میدهم و
145
00:05:41,220 –> 00:05:44,130
همینجا میگویم URL من که
146
00:05:44,130 –> 00:05:46,200
نوع تماس واقعیام را
147
00:05:46,200 –> 00:05:48,390
در اینجا تجزیه میکنم، برابر با URL fin biz من
148
00:05:48,390 –> 00:05:51,360
به اضافه هر علامتی است که انتخاب میکنم، بنابراین در اینجا
149
00:05:51,360 –> 00:05:52,150
میتوانید نماد من Amazon AMD را تصور کنید.
150
00:05:52,150 –> 00:05:54,130
و فیس بوک به
151
00:05:54,130 –> 00:05:55,750
تازگی اضافه خواهد شد و
152
00:05:55,750 –> 00:05:58,150
نشانی اینترنتی بازدید از فنلاندی من را تکمیل می کند که می خواهم ادامه دهم
153
00:05:58,150 –> 00:06:00,300
و داده های HTML را از
154
00:06:00,300 –> 00:06:03,490
awesome دریافت کنم اکنون که URL خود را داریم
155
00:06:03,490 –> 00:06:05,350
که با URL Phineas به اضافه
156
00:06:05,350 –> 00:06:07,480
علامت ما تکمیل شده است قدم بعدی ما رفتن است. پیش رو و
157
00:06:07,480 –> 00:06:09,430
درخواست دادهها را از این URL بررسی
158
00:06:09,430 –> 00:06:12,070
میکنیم، اکنون آن را در URL بالا وارد میکنیم و
159
00:06:12,070 –> 00:06:14,170
درخواست میکنیم و این دو ماژول
160
00:06:14,170 –> 00:06:15,970
هستند که میخواهیم جلو برویم و برای
161
00:06:15,970 –> 00:06:18,370
باز کردن این URL تکمیلشده و
162
00:06:18,370 –> 00:06:20,980
درخواست دادههای HTML استفاده کنیم، بنابراین ادامه دهید و یک
163
00:06:20,980 –> 00:06:22,930
متغیر درخواست و در داخل آن
164
00:06:22,930 –> 00:06:25,030
مشخص کنید که از درخواستی استفاده می کنید که ما
165
00:06:25,030 –> 00:06:26,470
از بالا وارد کرده ایم
166
00:06:26,470 –> 00:06:28,480
، پارامتر URL را که برابر
167
00:06:28,480 –> 00:06:30,370
با URLی است که ایجاد کردیم و سپس
168
00:06:30,370 –> 00:06:31,870
در واقع می توانید یک
169
00:06:31,870 –> 00:06:34,390
هدر را مشخص کنید و این هدر به ما اجازه
170
00:06:34,390 –> 00:06:36,850
دسترسی به این دادهها را بدهید اگر
171
00:06:36,850 –> 00:06:39,700
عامل کاربری را مشخص نکردهاید، دسترسی ما ممنوع خواهد بود
172
00:06:39,700 –> 00:06:41,410
و در واقع نمیتوانیم
173
00:06:41,410 –> 00:06:44,860
دادهها را از وبسایت نازک viscom خود بارگیری کنیم،
174
00:06:44,860 –> 00:06:47,380
بنابراین در این عامل کاربر میتوانید
175
00:06:47,380 –> 00:06:49,420
برنامه خود را مشخص کنید. هر
176
00:06:49,420 –> 00:06:50,980
نامی که باشد، اما شما اساساً فقط
177
00:06:50,980 –> 00:06:53,140
تأیید می کنید که هی من با دسترسی به
178
00:06:53,140 –> 00:06:54,700
این وب سایت از این
179
00:06:54,700 –> 00:06:57,160
عامل کاربر خاص به آن دسترسی دارم، در این مورد
180
00:06:57,160 –> 00:06:59,170
می تواند فقط برنامه من باشد، بنابراین این درخواست من است
181
00:06:59,170 –> 00:07:01,510
و اکنون من ادامه می دهم و باز می کنم این
182
00:07:01,510 –> 00:07:04,510
درخواست با گفتن res ponse برابر است با
183
00:07:04,510 –> 00:07:08,140
URL open و سپس این درخواست را ارسال کنید،
184
00:07:08,140 –> 00:07:10,270
بنابراین اکنون میروم و فقط پاسخ را چاپ میکنم
185
00:07:10,270 –> 00:07:11,590
و ببینم چه اتفاقی میافتد
186
00:07:11,590 –> 00:07:13,210
، چیز هیجانانگیزی نخواهیم دید،
187
00:07:13,210 –> 00:07:15,340
اما ادامه میدهیم و فقط یک
188
00:07:15,340 –> 00:07:18,070
مجموعه درخواست را میبینیم. بنابراین ما یک
189
00:07:18,070 –> 00:07:20,590
شی پاسخ HTTP مشتری HTTP داریم و این
190
00:07:20,590 –> 00:07:22,390
چیزی است که beautifulsoup اکنون می
191
00:07:22,390 –> 00:07:25,030
تواند محتوای HTML را دریافت و تجزیه کند،
192
00:07:25,030 –> 00:07:27,220
بنابراین تصور کنید که اکنون
193
00:07:27,220 –> 00:07:29,980
پاسخ کل این وب سایت را با
194
00:07:29,980 –> 00:07:31,750
علامت ارسال شده و دلیل آن داریم.
195
00:07:31,750 –> 00:07:32,950
من این وقفه را اضافه
196
00:07:32,950 –> 00:07:34,270
کردم تا همه تیک تیک ها را مرور نکنم،
197
00:07:34,270 –> 00:07:36,130
زیرا در حال حاضر فقط این کد را آزمایش می
198
00:07:36,130 –> 00:07:37,930
کنیم و کاری که می خواهم ادامه دهم و انجام دهم این
199
00:07:37,930 –> 00:07:40,150
است که این پاسخ را بگیرم و آن
200
00:07:40,150 –> 00:07:42,310
را در یک سوپ زیبا بیاندازم. بنابراین من میخواهم بگویم
201
00:07:42,310 –> 00:07:45,520
HTML کد HTML واقعی من در اینجا برابر است
202
00:07:45,520 –> 00:07:47,980
با پاس زیبای سوپ در
203
00:07:47,980 –> 00:07:50,440
پاسخ HTTP که به تازگی دریافت کردهایم و سپس
204
00:07:50,440 –> 00:07:52,690
ذکر کنم که این یک تجزیهکننده HTML است که
205
00:07:52,690 –> 00:07:55,420
ما از آن استفاده میکنیم، این تنها کاری است که باید انجام دهیم و
206
00:07:55,420 –> 00:07:58,060
حالا اگر چاپ کنم از کد HTML ما
207
00:07:58,060 –> 00:08:00,250
دقیقاً کد منبع را خواهیم دید e که
208
00:08:00,250 –> 00:08:02,560
ما می خواهیم به جلو برویم و از این وب سایت دریافت کنیم،
209
00:08:02,560 –> 00:08:04,480
بنابراین این کد منبع را که
210
00:08:04,480 –> 00:08:05,650
در اینجا می
211
00:08:05,650 –> 00:08:08,530
بینید، اکنون در خروجی ترمینال می بینیم اگر
212
00:08:08,530 –> 00:08:10,270
من جلوتر بروم و کوچک نمایی کنم، اگر
213
00:08:10,270 –> 00:08:12,460
بتوانید به نوعی تجسم کنید که این
214
00:08:12,460 –> 00:08:13,660
مقدار زیاد است. کدهای مختلف و
215
00:08:13,660 –> 00:08:15,580
چیزهای مختلف زیادی در حال انجام است، اما امیدوارم
216
00:08:15,580 –> 00:08:17,530
متوجه شوید که ما اکنون در حال تجزیه
217
00:08:17,530 –> 00:08:20,860
کد HTML از این نقل قول اسلش URL bin viscom هستیم
218
00:08:20,860 –> 00:08:23,320
که در آن پارامتر اکنون آمازون
219
00:08:23,320 –> 00:08:25,990
MD یا فیس بوک است، اکنون من میروم پیش
220
00:08:25,990 –> 00:08:28,180
بروید و به این نوع صفحه برگردید
221
00:08:28,180 –> 00:08:30,550
و AWS و فرمول یک را جستجو کنید و
222
00:08:30,550 –> 00:08:33,640
ببینید واقعاً این داده ها کجا هستند و
223
00:08:33,640 –> 00:08:35,770
اگر نگاهی به اینجا بیندازیم متوجه می شویم که
224
00:08:35,770 –> 00:08:39,039
همه این مقالات در این جدول قرار دارند
225
00:08:39,039 –> 00:08:41,740
و بیایید به جلو برویم و مهربان باشیم.
226
00:08:41,740 –> 00:08:43,120
اگر به کد HTML نگاهی بیاندازیم تا بفهمیم از چه چیزی می توانیم
227
00:08:43,120 –> 00:08:46,839
استفاده کنیم، می توانیم ببینیم که یک جدول
228
00:08:46,839 –> 00:08:49,510
تمام داده ها را در خود دارد و آن جدول دارای شناسه
229
00:08:49,510 –> 00:08:51,940
جدول اخبار است، بنابراین می توانیم انجام دهیم این است که می توانیم
230
00:08:51,940 –> 00:08:54,460
تمام این مقالات خبری
231
00:08:54,460 –> 00:08:57,310
جدول را بر اساس شناسه تجزیه کنیم. بنابراین شناسه جدول اخبار و سپس
232
00:08:57,310 –> 00:08:58,870
فقط این داده ها را همین الان به
233
00:08:58,870 –> 00:09:00,370
دیکشنری t اضافه کنید ما میتوانیم مسیر را تجزیه کنیم،
234
00:09:00,370 –> 00:09:00,760
235
00:09:00,760 –> 00:09:03,070
بنابراین بیایید جلو برویم و همین کار را انجام دهیم،
236
00:09:03,070 –> 00:09:04,060
من میروم و یک فرهنگ لغت در
237
00:09:04,060 –> 00:09:06,660
بالای این حلقه برای حلقه ایجاد میکنم و آن را
238
00:09:06,660 –> 00:09:10,209
دادههای خبری مینامم و در داخل این، من
239
00:09:10,209 –> 00:09:11,470
جلوتر میروم و در واقع شما میدانید بیایید چه کنیم
240
00:09:11,470 –> 00:09:12,790
از یک کلمه بهتر استفاده کنید زیرا اینها جداول هستند،
241
00:09:12,790 –> 00:09:15,130
بیایید برویم و آنها را جداول
242
00:09:15,130 –> 00:09:17,170
243
00:09:17,170 –> 00:09:19,300
244
00:09:19,300 –> 00:09:21,160
245
00:09:21,160 –> 00:09:23,560
بنامیم.
246
00:09:23,560 –> 00:09:27,610
جدول شناسه اخبار
247
00:09:27,610 –> 00:09:30,370
بازدید از شی HTML ما، بنابراین در اینجا
248
00:09:30,370 –> 00:09:32,260
به دنبال شناسه جدول خبری می گردم
249
00:09:32,260 –> 00:09:35,610
و می گویم جدول اخبار من
250
00:09:35,610 –> 00:09:39,160
برابر با HTML تعریف شده است و در اینجا می خواهم
251
00:09:39,160 –> 00:09:41,920
دوباره شناسه جدول خبری خود را دقیقاً مشخص کنم.
252
00:09:41,920 –> 00:09:44,080
همان شناسهای که در کد منبع یافتیم، ادامه دهید
253
00:09:44,080 –> 00:09:46,990
و جدول اخبار را مشخص کنید، بنابراین
254
00:09:46,990 –> 00:09:48,580
کاری که میخواهد انجام دهد این است که
255
00:09:48,580 –> 00:09:52,000
شی HTML کل این جدول را برای ما دریافت میکند، بنابراین
256
00:09:52,000 –> 00:09:54,310
هاوارد تا پایینتر مانند یک
257
00:09:54,310 –> 00:09:56,080
جدول غولپیکر بزرگ با تمام
258
00:09:56,080 –> 00:09:57,910
نتایج متفاوت گسترش مییابد. دقیقا همان چیزی است که ما می
259
00:09:57,910 –> 00:10:00,580
خواهیم ذخیره می کنیم این در حال حاضر از
260
00:10:00,580 –> 00:10:02,830
نظر جدول اخبار فرهنگ لغت ما، بنابراین
261
00:10:02,830 –> 00:10:04,990
میخواهیم در اینجا بگوییم
262
00:10:04,990 –> 00:10:07,930
فرهنگ لغت جداول خبری ما یک کلید دارد که کلید
263
00:10:07,930 –> 00:10:10,510
مقدار تیکدار خواهد بود و باید
264
00:10:10,510 –> 00:10:13,180
با جدول خبری که به تازگی اضافه کردهایم برابر
265
00:10:13,180 –> 00:10:15,190
باشد. ما در حال
266
00:10:15,190 –> 00:10:17,620
حاضر انجام می دهیم این است که این شی جدول را می گیریم و
267
00:10:17,620 –> 00:10:19,180
آن را در اعتیاد ذخیره می کنیم،
268
00:10:19,180 –> 00:10:21,340
بله کمی ناکارآمد است، ما
269
00:10:21,340 –> 00:10:23,110
قطعاً می توانیم
270
00:10:23,110 –> 00:10:25,210
در حال حاضر هر جدول را تجزیه کنیم، اما به
271
00:10:25,210 –> 00:10:27,160
نوعی برای ساده کردن کد و درک آن
272
00:10:27,160 –> 00:10:29,110
آسان تر است. این
273
00:10:29,110 –> 00:10:30,670
جداول را در یک فرهنگ لغت ذخیره کنید و سپس
274
00:10:30,670 –> 00:10:33,100
هر جدول را به صورت جداگانه تجزیه کنید تا حالا که
275
00:10:33,100 –> 00:10:34,660
این کار را انجام دادیم، بیایید جلوتر برویم و
276
00:10:34,660 –> 00:10:37,990
جداول اخبار خود را چاپ کنیم و ببینیم چه خبر است، بنابراین
277
00:10:37,990 –> 00:10:39,190
من ادامه می دهم و این کد را اجرا می کنم و
278
00:10:39,190 –> 00:10:41,080
می توانم یک عبارت کوچک را ببینم. در اینجا
279
00:10:41,080 –> 00:10:42,910
که فقط یک پیام کت و شلوار زیبا می گوید
280
00:10:42,910 –> 00:10:46,480
و اکنون این فرهنگ لغت فقط
281
00:10:46,480 –> 00:10:49,420
جدول نتایج من از صفحه وب را نگه می دارد و
282
00:10:49,420 –> 00:10:52,480
بنابراین همه این پیوندهای TR دوباره TR HTML
283
00:10:52,480 –> 00:10:54,520
مخفف ردیف جدول است همه این
284
00:10:54,520 –> 00:10:57,250
ردیف های جدول با تمام ردیف های جدول مطابقت دارند.
285
00:10:57,250 –> 00:10:58,900
در اینجا میبینیم که هر یک از
286
00:10:58,900 –> 00:11:00,970
اینها یک ردیف جدول است و اکنون میتوانیم ردیف جدول را تجزیه
287
00:11:00,970 –> 00:11:03,460
کنیم تا متن هر یک از
288
00:11:03,460 –> 00:11:06,910
این سایتها را دریافت کنیم سلام بچهها اینجا
289
00:11:06,910 –> 00:11:08,740
و به Codex خوش آمدید در این
290
00:11:08,740 –> 00:11:10,930
ویدیو، ما به تجزیه و تحلیل احساسات خود ادامه میدهیم.
291
00:11:10,930 –> 00:11:13,000
از سهام از اخبار مالی
292
00:11:13,000 –> 00:11:15,100
و در این ویدیو ما ادامه می دهیم
293
00:11:15,100 –> 00:11:17,950
و داده هایی را که از زیبای سوپ به دست آورده ایم تجزیه و تحلیل می
294
00:11:17,950 –> 00:11:19,900
کنیم و آن را در
295
00:11:19,900 –> 00:11:21,790
قالبی قابل درک قرار می دهیم که بتوانیم
296
00:11:21,790 –> 00:11:24,760
عنوان مهر زمانی این
297
00:11:24,760 –> 00:11:26,770
مقالات خبری را استخراج کنیم و در نهایت
298
00:11:26,770 –> 00:11:29,410
ما را اعمال کنیم. تجزیه و تحلیل احساسات در مورد، بنابراین هدف
299
00:11:29,410 –> 00:11:31,270
این ویدیو بسیار ساده است برای تکرار
300
00:11:31,270 –> 00:11:33,250
روی تمام این ردیفهای جدول که
301
00:11:33,250 –> 00:11:35,800
میتوانیم در مجموعه دادههای خود ببینیم و
302
00:11:35,800 –> 00:11:38,710
مقادیر نه تنها مهر زمانی را دریافت کنیم، بلکه اگر
303
00:11:38,710 –> 00:11:40,810
میتوانم اینجا پیمایش کنم، اجازه دهید ادامه دهم و
304
00:11:40,810 –> 00:11:42,790
حرکت کنم. این یک مقدار سریعتر ما
305
00:11:42,790 –> 00:11:44,980
href لینک و سپس متن
306
00:11:44,980 –> 00:11:47,530
هر مقاله در جدول را داریم،
307
00:11:47,530 –> 00:11:49,720
بنابراین بیایید جلوتر برویم و ابتدا بفهمیم
308
00:11:49,720 –> 00:11:51,310
که چگونه میتوانیم این کار را با یک کیس پایه ساده انجام دهیم
309
00:11:51,310 –> 00:11:53,380
و بعد از آن به جلو میرویم.
310
00:11:53,380 –> 00:11:55,690
و گسترش به یک تابع جهانی تر،
311
00:11:55,690 –> 00:11:57,790
بنابراین در حال حاضر من می خواهم
312
00:11:57,790 –> 00:12:00,580
به اولین نوع فهرست خود دسترسی پیدا کنم که
313
00:12:00,580 –> 00:12:03,850
جداول اخبار آمازون است به عنوان یک مجموعه داده پخش، بنابراین
314
00:12:03,850 –> 00:12:05,560
می خواهم ادامه دهم و بگویم که
315
00:12:05,560 –> 00:12:08,200
داده های آمازون من با من برابر است.
316
00:12:08,200 –> 00:12:11,320
جداول اخبار آمازون و حالا من میروم
317
00:12:11,320 –> 00:12:14,020
و تمام ردیفهای جدول
318
00:12:14,020 –> 00:12:17,320
مربوط به این شی HTML جدول را پیدا
319
00:12:17,320 –> 00:12:19,450
میکنم، بنابراین یک عملکرد بسیار جالب find all وجود دارد
320
00:12:19,450 –> 00:12:21,250
که beautifulsoup دارد و کاری که میتوانم
321
00:12:21,250 –> 00:12:24,460
انجام دهم این است که بگویم آمازون من
322
00:12:24,460 –> 00:12:28,600
rose برابر است با آمازون beta dot find all
323
00:12:28,600 –> 00:12:30,760
و سپس در اینجا من فقط از تگ HTML TR عبور می کنم
324
00:12:30,760 –> 00:12:32,060
325
00:12:32,060 –> 00:12:34,400
و بنابراین کاری که می خواهد انجام دهد این است که
326
00:12:34,400 –> 00:12:37,550
لیستی از تمام عناصر مختلف TR
327
00:12:37,550 –> 00:12:40,040
در داخل شی HTML را که من به تازگی آن را ارسال کرده ام به من بدهم.
328
00:12:40,040 –> 00:12:42,710
در این مورد، من در
329
00:12:42,710 –> 00:12:44,900
جدول همه مقالات خبری مربوطه گذر کردم،
330
00:12:44,900 –> 00:12:47,210
بنابراین آنچه که می توانم ادامه دهم و انجام دهم این است
331
00:12:47,210 –> 00:12:49,310
که کباب آمازون خود را چاپ کنم فقط برای
332
00:12:49,310 –> 00:12:51,800
اینکه خلاصه ای سریع از آنچه در
333
00:12:51,800 –> 00:12:53,390
اینجا اتفاق می افتد و آنچه در اینجا اتفاق می افتد به شما ارائه دهم،
334
00:12:53,390 –> 00:12:55,610
بنابراین اگر ادامه دهم و شیفت آرت
335
00:12:55,610 –> 00:12:57,260
را کنترل کنید، این کار ادامه می یابد و
336
00:12:57,260 –> 00:12:59,300
وب سایت a را تجزیه می کند و اکنون من یک لیست مانند
337
00:12:59,300 –> 00:13:03,080
شی دارم که در آن تمام TRS خود را در یک
338
00:13:03,080 –> 00:13:05,030
جناحی مانند کاما قرار داده ام و اکنون می توانم ادامه دهم
339
00:13:05,030 –> 00:13:07,460
و روی این ردیف ها تکرار
340
00:13:07,460 –> 00:13:10,580
کنم تا مقادیر را بدست بیاورم، بنابراین برای نمایش
341
00:13:10,580 –> 00:13:12,410
سریع آن و احساس راحتی کنید که فقط
342
00:13:12,410 –> 00:13:13,700
شما را دنبال کنید. لازم نیست این کد را کپی کنید،
343
00:13:13,700 –> 00:13:16,580
این اختیاری تر است فقط برای
344
00:13:16,580 –> 00:13:19,520
درک داده های ردیف ها، بنابراین ما تمام
345
00:13:19,520 –> 00:13:21,770
ردیف های جدول جدول خود را داریم و اکنون کاری که من
346
00:13:21,770 –> 00:13:23,030
می خواهم انجام دهم این است که روی
347
00:13:23,030 –> 00:13:26,930
این ردیف های جدول تکرار کنم تا برای نمایه سازی ردیف کاما
348
00:13:26,930 –> 00:13:31,040
در enumerate ردیفهای آمازون، بنابراین دوباره
349
00:13:31,040 –> 00:13:32,720
تابع enumerate فهرست
350
00:13:32,720 –> 00:13:35,240
و شی هر مورد از فهرست را به من میدهد یا
351
00:13:35,240 –> 00:13:37,190
من هر فهرستی دارم و از طریق
352
00:13:37,190 –> 00:13:39,290
تک تک شیهایی که میخواهم ادامه دهم
353
00:13:39,290 –> 00:13:42,650
و متن آنچه را که دقیقاً دنبال میکنم، تکرار کنم.
354
00:13:42,650 –> 00:13:44,630
برای اینجا، بنابراین متوجه شدم
355
00:13:44,630 –> 00:13:47,750
که یک برچسب در داخل TR من وجود دارد و اگر
356
00:13:47,750 –> 00:13:49,130
به سمت راست حرکت کنم، میتوانم ببینم که
357
00:13:49,130 –> 00:13:52,010
داخل آن یک برچسب متن
358
00:13:52,010 –> 00:13:55,190
واقعی مقاله من است، بنابراین میتوانم ادامه دهم و
359
00:13:55,190 –> 00:13:58,250
در اینجا بگویم که عنوان
360
00:13:58,250 –> 00:14:00,980
با ردیف جدول من برابر خواهد شد، بنابراین در این مورد
361
00:14:00,980 –> 00:14:03,640
ردیف و سپس من می روم na به
362
00:14:03,640 –> 00:14:06,170
صفت a یا تگ a در داخل آن دسترسی پیدا کنید
363
00:14:06,170 –> 00:14:08,510
و سپس متن تگ انکر خود را دریافت می کنم،
364
00:14:08,510 –> 00:14:10,850
بنابراین تمام چیزی که در اینجا می گویم این است
365
00:14:10,850 –> 00:14:13,790
که به دنبال تگ لنگر
366
00:14:13,790 –> 00:14:16,100
داخل ردیف جدول و این تگ لنگر باشید که من
367
00:14:16,100 –> 00:14:17,930
می توانم همین جا را ببینم، ادامه
368
00:14:17,930 –> 00:14:20,330
بده و متنی را که در داخل است
369
00:14:20,330 –> 00:14:22,280
به من بده. بنابراین باید این متن را همین جا به من بدهد
370
00:14:22,280 –> 00:14:25,160
و سپس می توانم ادامه دهم و به
371
00:14:25,160 –> 00:14:27,110
کارایی که این کار می کند نگاهی بیندازم، بنابراین اجازه دهید ادامه دهم
372
00:14:27,110 –> 00:14:28,610
و فقط عنوان را چاپ کنم در
373
00:14:28,610 –> 00:14:30,380
حال حاضر فقط برای نشان دادن یک مثال سریع از
374
00:14:30,380 –> 00:14:31,820
آنچه اتفاق می افتد، بنابراین من می خواهم ادامه دهم
375
00:14:31,820 –> 00:14:34,070
و کد HTML را تجزیه و تحلیل کنم و
376
00:14:34,070 –> 00:14:37,190
ببینم که اکنون می توانم متن را
377
00:14:37,190 –> 00:14:39,770
به متن هر مقاله از
378
00:14:39,770 –> 00:14:43,040
ردیف جدول داخل آن برسانم. جدول عظیم من حالا
379
00:14:43,040 –> 00:14:45,500
بیایید به عقب برگردیم و ببینیم که چگونه می
380
00:14:45,500 –> 00:14:47,840
توانیم تاریخ یا مهر زمانی را در اینجا دریافت کنیم،
381
00:14:47,840 –> 00:14:49,790
بنابراین من به کد HTML برمی گردم
382
00:14:49,790 –> 00:14:51,920
و بیایید نگاهی به آنچه در حال
383
00:14:51,920 –> 00:14:54,560
رخ دادن است داشته باشیم و بلافاصله
384
00:14:54,560 –> 00:14:57,230
متوجه این نوع مانند شوم. چگونه تگ لنگر خود را
385
00:14:57,230 –> 00:14:59,420
داشتیم و در داخل تگ انکر
386
00:14:59,420 –> 00:15:01,520
متن مقاله I’m noti را داشتیم با
387
00:15:01,520 –> 00:15:04,640
بیان اینکه ما این تگ TD را داریم و در
388
00:15:04,640 –> 00:15:07,990
داخل تگ TD، من مُهر زمانی واقعی را می بینم
389
00:15:07,990 –> 00:15:10,490
و بنابراین کاری که می
390
00:15:10,490 –> 00:15:13,780
توانم انجام دهم این است که عنصر TD را جستجو کرده
391
00:15:13,780 –> 00:15:16,490
و متن داخل عنصر TD
392
00:15:16,490 –> 00:15:18,560
را جستجو کنم تا مهر زمانی را دریافت کنم. از دادههای ما
393
00:15:18,560 –> 00:15:20,720
بسیار ساده به نظر میرسد، درست
394
00:15:20,720 –> 00:15:23,000
مثل عنوانی که داریم، میتوانم بگویم مُهر
395
00:15:23,000 –> 00:15:26,330
زمانی من باید با Rho TD
396
00:15:26,330 –> 00:15:28,760
dot txt برابر باشد، بنابراین اکنون دوباره به دنبال
397
00:15:28,760 –> 00:15:30,680
عنصر TD در دریافت متن آن
398
00:15:30,680 –> 00:15:32,900
هستیم و اکنون به خاطر سادگی. من
399
00:15:32,900 –> 00:15:34,370
فقط ادامه میدهم و میگویم printstamp
400
00:15:34,370 –> 00:15:38,510
plus و سپس یک فاصله و سپس عنوان، پس
401
00:15:38,510 –> 00:15:40,580
بیایید ادامه دهیم و این را اجرا کنیم و
402
00:15:40,580 –> 00:15:43,780
ببینیم آنچه به دست میآوریم کد ما است و
403
00:15:43,780 –> 00:15:46,310
عالی است.
404
00:15:46,310 –> 00:15:48,650
405
00:15:48,650 –> 00:15:50,690
زمانی که هر مقاله منتشر شد، من
406
00:15:50,690 –> 00:15:53,180
همچنین تاریخ توسعه را برای
407
00:15:53,180 –> 00:15:55,430
شروع یک روز جدید دارم، بنابراین قدم بعدی این است
408
00:15:55,430 –> 00:15:57,190
که ادامه دهید و این کد را بردارید و
409
00:15:57,190 –> 00:15:59,870
آن را مدولار کنید تا برای هر علامتی
410
00:15:59,870 –> 00:16:02,090
در مجموعه دادههای شما در حال حاضر کار
411
00:16:02,090 –> 00:16:03,950
کند. بسیار تست متمرکز آن بیشتر از
412
00:16:03,950 –> 00:16:06,170
فقط t است آمازون را بررسی می کنیم و مطمئن
413
00:16:06,170 –> 00:16:08,150
می شویم که داده ها کار می کند، بنابراین بیایید
414
00:16:08,150 –> 00:16:09,770
جلو برویم و اخبار
415
00:16:09,770 –> 00:16:12,320
مربوط به این نوع اخبار را تکرار
416
00:16:12,320 –> 00:16:14,060
کنیم تا پر کنیم و سپس بیایید
417
00:16:14,060 –> 00:16:16,640
جلو برویم و داده ها را خراش دهیم و به یک جدید اضافه کنیم.
418
00:16:16,640 –> 00:16:19,880
لیست آیتم ها پس بیایید ادامه دهیم
419
00:16:19,880 –> 00:16:22,100
و آن کد را درست در اینجا اجرا کنیم،
420
00:16:22,100 –> 00:16:23,810
من یک ساختار داده جدید
421
00:16:23,810 –> 00:16:26,030
به نام داده های تجزیه شده ایجاد می کنم و این
422
00:16:26,030 –> 00:16:28,550
یک شی لیست خواهد بود و هدف من در حال حاضر این است
423
00:16:28,550 –> 00:16:32,570
که فقط چندین نوع لیست
424
00:16:32,570 –> 00:16:34,580
لیست از لیست ها ایجاد کنم. یا دقیقاً مانند فهرستهایی در
425
00:16:34,580 –> 00:16:36,650
داخل این مجموعه داده که مطابق با
426
00:16:36,650 –> 00:16:40,340
تاریخ من زمان من و عنوان
427
00:16:40,340 –> 00:16:42,680
مقاله من است، بنابراین اکنون ما خیلی
428
00:16:42,680 –> 00:16:44,720
نگران ذخیره آنها بر اساس تیکر نیستیم، ما
429
00:16:44,720 –> 00:16:46,280
فقط یک ذخیرهسازی تمام دادههایی هستیم که میتوانیم
430
00:16:46,280 –> 00:16:48,440
همه علامتهای مختلف ما را در
431
00:16:48,440 –> 00:16:51,080
داخل تنها یک آرایه عظیم دریافت کنید، بنابراین بیایید به
432
00:16:51,080 –> 00:16:53,510
فرهنگ لغت
433
00:16:53,510 –> 00:16:55,070
خود بپردازیم، فرهنگ لغت ما در اینجا جداول اخبار نامیده میشود،
434
00:16:55,070 –> 00:16:57,970
بنابراین برای یک فایل یا برای یک
435
00:16:57,970 –> 00:16:59,300
ویرگول تیکتیک
436
00:16:59,300 –> 00:17:03,830
جدول اخبار در جدولهای خبری من، آیتمها، بنابراین
437
00:17:03,830 –> 00:17:05,540
من تکرار میکنم روی جفت کلید و مقدار
438
00:17:05,540 –> 00:17:08,630
fo هر مقدار کلیدی در
439
00:17:08,630 –> 00:17:10,609
فرهنگ لغت جداول خبری من، کاری که
440
00:17:10,609 –> 00:17:11,900
میخواهم انجام دهم، کپی کردن همان
441
00:17:11,900 –> 00:17:14,030
کدی است که در بالا در هنگام
442
00:17:14,030 –> 00:17:17,030
آزمایش آن داشتیم که برای هر
443
00:17:17,030 –> 00:17:20,839
نوع ردیف برای همه ردیفهای جدول خبری بود.
444
00:17:20,839 –> 00:17:24,920
نقطه همه چیز را پیدا کنید و ما در اینجا همه
445
00:17:24,920 –> 00:17:27,949
TRS را درست برای همه ردیفها
446
00:17:27,949 –> 00:17:29,780
پیدا میکنیم که میتوانیم کارهایی که انجام میدهیم را پیدا کنیم، سعی
447
00:17:29,780 –> 00:17:32,390
میکنیم چندین چیز را در اینجا خراش دهیم، اولین
448
00:17:32,390 –> 00:17:35,660
چیزی که میتوانیم عنوان خود را خراش دهیم تا
449
00:17:35,660 –> 00:17:37,970
بدانیم عنوان مقاله ما
450
00:17:37,970 –> 00:17:42,260
برابر است با هر ردیفی که
451
00:17:42,260 –> 00:17:43,250
متاسفیم باید این را
452
00:17:43,250 –> 00:17:44,720
به صورت تکی درآورم زیرا ما در حال تکرار روی
453
00:17:44,720 –> 00:17:46,730
هر سطر هستیم بنابراین عنوان در اینجا باید برابر باشد
454
00:17:46,730 –> 00:17:50,240
با Rho dot تگ لنگر درست متن را دریافت کنید
455
00:17:50,240 –> 00:17:52,520
بنابراین چیزی بسیار ساده و
456
00:17:52,520 –> 00:17:55,460
سپس چیز بعدی این است که پیش برویم و
457
00:17:55,460 –> 00:17:58,790
نوع زمان خود را دریافت کنیم، بنابراین
458
00:17:58,790 –> 00:18:01,220
مُهر زمانی در اینجا میتواند دو
459
00:18:01,220 –> 00:18:03,290
قالب باشد، میتواند از یک مرحله زمانی منفرد
460
00:18:03,290 –> 00:18:05,570
مانند این یا یک مهر زمانی با
461
00:18:05,570 –> 00:18:07,370
تاریخ باشد، بنابراین بیایید جلو برویم و
462
00:18:07,370 –> 00:18:09,620
هر دو مورد را اجرا کنیم. و
463
00:18:09,620 –> 00:18:13,240
بگوییم تاریخ ما g است onna برابر است با Rho
464
00:18:13,240 –> 00:18:18,830
TD dot text split dot و کاری که این
465
00:18:18,830 –> 00:18:21,950
کار انجام میشود این است که متن ما را
466
00:18:21,950 –> 00:18:25,910
بر اساس یک فاصله تقسیم کنیم، بنابراین در
467
00:18:25,910 –> 00:18:28,419
اینجا میگوییم که این را به بخشهایی تقسیم کنید
468
00:18:28,419 –> 00:18:30,980
و ادامه میدهیم و
469
00:18:30,980 –> 00:18:32,870
ببینید که اگر طول این فقط
470
00:18:32,870 –> 00:18:35,330
یک باشد، به طور قطع می دانیم که این
471
00:18:35,330 –> 00:18:37,160
فقط یک گام زمانی است، اما اگر
472
00:18:37,160 –> 00:18:39,200
طول این تاریخ بیشتر از یک
473
00:18:39,200 –> 00:18:41,300
باشد، در واقع می دانیم که در
474
00:18:41,300 –> 00:18:43,580
اینجا چندین مقدار وجود دارد، اولین مقدار در
475
00:18:43,580 –> 00:18:45,470
حال رفتن است. اینکه تاریخ ما باشد و دومین
476
00:18:45,470 –> 00:18:48,140
مقدار زمان ما خواهد بود، بنابراین ما میتوانیم همین جا این
477
00:18:48,140 –> 00:18:50,690
کار را انجام دهیم
478
00:18:50,690 –> 00:18:52,250
و ممکن است متوجه شوید که من از دریافت متن به جای متن استفاده میکنم.
479
00:18:52,250 –> 00:18:53,990
480
00:18:53,990 –> 00:18:56,929
481
00:18:56,929 –> 00:18:58,730
ما همان نتایج را دریافت می کنیم، اما در اینجا می
482
00:18:58,730 –> 00:19:00,770
خواهم بگویم که اگر طول تاریخ من
483
00:19:00,770 –> 00:19:04,400
برابر با 1 باشد، به این معنی است که ما
484
00:19:04,400 –> 00:19:06,440
فقط مهر زمانی را داریم، پس من ادامه می دهم
485
00:19:06,440 –> 00:19:08,240
و می گویم که داده های زمانی
486
00:19:08,240 –> 00:19:11,840
برابر است. به تاریخ من و
487
00:19:11,840 –> 00:19:13,370
من میروم و اولین حرف را میزنم،
488
00:19:13,370 –> 00:19:14,960
بنابراین میرویم و بر اساس آن از هم جدا میشویم
489
00:19:14,960 –> 00:19:17,539
ما تاریخ را تقسیم کردهایم و
490
00:19:17,539 –> 00:19:19,279
میگوییم که اولین مورد، بنابراین اولین
491
00:19:19,279 –> 00:19:21,499
مورد اینجا باید زمان من باشد و
492
00:19:21,499 –> 00:19:24,320
در غیر این صورت اگر بیش از یک
493
00:19:24,320 –> 00:19:26,509
جزء داشته باشیم، چیزی شبیه به ژوئن 1829،
494
00:19:26,509 –> 00:19:29,600
ساعت 28 بعد از ظهر. سپس ما دو مؤلفه
495
00:19:29,600 –> 00:19:31,730
داریم، تاریخ و زمان را داریم، بنابراین من ادامه میدهم
496
00:19:31,730 –> 00:19:33,499
و میگویم که
497
00:19:33,499 –> 00:19:36,799
تاریخ من باید برابر با من
498
00:19:36,799 –> 00:19:38,379
499
00:19:38,379 –> 00:19:42,080
باشد. میتوانم
500
00:19:42,080 –> 00:19:44,720
بین تاریخ و دادههای تاریخ واقعی تمایز قائل
501
00:19:44,720 –> 00:19:46,610
شوم و میخواهم بگویم که دادههای تاریخ من
502
00:19:46,610 –> 00:19:48,980
صفر خواهد بود و زمان من
503
00:19:48,980 –> 00:19:51,289
دادههای تاریخ یک خواهد بود، بنابراین امیدوارم که منطقی باشد
504
00:19:51,289 –> 00:19:53,059
تمام کاری که ما انجام میدهیم این است که این
505
00:19:53,059 –> 00:19:54,919
متن را به درستی دریافت میکنیم. در اینجا و ما
506
00:19:54,919 –> 00:19:57,619
آن را بر اساس فاصله ها تقسیم می کنیم اگر
507
00:19:57,619 –> 00:19:59,749
دو مؤلفه وجود دارد یا اگر اساساً
508
00:19:59,749 –> 00:20:01,789
فقط یک مؤلفه وجود ندارد که می دانیم
509
00:20:01,789 –> 00:20:03,379
در اینجا با دو مؤلفه سروکار داریم
510
00:20:03,379 –> 00:20:04,940
که اولی تاریخ است و
511
00:20:04,940 –> 00:20:07,369
دومی یک زمان است در غیر این صورت اگر
512
00:20:07,369 –> 00:20:09,139
طول برابر با یک است، پس میدانم که ما فقط
513
00:20:09,139 –> 00:20:10,519
با یک مؤلفه سروکار داریم و آن هم
514
00:20:10,519 –> 00:20:12,830
این مهر زمانی است که دادههای تاریخ زمان
515
00:20:12,830 –> 00:20:15,710
صفر است، بنابراین اکنون که عنوان یا
516
00:20:15,710 –> 00:20:17,690
زمان و تاریخ خود را داریم آخرین مورد علامت ما است
517
00:20:17,690 –> 00:20:19,610
و آن را داریم. درست در اینجا
518
00:20:19,610 –> 00:20:21,110
از تکرار در میان موارد
519
00:20:21,110 –> 00:20:23,480
و غیره تنها چیزی که میخواهم بگویم این است که برای هر یک
520
00:20:23,480 –> 00:20:25,610
از این ردیفها ادامه میدهیم و
521
00:20:25,610 –> 00:20:29,690
میگوییم دادههای تجزیه آن را تجزیه کرده و نقطه اضافه
522
00:20:29,690 –> 00:20:31,999
میکنیم و ما در داخل این
523
00:20:31,999 –> 00:20:36,679
علامت تاریخ، زمان و
524
00:20:36,679 –> 00:20:39,470
متن را اضافه میکنیم، بنابراین دوباره همه ما
525
00:20:39,470 –> 00:20:41,330
ما می گوییم متاسفم که عنوان متن را دریافت کردم
526
00:20:41,330 –> 00:20:43,909
و می گوییم که اگر تاریخ
527
00:20:43,909 –> 00:20:46,610
وجود داشته باشد، ادامه می دهیم و آن
528
00:20:46,610 –> 00:20:49,399
روز را در زمان در عنوان و غیره اضافه می کنیم و اگر
529
00:20:49,399 –> 00:20:51,619
این موضوع باعث نگرانی نیست. و در اینجا من
530
00:20:51,619 –> 00:20:53,090
به تاریخ صدور کوچکی که تعریف نشده است می
531
00:20:53,090 –> 00:20:54,379
روم زیرا باید داده های تاریخ را
532
00:20:54,379 –> 00:20:57,529
با آن جایگزین کنم، ادامه دهید و
533
00:20:57,529 –> 00:21:00,139
این را ذخیره کنید و در پایین آن
534
00:21:00,139 –> 00:21:03,320
داده ها را تجزیه کنید و بیایید ببینیم چه چیزی به دست می آوریم پس
535
00:21:03,320 –> 00:21:07,279
بیایید این کد را اجرا کنیم و من تیک تیک ما را می بینم
536
00:21:07,279 –> 00:21:09,649
و بیایید نگاهی بیندازیم، بنابراین ما در
537
00:21:09,649 –> 00:21:12,110
اینجا اولین ارزش خود را در آمازون داریم تاریخ
538
00:21:12,110 –> 00:21:15,289
23 ژوئن 20 مُهر زمانی 409 با
539
00:21:15,289 –> 00:21:19,869
نوعی خارجی، من معتقدم پایان nbsp
540
00:21:19,869 –> 00:21:22,039
که ما می توانیم جلو برویم و مسیر را حذف کنیم
541
00:21:22,039 –> 00:21:23,509
که خوب است و این بود مقاله اول ما
542
00:21:23,509 –> 00:21:25,100
بیایید نگاهی به مقاله دوم
543
00:21:25,100 –> 00:21:26,750
آمازون بیندازیم 23 ژوئن
544
00:21:26,750 –> 00:21:30,380
یک و 30 ژوئن آمازون 23 12:46 این
545
00:21:30,380 –> 00:21:32,720
یک عنوان فوق العاده است، بنابراین کاری که ما در
546
00:21:32,720 –> 00:21:34,940
این ویدئو انجام دادیم این است که مجموعه داده های خود
547
00:21:34,940 –> 00:21:37,940
مجموعه بزرگ جداول و
5