در این مطلب، ویدئو تحلیل احساسات توییتر با استفاده از پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:52:54
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:01,890
سلام به همه و به این ویدیو
2
00:00:01,890 –> 00:00:03,510
در مورد زبان برنامه نویسی پایتون و
3
00:00:03,510 –> 00:00:05,700
یادگیری ماشین خوش آمدید، بنابراین در این ویدیو ما
4
00:00:05,700 –> 00:00:07,500
قصد داریم تا
5
00:00:07,500 –> 00:00:09,870
تجزیه و تحلیل احساسات توییتر را انجام دهیم در حال حاضر من در
6
00:00:09,870 –> 00:00:11,580
وب سایت Google به نام تحقیقات مشارکتی Google
7
00:00:11,580 –> 00:00:13,380
com هستم زیرا دریافت آن را واقعا آسان می
8
00:00:13,380 –> 00:00:15,120
کند. برنامه نویسی و پایتون را شروع کرده اید و
9
00:00:15,120 –> 00:00:16,800
این بدان معناست که شما مجبور نیستید
10
00:00:16,800 –> 00:00:18,600
آن را روی رایانه خود نصب کنید،
11
00:00:18,600 –> 00:00:20,430
فقط می توانید به این وب سایت بروید و با استفاده از
12
00:00:20,430 –> 00:00:22,080
حساب Google خود وارد شوید و
13
00:00:22,080 –> 00:00:24,119
نوشتن کد پایتون خود را شروع کنید، پس بیایید ادامه دهیم
14
00:00:24,119 –> 00:00:25,140
و نوشتن برنامه خود را شروع کنیم.
15
00:00:25,140 –> 00:00:26,939
بنابراین اولین کاری که
16
00:00:26,939 –> 00:00:28,349
می خواهید انجام دهید این است که روی فایل کلیک کنید و
17
00:00:28,349 –> 00:00:30,840
سپس روی نوت بوک جدید Python 3 کلیک کنید و
18
00:00:30,840 –> 00:00:35,420
یک تب جدید برای شما باز می شود و یک سلول جدید
19
00:00:35,420 –> 00:00:37,860
اکنون در این سلول است.
20
00:00:37,860 –> 00:00:40,260
21
00:00:40,260 –> 00:00:42,000
من هر منطقی را می نویسم، پس بیایید این کار را اکنون در نظرات انجام دهیم،
22
00:00:42,000 –> 00:00:45,020
بنابراین من فقط
23
00:00:45,020 –> 00:00:49,309
توضیحات را تایپ می کنم و این یک
24
00:00:49,309 –> 00:00:58,230
برنامه تجزیه و تحلیل احساسات است که
25
00:00:58,230 –> 00:01:06,680
توییت های دریافت شده از توییتر را با استفاده از
26
00:01:06,680 –> 00:01:11,070
پایتون تجزیه می کند. تبلیغ کنید و
27
00:01:11,070 –> 00:01:13,290
با کلیک کردن روی آن دکمه کد، یک سلول جدید ایجاد کنید
28
00:01:13,290 –> 00:01:16,560
و در این سلول،
29
00:01:16,560 –> 00:01:18,689
کتابخانههایی را که قرار است
30
00:01:18,689 –> 00:01:20,340
در این برنامه استفاده کنیم، وارد میکنم، بنابراین میخواهم
31
00:01:20,340 –> 00:01:28,530
PI توییت و از وبلاگ متن وارد کنم.
32
00:01:28,530 –> 00:01:34,950
رفتن به وارد کردن وبلاگ متن بعدی از
33
00:01:34,950 –> 00:01:40,680
ابر کلمه من می خواهم کلمه ابر را وارد
34
00:01:40,680 –> 00:01:43,649
کنم و بعد می خواهم پانداها را به عنوان PD
35
00:01:43,649 –> 00:01:47,369
وارد کنم و numpy را به عنوان MP وارد کنم.
36
00:01:47,369 –> 00:01:50,490
عبارات منظم را
37
00:01:50,490 –> 00:01:53,430
e و آخرین هستند اما نه حداقل من قصد دارم
38
00:01:53,430 –> 00:01:58,469
آن طرح نقطه زنده را وارد کنم، SPL T
39
00:01:58,469 –> 00:02:01,649
و ما به طرح خود یک سبک می دهیم، بنابراین از
40
00:02:01,649 –> 00:02:05,280
سبک نقطه PLT استفاده کنید و سپس
41
00:02:05,280 –> 00:02:09,598
از سبک 538 استفاده می کنیم که می خواهیم
42
00:02:09,598 –> 00:02:10,830
این سلول را اجرا کنیم. با کلیک بر روی این دکمه
43
00:02:10,830 –> 00:02:12,780
در اینجا به سمت چپ و ما فقط بررسی
44
00:02:12,780 –> 00:02:13,920
می کنیم تا مطمئن شویم
45
00:02:13,920 –> 00:02:16,380
که هیچ خطایی در این
46
00:02:16,380 –> 00:02:18,540
کتابخانه ها وجود ندارد و به نظر می رسد که
47
00:02:18,540 –> 00:02:19,950
اینطور نیست، بنابراین بیایید به جلو برویم و این را به
48
00:02:19,950 –> 00:02:24,360
بالا پیمایش کنیم و اکنون یک سلول جدید ایجاد کنیم.
49
00:02:24,360 –> 00:02:28,319
ایده این برنامه این است که چند
50
00:02:28,319 –> 00:02:30,600
توییت بگیرید و سپس
51
00:02:30,600 –> 00:02:32,850
احساسات آن توییت ها را دریافت کنید، اما قبل از
52
00:02:32,850 –> 00:02:35,430
انجام این کار شما به یک
53
00:02:35,430 –> 00:02:38,250
حساب کاربری توییتر نیاز دارید و باید
54
00:02:38,250 –> 00:02:40,739
یک برنامه توییتر داشته باشید، من از قبل دارم،
55
00:02:40,739 –> 00:02:43,230
هر دو را در
56
00:02:43,230 –> 00:02:47,130
توضیحات نشان می دهم که چگونه این کار را انجام دهم و
57
00:02:47,130 –> 00:02:52,019
کلیدهای برنامه توییتر خود را قرار داده ام.
58
00:02:52,019 –> 00:02:55,140
در یک فایل و ما به
59
00:02:55,140 –> 00:02:57,840
این کلیدها برای احراز هویت در توییتر نیاز داریم، بنابراین
60
00:02:57,840 –> 00:02:59,810
من آن فایل را بارگیری میکنم و سپس
61
00:02:59,810 –> 00:03:04,140
آن کلیدها را استخراج میکنم، بنابراین چون در
62
00:03:04,140 –> 00:03:06,420
وبسایت Google هستم باید از
63
00:03:06,420 –> 00:03:08,640
کتابخانه Google برای بارگیری دادهها استفاده کنم و این
64
00:03:08,640 –> 00:03:10,260
دقیقاً همان چیزی است که ما انجام میدهیم. ‘می خواهم اینجا را انجام دهم، بنابراین
65
00:03:10,260 –> 00:03:14,280
در اینجا وقتی داده ها را تایپ کنید بارگذاری کنید، بنابراین از
66
00:03:14,280 –> 00:03:18,829
Google colab من می خواهم فایل ها را وارد
67
00:03:18,829 –> 00:03:21,650
کنم و یک متغیر به نام آپلود آن ایجاد می کنم
68
00:03:21,650 –> 00:03:28,160
و چه مقدار برابر است با
69
00:03:28,160 –> 00:03:32,820
شروع آپلود فایل خوب است و اجازه دهید
70
00:03:32,820 –> 00:03:37,650
این سلول را اجرا کنیم. خوب بیایید یک بار دیگر آن را اجرا کنیم،
71
00:03:37,650 –> 00:03:38,040
72
00:03:38,040 –> 00:03:41,340
خوب، بر روی Choose files کلیک کنیم و
73
00:03:41,340 –> 00:03:44,609
فایلی که دارای چهار کلید من است، به آن
74
00:03:44,609 –> 00:03:46,320
قفل کردن CSV می گویند، بنابراین من آن را باز می
75
00:03:46,320 –> 00:03:48,989
کنم و یک سلول جدید ایجاد می کنم و
76
00:03:48,989 –> 00:03:53,840
در این سلول من قرار است داده ها را دریافت کنم،
77
00:03:53,840 –> 00:03:55,650
بنابراین متغیری به نام
78
00:03:55,650 –> 00:04:01,250
کلید مصرف کننده ایجاد می کنم و تنظیم می کنم
79
00:04:01,940 –> 00:04:04,440
قبل از انجام این کار برابر با وزن است، اجازه دهید ببینم
80
00:04:04,440 –> 00:04:07,200
داده ها را دریافت می کنیم، بنابراین قبل از انجام
81
00:04:07,200 –> 00:04:09,299
همه این کارها از خودم جلوتر می روم،
82
00:04:09,299 –> 00:04:16,589
باید فایل CSV را در یک
83
00:04:16,589 –> 00:04:18,209
متغیر ذخیره کنم تا یک متغیر ایجاد کنم.
84
00:04:18,209 –> 00:04:21,870
آن را log صدا کنید و آن را برابر با PD dot read
85
00:04:21,870 –> 00:04:24,139
underscore CSV قرار دهید
86
00:04:24,139 –> 00:04:27,889
و من آن فایل CSV نقطه ورود به سیستم
87
00:04:27,889 –> 00:04:29,659
را که آپلود
88
00:04:29,659 –> 00:04:34,129
کردهام را میخوانم، بنابراین حالا که من
89
00:04:34,129 –> 00:04:37,430
جلوتر از خودم نمیروم، این را اجرا کنیم. برای دریافت
90
00:04:37,430 –> 00:04:44,780
اعتبار API توییتر خوب است، بنابراین اکنون می
91
00:04:44,780 –> 00:04:45,770
خواهم آن متغیری به نام
92
00:04:45,770 –> 00:04:48,050
کلید مصرف کننده ایجاد کنم و آن را
93
00:04:48,050 –> 00:04:55,000
برابر با ورود در ستونی به نام کلید
94
00:04:55,000 –> 00:05:00,219
و موقعیت 0 بعدی تنظیم می کنم، من رمز مصرف کننده را دریافت می کنم
95
00:05:00,219 –> 00:05:04,159
و
96
00:05:04,159 –> 00:05:05,990
اساساً همان چیزی است به
97
00:05:05,990 –> 00:05:07,939
جز موقعیت 1، بنابراین من می خواهم این را
98
00:05:07,939 –> 00:05:10,069
با استفاده از ctrl C کپی کنم و با استفاده از کنترل V پیست کنم
99
00:05:10,069 –> 00:05:13,069
و سپس به موقعیت 1 می روم که در
100
00:05:13,069 –> 00:05:15,650
آن کلید ذخیره شده است و می خواهم
101
00:05:15,650 –> 00:05:19,879
متغیری به نام دسترسی ایجاد کنم. توکن و و
102
00:05:19,879 –> 00:05:23,659
آن را برابر با همان چیز قرار دهید اما در
103
00:05:23,659 –> 00:05:28,699
موقعیت 2 و من می خواهم متغیری
104
00:05:28,699 –> 00:05:33,259
به نام access token s ایجاد کنم ecret
105
00:05:33,259 –> 00:05:36,379
من آن را برابر با همان چیزی
106
00:05:36,379 –> 00:05:39,909
قرار دادم اما در موقعیت 3، بنابراین حالا اجازه دهید این سلول را اجرا کنیم
107
00:05:39,909 –> 00:05:45,139
و اجازه دهید یک سلول جدید ایجاد کنیم، اکنون
108
00:05:45,139 –> 00:05:47,650
باید احراز هویت و یک شی شناسایی ایجاد کنیم،
109
00:05:47,650 –> 00:05:50,210
بنابراین بیایید
110
00:05:50,210 –> 00:05:55,189
شی احراز هویت را ایجاد کنیم، بنابراین من
111
00:05:55,189 –> 00:06:00,020
یک متغیر ایجاد می کنم. احراز هویت را فراخوانی کنید و
112
00:06:00,020 –> 00:06:03,729
اجازه دهید آن را برابر با 3 نقطه PI تنظیمکننده مقدار زیادی تنظیم کنیم
113
00:06:03,729 –> 00:06:08,389
و این
114
00:06:08,389 –> 00:06:11,659
کلید مصرف کننده را که کلید خود را در آن ذخیره کردهایم
115
00:06:11,659 –> 00:06:17,599
و رمز مصرفکننده که
116
00:06:17,599 –> 00:06:22,550
کلید مخفی مصرفکننده را در آن ذخیره کردهایم
117
00:06:22,550 –> 00:06:26,930
، میگیرد. نشانه
118
00:06:26,930 –> 00:06:30,350
دسترسی و نشانه دسترسی مخفی هستند،
119
00:06:30,350 –> 00:06:32,150
بنابراین برای انجام این کار، کافیست
120
00:06:32,150 –> 00:06:36,910
authenticate dot set underscore XS
121
00:06:36,910 –> 00:06:40,070
underscore token را تایپ کنید و سپس میخواهم
122
00:06:40,070 –> 00:06:43,010
پارامتری به نام را وارد کنم، بنابراین
123
00:06:43,010 –> 00:06:44,840
توکن اضافی را در پارامتر اول قرار
124
00:06:44,840 –> 00:06:47,930
میدهم و میخواهم گزینه access token secret
125
00:06:47,930 –> 00:06:53,510
و پارامتر دوم را خوب قرار دهید و در
126
00:06:53,510 –> 00:06:56,960
آخر میخواهم
127
00:06:56,960 –> 00:07:04,600
شی API و
128
00:07:04,600 –> 00:07:08,960
اطلاعات نویسنده را ایجاد کنم، بنابراین
129
00:07:08,960 –> 00:07:11,030
متغیری به نام API ایجاد میکنم و آن را برابر با
130
00:07:11,030 –> 00:07:18,320
دو we PI dot API قرار میدهم. یک d ما میخواهیم
131
00:07:18,320 –> 00:07:23,960
تأیید اعتبار را وارد کنیم Okay و
132
00:07:23,960 –> 00:07:27,410
زیرخط انتظار روی حد خط زیرخط
133
00:07:27,410 –> 00:07:31,220
درست میشود در حال حاضر
134
00:07:31,220 –> 00:07:35,960
اجازه دهید این سلول را اجرا کنیم و اجازه دهید
135
00:07:35,960 –> 00:07:38,470
یک سلول جدید ایجاد کنیم.
136
00:07:38,470 –> 00:07:43,430
انجام این کار این است که من می خواهم
137
00:07:43,430 –> 00:07:45,110
صد توییت از یک
138
00:07:45,110 –> 00:07:48,440
کاربر توییتر استخراج کنم، بنابراین از
139
00:07:48,440 –> 00:07:53,810
کاربر توییتر به نام بیل گیتس استفاده خواهم کرد، بنابراین بله،
140
00:07:53,810 –> 00:07:56,750
این حساب توییتر، یکی از بنیانگذاران مایکروسافت، بیل گیتس است
141
00:07:56,750 –> 00:07:58,850
که ما از آن استفاده خواهیم کرد
142
00:07:58,850 –> 00:08:01,130
و من انتخاب می کنم. این حساب توییتر است
143
00:08:01,130 –> 00:08:04,310
زیرا بیل گیتس در تلاش است
144
00:08:04,310 –> 00:08:07,760
تأثیر مثبتی در جهان بگذارد و او
145
00:08:07,760 –> 00:08:11,300
در سال 2000 سازمانی را تأسیس کرد به
146
00:08:11,300 –> 00:08:12,320
نام بنیاد بیل و ملیندا گیتس
147
00:08:12,320 –> 00:08:15,320
و حدس میزنم باید
148
00:08:15,320 –> 00:08:19,000
به آن اشاره کنم ملیندا گیتس نیز آن را تأسیس کرد
149
00:08:19,000 –> 00:08:23,210
اما اساساً این سازمان است.
150
00:08:23,210 –> 00:08:26,120
با این باور که هر زندگی دارای
151
00:08:26,120 –> 00:08:29,720
ارزش یکسانی است، بنابراین آنها یک
152
00:08:29,720 –> 00:08:32,960
سازمان بسیار نوآور هستند و برای
153
00:08:32,960 –> 00:08:35,390
کمک به همه مردم در داشتن زندگی سالم و
154
00:08:35,390 –> 00:08:39,820
سازنده تلاش می کنند، بنابراین من فکر می کنم که
155
00:08:39,820 –> 00:08:43,700
حساب توییتر بیل گیتس در آنجا باشد.
156
00:08:43,700 –> 00:08:50,390
خوب است، بنابراین در این سلول بیایید
157
00:08:50,390 –> 00:08:56,860
100 توییت از کاربر توییتر استخراج کنیم
158
00:08:56,860 –> 00:09:01,420
و می دانید که پیوند
159
00:09:01,420 –> 00:09:04,130
بنیاد بیل و ملیندا گیتس را
160
00:09:04,130 –> 00:09:06,080
در توضیحات زیر نیز قرار می دهم تا شما
161
00:09:06,080 –> 00:09:09,620
بچه ها بتوانید آن را بررسی کنید، بنابراین به هر حال
162
00:09:09,620 –> 00:09:11,780
بیایید یک متغیر ایجاد کنیم. پست ها را نامیده
163
00:09:11,780 –> 00:09:15,200
و آن را برابر با AP I dot user underscore
164
00:09:15,200 –> 00:09:20,390
timeline قرار دهید و ما
165
00:09:20,390 –> 00:09:28,460
نام صفحه کاربر را که بیل گیتس است خوب است
166
00:09:28,460 –> 00:09:30,290
و تعداد آن برابر با 100 خواهد بود
167
00:09:30,290 –> 00:09:33,140
زیرا ما 100 توییت از این
168
00:09:33,140 –> 00:09:38,150
حساب و زبان می خواهیم. انگلیسی
169
00:09:38,150 –> 00:09:45,910
خواهد بود و حالت توییت برابر با Extend خواهد بود
170
00:09:45,910 –> 00:09:49,640
و به همین دلیل است که می توانم قبل از
171
00:09:49,640 –> 00:09:54,520
متن کامل دریافت کنم که خوب به نظر می رسد اکنون بیایید
172
00:09:54,520 –> 00:10:02,660
پنج توییت آخر را از این
173
00:10:02,660 –> 00:10:06,230
حساب یا از
174
00:10:06,230 –> 00:10:08,270
حساب چاپ کنیم. و
175
00:10:08,270 –> 00:10:13,280
من می خواهم پنج
176
00:10:13,280 –> 00:10:20,210
توییت اخیر و یک خط جدید را چاپ کنم و بیایید آن توییت ها را نشان دهیم،
177
00:10:20,210 –> 00:10:25,760
بنابراین برای توییت ها و پست های
178
00:10:25,760 –> 00:10:32,060
0 تا 5 به خوبی بدون احتساب 5 در واقع می
179
00:10:32,060 –> 00:10:38,530
خواهیم نقطه توییت را برای
180
00:10:38,530 –> 00:10:44,750
متن زیر خط چاپ کنیم و احتمالاً می خواهیم
181
00:10:44,750 –> 00:10:47,990
برای قرار دادن یک خط جدید برای هر یک از آنها
182
00:10:47,990 –> 00:10:52,480
و اجازه دهید این را اجرا کنیم
183
00:10:52,480 –> 00:10:56,410
تا خیلی خوب به نظر برسد
184
00:10:56,410 –> 00:11:01,700
ما می توانیم ببینیم که توییتی در راجر فدرر وجود دارد
185
00:11:01,700 –> 00:11:05,120
186
00:11:05,120 –> 00:11:06,769
که من نگفته ام که
187
00:11:06,769 –> 00:11:09,079
تلاش نمی کنم، اما به هر حال شرکای بنیاد راجرز
188
00:11:09,079 –> 00:11:11,480
با سازمانهای غیردولتی محلی و شش
189
00:11:11,480 –> 00:11:14,570
کشور در جنوب آفریقا برای بهبود
190
00:11:14,570 –> 00:11:17,720
یادگیری اولیه و آموزش پایه
191
00:11:17,720 –> 00:11:19,850
سازمانی چشمگیر است و من شما را تشویق
192
00:11:19,850 –> 00:11:21,800
میکنم که از کار آن حمایت کنید، بنابراین
193
00:11:21,800 –> 00:11:25,040
این یکی از توییتهای آخرین توییت است
194
00:11:25,040 –> 00:11:28,070
و من در واقع میخواهم این توییت را
195
00:11:28,070 –> 00:11:32,600
کمی بهتر کنم. بنابراین من می خواهم
196
00:11:32,600 –> 00:11:34,370
یک متغیر به نام I ایجاد کنم که به جای آن برابر با یک است
197
00:11:34,370 –> 00:11:38,390
و کاری که در اینجا انجام می دهم این است
198
00:11:38,390 –> 00:11:42,860
که یک رشته درست می کنم و
199
00:11:42,860 –> 00:11:55,370
یک پرانتز سمت راست اضافه می کنم و آیا
200
00:11:55,370 –> 00:12:03,800
آن خوب به نظر می رسد. فکر می کنم
201
00:12:03,800 –> 00:12:07,279
خوب به نظر می رسد اوه نه اشکالی ندارد
202
00:12:07,279 –> 00:12:07,970
متأسفانه
203
00:12:07,970 –> 00:12:14,029
باید یک فاصله بگذاریم و سپس برنامه
204
00:12:14,029 –> 00:12:16,370
و توییت را برای متن ارسال کنیم، بنابراین حالا بیایید
205
00:12:16,370 –> 00:12:21,829
این را امتحان کنیم و اکنون می بینم که آن را چندین بار اینجا قرار داده ام،
206
00:12:21,829 –> 00:12:23,750
بنابراین نیاز داریم برای
207
00:12:23,750 –> 00:12:26,420
اطمینان از اینکه من افزایش یافته است بنابراین من
208
00:12:26,420 –> 00:12:29,899
sa id I برابر است با من به اضافه یک و حالا بیایید
209
00:12:29,899 –> 00:12:33,260
آن را اجرا کنیم تا حالا بتوانیم پنج
210
00:12:33,260 –> 00:12:38,060
توییت اخیر را خوب ببینیم بنابراین
211
00:12:38,060 –> 00:12:42,680
یک سلول جدید ایجاد می کنیم و در این سلول
212
00:12:42,680 –> 00:12:51,410
یک قاب داده با
213
00:12:51,410 –> 00:12:57,829
ستونی به نام توییت یا توییتها
214
00:12:57,829 –> 00:12:59,579
بسیار خوب است، بنابراین من متغیری
215
00:12:59,579 –> 00:13:01,380
به نام DF ایجاد میکنم که مخفف
216
00:13:01,380 –> 00:13:04,040
قاب داده است و برابر با قاب داده PD خواهد بود
217
00:13:04,040 –> 00:13:10,610
و ما
218
00:13:10,610 –> 00:13:15,240
متن کامل توییت را دریافت میکنیم، بنابراین
219
00:13:15,240 –> 00:13:24,250
برای توییت، متن چهار خط زیرخط را توییت کنید. impulse و
220
00:13:24,250 –> 00:13:26,540
[Music]
221
00:13:26,540 –> 00:13:36,990
نام ستون توییتها خواهد بود، پس
222
00:13:36,990 –> 00:13:42,410
بیایید پنج ردیف اول دادهها را نشان دهیم،
223
00:13:42,410 –> 00:13:44,970
بنابراین فقط
224
00:13:44,970 –> 00:13:46,800
کافی است این پرانتز سمت راست را تایپ کنید و
225
00:13:46,800 –> 00:13:50,459
سلول را اجرا کنید و اکنون این
226
00:13:50,459 –> 00:13:53,760
توییتها را در این قاب داده جدید ذخیره کردهایم.
227
00:13:53,760 –> 00:13:57,779
در اینجا یک سلول جدید ایجاد می کنیم و در
228
00:13:57,779 –> 00:14:00,060
این سلول باید متن را به نوعی پاک کنیم
229
00:14:00,060 –> 00:14:02,339
زیرا اگر اینجا را نگاه کنید می توانیم
230
00:14:02,339 –> 00:14:05,250
پذیرش را در اینجا ببینیم پذیرش در
231
00:14:05,250 –> 00:14:09,089
اینجا پذیرش در اینجا ما می توانیم برخی از
232
00:14:09,089 –> 00:14:14,990
URL ها را ببینیم پس بیایید ببینیم چه چیز دیگری به دست آورده ایم.
233
00:14:14,990 –> 00:14:17,639
مطمئنم چند تگ هش خواهیم داشت، پس
234
00:14:17,639 –> 00:14:23,010
بیایید ادامه دهیم و داده
235
00:14:23,010 –> 00:14:25,350
ها را پاک کنید تا متن را پاک کنیم و دستور انجام این کار را بدهید،
236
00:14:25,350 –> 00:14:28,829
من یک تابع ایجاد می کنم تا
237
00:14:28,829 –> 00:14:30,480
این کار را برای من انجام دهد، بنابراین ما یک
238
00:14:30,480 –> 00:14:34,949
تابع برای پاک کردن توییت ها ایجاد می کنیم و من
239
00:14:34,949 –> 00:14:38,880
این تابع را text clean می نامم و
240
00:14:38,880 –> 00:14:45,180
مقداری متن را می گیرد و ما می
241
00:14:45,180 –> 00:14:54,230
خواهیم متن را برابر با حذف
242
00:14:54,230 –> 00:14:59,850
این کلمات و نمادها تنظیم کنیم، بنابراین فقط
243
00:14:59,850 –> 00:15:02,699
re dot sub را تایپ کنید، بنابراین ما می خواهیم
244
00:15:02,699 –> 00:15:06,149
هر الگوی را که پیدا می کنیم برای یک
245
00:15:06,149 –> 00:15:10,470
رشته خالی جایگزین کنیم، به عنوان
246
00:15:10,470 –> 00:15:14,520
مثال پذیرش میخواهم آن را حذف کنم، بنابراین
247
00:15:14,520 –> 00:15:17,220
میخواهم این الگو را با استفاده از عبارات منظم پیدا کنم،
248
00:15:17,220 –> 00:15:20,340
بنابراین
249
00:15:20,340 –> 00:15:26,220
هر کاراکتری را میشناسید به دنبال آن باشد، بنابراین
250
00:15:26,220 –> 00:15:28,410
ما بررسی حروف بزرگ و
251
00:15:28,410 –> 00:15:30,630
کوچک را داریم، پس بیایید این کار را اکنون انجام دهیم،
252
00:15:30,630 –> 00:15:37,050
بنابراین A تا Z بزرگ a به بزرگ Z و
253
00:15:37,050 –> 00:15:38,790
همچنین میخواهیم از
254
00:15:38,790 –> 00:15:43,320
a تا کوچک Z و هر عددی از 0
255
00:15:43,320 –> 00:15:45,470
تا 9 را بررسی کنیم،
256
00:15:45,470 –> 00:15:51,540
خوب است و سپس
257
00:15:51,540 –> 00:15:57,900
برای یک یا چند مورد، یک عدد به علاوه را در اینجا قرار میدهیم، بنابراین من یک
258
00:15:57,900 –> 00:16:01,830
R جلوی آن قرار میدهم. کاری که این R انجام می دهد این است
259
00:16:01,830 –> 00:16:07,650
که به پایتون می گوید که
260
00:16:07,650 –> 00:16:12,450
عبارت یک رشته خام است، خوب است،
261
00:16:12,450 –> 00:16:15,600
بنابراین این همان الگویی است که
262
00:16:15,600 –> 00:16:20,310
میخواهیم پیدا کنیم و وقتی آن
263
00:16:20,310 –> 00:16:24,840
الگو را پیدا کردیم میخواهم آن را جایگزین
264
00:16:24,840 –> 00:16:27,690
رشته خالی کنم، بنابراین فقط میخواهم از شر آن خلاص شوم
265
00:16:27,690 –> 00:16:30,420
فقط میخواهیم آن را حذف کنیم و
266
00:16:30,420 –> 00:16:33,930
البته باید در متن قرار دهیم. که
267
00:16:33,930 –> 00:16:39,990
میخواهیم الگوی Okay Okay را پیدا کنیم،
268
00:16:39,990 –> 00:16:42,680
بنابراین در اینجا دوباره به سادگی حذف میشود
269
00:16:42,680 –> 00:16:47,790
، بعداً
270
00:16:47,790 –> 00:16:53,730
متن را برابر re dotsub تنظیم میکنم و
271
00:16:53,730 –> 00:16:55,680
دوباره از آن استفاده میکنم و ما از
272
00:16:55,680 –> 00:16:58,230
شر هر هش خلاص میشویم. تگ ها یا یک علامت عددی
273
00:16:58,230 –> 00:17:01,710
و به متن و جایگزین کردن آن البته
274
00:17:01,710 –> 00:17:03,450
با رشته
275
00:17:03,450 –> 00:17:06,930
276
00:17:06,930 –> 00:17:09,630
277
00:17:09,630 –> 00:17:17,430
278
00:17:17,430 –> 00:17:21,689
خالی برابر خواندن زیر است و ما
279
00:17:21,689 –> 00:17:23,230
280
00:17:23,230 –> 00:17:29,880
Artie را از متن حذف می کنیم، بنابراین T ما
281
00:17:29,880 –> 00:17:34,090
ریتوییت ها است، من به توییتر اعتقاد دارم، بنابراین بیایید آن ها را
282
00:17:34,090 –> 00:17:37,799
حذف کنیم و
283
00:17:37,799 –> 00:17:40,899
این توییت ها را به دنبال یک یا چند
284
00:17:40,899 –> 00:17:45,460
فاصله سفید حذف می کنیم تا بتوانم s و بک اسلش را بگذارم
285
00:17:45,460 –> 00:17:48,639
و سپس علامت مثبت که باید این کار را انجام دهد
286
00:17:48,639 –> 00:17:52,659
و سپس رشته را خالی کنید و البته ما
287
00:17:52,659 –> 00:17:57,370
متن را وارد کنید خوب، پس دوباره این حذف
288
00:17:57,370 –> 00:18:04,480
RT است و بعد بیایید X را برابر با R e dot
289
00:18:04,480 –> 00:18:08,789
sub قرار دهیم و میخواهم از شر آن
290
00:18:08,789 –> 00:18:14,110
URL یا آن لینک خلاص شوم، به این معنی
291
00:18:14,110 –> 00:18:17,830
که هایپرلینک دارای HTTP خواهد بود
292
00:18:17,830 –> 00:18:20,440
و ممکن است s داشته باشد یا نداشته باشد. بنابراین من یک
293
00:18:20,440 –> 00:18:27,179
علامت سوال در اینجا می گذارم برای اینکه 0 یا 1
294
00:18:27,179 –> 00:18:31,539
کاراکتر خوب است، سپس یک
295
00:18:31,539 –> 00:18:35,909
دونقطه و اسلش
296
00:18:35,909 –> 00:18:41,289
درست است، بنابراین من می خواهم اسلش ها را در اینجا
297
00:18:41,289 –> 00:18:45,700
یک دو اسلش بگیرم بله، فکر می کنم بله
298
00:18:45,700 –> 00:18:52,470
اسلش ها هستند. بله بسیار خوب پس یک دو و
299
00:18:52,470 –> 00:18:56,380
ما می خواهیم بررسی کنیم که آیا
300
00:18:56,380 –> 00:19:00,220
یک یا چند فاصله غیر سفید به دنبال آن وجود دارد،
301
00:19:00,220 –> 00:19:05,399
بنابراین
302
00:19:07,620 –> 00:19:15,010
S Plus را با حروف بک اسلش در اینجا قرار
303
00:19:15,010 –> 00:19:17,039
می دهیم، بنابراین فکر می کنم این کار انجام می شود
304
00:19:17,039 –> 00:19:19,990
و من کاملا مطمئن هستم به
305
00:19:19,990 –> 00:19:24,309
هر حال مطمئن شویم که
306
00:19:24,309 –> 00:19:25,659
آن را با رشته خالی جایگزین کرده و
307
00:19:25,659 –> 00:19:29,799
متن ورودی را درست است، بنابراین همین اینجا
308
00:19:29,799 –> 00:19:34,320
لینک فوق العاده را حذف می
309
00:19:34,720 –> 00:19:36,910
کند و وقتی کارمان تمام شد، می توانیم فقط
310
00:19:36,910 –> 00:19:41,410
متن را برگردانیم تا عملکرد
311
00:19:41,410 –> 00:19:42,820
خوب به نظر برسد. این را کمی مطرح
312
00:19:42,820 –> 00:19:46,990
کنید تا اکنون بتوانیم این
313
00:19:46,990 –> 00:19:52,750
تابع را اعمال کنیم، بنابراین من فقط تایپ می کنم توییتهای DF
314
00:19:52,750 –> 00:19:57,490
باید یک رشته باشند. توییتها باید
315
00:19:57,490 –> 00:20:11,410
با توییتهای DF برابر باشند، متن تمیز را
316
00:20:11,410 –> 00:20:13,870
اعمال میکنیم، بنابراین ما آن تابع را روی توییتهایمان اعمال میکنیم
317
00:20:13,870 –> 00:20:18,690
و سپس متن تمیز را نشان میدهیم،
318
00:20:18,690 –> 00:20:25,690
بنابراین در اینجا از نظر فنی
319
00:20:25,690 –> 00:20:31,930
متن را پاک میکنیم،
320
00:20:31,930 –> 00:20:34,270
بنابراین من فقط میخواهیم DF را تایپ کنیم و اجازه دهید
321
00:20:34,270 –> 00:20:38,950
این سلول را اجرا کنیم و حالا میتوانیم ببینیم
322
00:20:38,950 –> 00:20:43,030
که برخی از این پذیرشها
323
00:20:43,030 –> 00:20:44,350
در واقع تمام این پذیرشها از
324
00:20:44,350 –> 00:20:47,680
بین میروند، بنابراین ما آن را در توییتهایمان
325
00:20:47,680 –> 00:20:53,860
در اینجا نمیبینیم و پیوند را نمیبینیم، بنابراین کجا
326
00:20:53,860 –> 00:20:55,890
ما بازی یک را داریم که لینک در حال حاضر در حال اجرا است،
327
00:20:55,890 –> 00:20:58,390
بنابراین به نظر می رسد که ما متن را پاک کرده ایم
328
00:20:58,390 –> 00:21:01,540
احتمالاً می توانیم
329
00:21:01,540 –> 00:21:04,630
کمی بیشتر روی متن انجام دهیم تا آن را پاک کنیم، اما در
330
00:21:04,630 –> 00:21:06,580
حال حاضر فکر کنید که به اندازه کافی خوب است،
331
00:21:06,580 –> 00:21:09,010
یک سلول جدید ایجاد می کند و من ”
332
00:21:09,010 –> 00:21:12,400
حالا این را در این سلول مطرح می کنم، من
333
00:21:12,400 –> 00:21:14,260
یک تابع ایجاد می کنم تا چیزی
334
00:21:14,260 –> 00:21:16,510
به نام این ذهنیت
335
00:21:16,510 –> 00:21:20,350
و قطبیت را بدست آوریم و دو
336
00:21:20,350 –> 00:21:23,890
ستون دیگر برای ذخیره همه این
337
00:21:23,890 –> 00:21:25,510
ذهنیت x و همه
338
00:21:25,510 –> 00:21:29,560
قطبیت ها ایجاد خواهم کرد. بنابراین بیایید این کار را انجام دهیم اکنون من می
339
00:21:29,560 –> 00:21:33,330
خواهم یک تابع برای بدست آوردن t ایجاد کنم این
340
00:21:33,330 –> 00:21:37,480
سوبژکتیویته و سوبژکتیویته نشان
341
00:21:37,480 –> 00:21:40,120
میدهد که متن چقدر ذهنی یا نظری
342
00:21:40,120 –> 00:21:41,920
است، بنابراین این کاری است که ما در
343
00:21:41,920 –> 00:21:42,630
اینجا انجام میدهیم،
344
00:21:42,630 –> 00:21:45,660
بنابراین من این تابع را دریافت
345
00:21:45,660 –> 00:21:47,780
سوبژکتیویته صدا
346
00:21:47,780 –> 00:21:51,190
میکنم و متنی را میگیرد و
347
00:21:51,190 –> 00:21:56,870
لکه متنی را که ما داریم برمیگرداند.
348
00:21:56,870 –> 00:22:01,540
برای وارد کردن متن نقطه احساس نقطه
349
00:22:01,540 –> 00:22:06,970
سوبژکتیویته کاملاً درست است و همچنین می خواهید
350
00:22:06,970 –> 00:22:13,070
یک تابع برای بدست آوردن قطبیت ایجاد کنید
351
00:22:13,070 –> 00:22:16,370
تا قطبیت
352
00:22:16,370 –> 00:22:19,400
نشان دهد که متن چقدر مثبت یا منفی است بنابراین
353
00:22:19,400 –> 00:22:24,290
من این تابع را دریافت قطبیت صدا می کنم و
354
00:22:24,290 –> 00:22:29,300
مقداری متن را می گیرد. بسیار خوب و من می
355
00:22:29,300 –> 00:22:32,780
خواهم حباب متن را برگردانم و با
356
00:22:32,780 –> 00:22:37,090
ورودی متن نقطه احساس
357
00:22:37,090 –> 00:22:43,250
قطبیت نقطه در حال حاضر بیایید
358
00:22:43,250 –> 00:22:44,630
آن ستون ها را ایجاد کنیم تا
359
00:22:44,630 –> 00:22:48,080
دو ستون جدید ایجاد کنیم که یکی به نام
360
00:22:48,080 –> 00:22:49,640
ذهنیت و دیگری
361
00:22:49,640 –> 00:22:56,380
قطبیت نامیده می شود. بنابراین فقط DF و سپس
362
00:22:57,910 –> 00:23:01,460
سوبژکتیویته را تایپ کنید و من می خواهم این را
363
00:23:01,460 –> 00:23:08,300
برابر با توئیت های DF تنظیم
364
00:23:08,300 –> 00:23:13,930
365
00:23:13,930 –> 00:23:17,030
کنم.
366
00:23:17,030 –> 00:23:19,970
فقط
367
00:23:19,970 –> 00:23:24,980
DF را تایپ کنید و سپس قطبیت و تنظیم
368
00:23:24,980 –> 00:23:30,620
برابر با توییت های DF است و ما
369
00:23:30,620 –> 00:23:37,190
تابع get polarity را که درست کردیم اعمال می
370
00:23:37,190 –> 00:23:42,170
کنیم تا خوب به نظر برسد اکنون می
371
00:23:42,170 –> 00:23:46,310
خواهم قاب داده جدید را با
372
00:23:46,310 –> 00:23:50,810
ستون های جدید نشان دهم بنابراین فقط DF را تایپ کنید و بیایید
373
00:23:50,810 –> 00:23:55,040
این سلول را اجرا کنیم،
374
00:23:55,040 –> 00:23:58,400
بنابراین اکنون من یک فریم را انجام دادم که بسیار خوب به نظر می رسد،
375
00:23:58,400 –> 00:24:02,150
بنابراین برای هر توییت در اینجا اکنون می توانیم
376
00:24:02,150 –> 00:24:04,940
این ذهنیت و قطبیت
377
00:24:04,940 –> 00:24:09,170
آن توییت را کاملاً ببینیم، بنابراین من
378
00:24:09,170 –> 00:24:15,140
یک سلول جدید ایجاد می کنم و اکنون می خواهم ببینم چقدر
379
00:24:15,140 –> 00:24:17,240
خوب است. این احساسات توزیع می شوند
380
00:24:17,240 –> 00:24:21,860
و یک راه خوب برای انجام این
381
00:24:21,860 –> 00:24:25,310
کار، درک کلمات رایج با
382
00:24:25,310 –> 00:24:27,920
ترسیم چیزی به نام ابر کلمه است
383
00:24:27,920 –> 00:24:30,920
و ابر کلمه نیز به عنوان
384
00:24:30,920 –> 00:24:33,800
ابرهای برچسب یا ابرهای متن شناخته می شود و اساساً
385
00:24:33,800 –> 00:24:37,340
یک تجسم است که کلمه خاص تر
386
00:24:37,340 –> 00:24:40,520
در آن ظاهر می شود. متن هر چه بزرگتر و
387
00:24:40,520 –> 00:24:43,630
پررن