در این مطلب، ویدئو آموزش Snorkel Python- نحوه برچسبگذاری برنامهای به مجموعه دادهها [صدا رفع شد] با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:32:46
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,480 –> 00:00:02,159
بسیار خوب پس دوباره خوش آمدید نام من
2
00:00:02,159 –> 00:00:03,919
جسی است و در این آموزش فوق العاده و
3
00:00:03,919 –> 00:00:05,359
هیجان انگیز ما سعی می کنیم
4
00:00:05,359 –> 00:00:07,520
با یک کتابخانه بسیار قدرتمند به نام
5
00:00:07,520 –> 00:00:10,160
snorkel کار کنیم، بنابراین snorkel یک
6
00:00:10,160 –> 00:00:11,360
کتابخانه
7
00:00:11,360 –> 00:00:14,559
کتابخانه قدرتمند است که به شما امکان می دهد کارهای
8
00:00:14,559 –> 00:00:15,839
جالبی انجام دهید. فرض
9
00:00:15,839 –> 00:00:17,680
کنید سعی میکنید با یک پروژه کار
10
00:00:17,680 –> 00:00:20,000
کنید و مجموعه دادههای شما به درستی برچسبگذاری نشده است، بنابراین
11
00:00:20,000 –> 00:00:21,520
کاری که بیشتر انجام میدهید این است که
12
00:00:21,520 –> 00:00:23,439
دادههای خود را که برچسبگذاری نشدهاند به انسانی
13
00:00:23,439 –> 00:00:25,359
که قرار است بنشیند میدهید و سپس
14
00:00:25,359 –> 00:00:27,519
آنها را یکی پس از دیگری برچسبگذاری میکنید. اما
15
00:00:27,519 –> 00:00:30,320
نامی نیست که بتوانید
16
00:00:30,320 –> 00:00:32,320
آن فرآیند خاص را به درستی ساده کنید، بنابراین
17
00:00:32,320 –> 00:00:34,160
میتوانید وظیفه خاص
18
00:00:34,160 –> 00:00:36,320
برچسبگذاری آن توسط انسان را به غواصی بسپارید،
19
00:00:36,320 –> 00:00:38,559
بنابراین گردش کار اصلی این است که با محلی
20
00:00:38,559 –> 00:00:40,480
میتوانید مجموعه دادههای خود را که بدون برچسب هستند برچسبگذاری کنید،
21
00:00:40,480 –> 00:00:43,040
میتوانید دادهها را انجام دهید. تقویت داده ها
22
00:00:43,040 –> 00:00:44,559
با استفاده از تابع تبدیل
23
00:00:44,559 –> 00:00:45,680
24
00:00:45,680 –> 00:00:47,760
برای قوی تر کردن مجموعه داده
25
00:00:47,760 –> 00:00:49,840
های شما، قادر به ایجاد ویژگی های جالب است، همچنین می توانید
26
00:00:49,840 –> 00:00:53,120
یک مجموعه زیر مجموعه داده را برش دهید
27
00:00:53,120 –> 00:00:55,039
که در آن می توانید
28
00:00:55,039 –> 00:00:57,199
مهمترین را انتخاب کنید. جنبه ای از داده های خود را
29
00:00:57,199 –> 00:00:58,719
که می توانید برای ساخت مدل های خود به درستی استفاده کنید، به
30
00:00:58,719 –> 00:01:01,359
طوری که ویژگی های اصلی
31
00:01:01,359 –> 00:01:03,760
اسنورکل است، بنابراین با اسنورکل این امکان را به شما می دهد تا
32
00:01:03,760 –> 00:01:06,240
در صورتی که
33
00:01:06,240 –> 00:01:07,840
می خواهید مدلی را از دیدگاه داده محوری بسازید، کار شما بسیار آسان باشد،
34
00:01:07,840 –> 00:01:09,760
35
00:01:09,760 –> 00:01:11,760
بنابراین بیایید ببینیم چه چیزی
36
00:01:11,760 –> 00:01:14,400
جریان فیزیکی، بنابراین به طور پیشفرض
37
00:01:14,400 –> 00:01:16,320
اگر مجموعه دادهای بدون برچسب داشته باشم، آن را به
38
00:01:16,320 –> 00:01:18,479
یک انسان میدهم و تصویر مینشیند
39
00:01:18,479 –> 00:01:20,080
و یکی پس از دیگری این کار را انجام میدهد و سپس
40
00:01:20,080 –> 00:01:21,920
یک برچسب تولید میکنم که تمام است، اما فقط با
41
00:01:21,920 –> 00:01:23,840
بند انگشت میتوانید آن را خودکار کنید، میتوانید
42
00:01:23,840 –> 00:01:25,200
آن را بسیار درست کنید. ساده است، بنابراین این چیزی است که ما
43
00:01:25,200 –> 00:01:26,960
سعی می کنیم انجام دهیم، بنابراین اولین چیزی است
44
00:01:26,960 –> 00:01:28,799
که انسان از
45
00:01:28,799 –> 00:01:31,119
برخی اکتشافی ها یا معیارها یا برخی
46
00:01:31,119 –> 00:01:33,600
الگوها استفاده می کند، بنابراین از آنها به عنوان یک تابع
47
00:01:33,600 –> 00:01:35,280
برچسب گذاری تابع استفاده کنید، سپس
48
00:01:35,280 –> 00:01:38,159
از منبع پاندا استفاده کنید.
49
00:01:38,159 –> 00:01:40,000
همه این توابع را در مجموعه دادههای ما اعمال کنید
50
00:01:40,000 –> 00:01:42,479
تا یک ماتریس برچسب تولید شود، سپس آن را ارزیابی
51
00:01:42,479 –> 00:01:44,479
کنید تا
52
00:01:44,479 –> 00:01:46,079
ببینید عملکرد آن
53
00:01:46,079 –> 00:01:48,720
برچسبهای خاص چگونه است، سپس مدلی را اعمال میکنید و
54
00:01:48,720 –> 00:01:50,960
مدلی میسازید که از آن برای پیشبینی
55
00:01:50,960 –> 00:01:53,680
یا برچسبگذاری دادههای بدون برچسب برای تولید یک
56
00:01:53,680 –> 00:01:56,000
l استفاده میکنید. مجموعه داده abeled، بنابراین بیایید ببینیم چگونه
57
00:01:56,000 –> 00:01:58,560
از ابتدا با آن کار کنیم، بنابراین این یک
58
00:01:58,560 –> 00:02:00,079
گردش کار اساسی است، بنابراین ما
59
00:02:00,079 –> 00:02:02,479
همه این مراحل را خودکار می کنیم، من فقط
60
00:02:02,479 –> 00:02:04,000
دوباره به فضای کاری خود برمی گردم که در حال حاضر از collab استفاده می کنیم
61
00:02:04,000 –> 00:02:05,280
62
00:02:05,280 –> 00:02:06,719
و سپس شما شروع به کار خواهید کرد. روی آن، بنابراین
63
00:02:06,719 –> 00:02:08,080
اگر روی سیستم خود اسنورکل ندارید
64
00:02:08,080 –> 00:02:10,080
و میخواهید نصب کنید، کافیست
65
00:02:10,080 –> 00:02:13,440
به Pip install snow kill بروید، بنابراین بیایید
66
00:02:13,440 –> 00:02:15,040
با آن شروع کنیم تا سعی کنیم
67
00:02:15,040 –> 00:02:16,160
با اولین مورد از توابع برچسبگذاری کار
68
00:02:16,160 –> 00:02:17,599
کنیم تا بتوانیم برای برچسب زدن و
69
00:02:17,599 –> 00:02:19,520
حذف برچسب این مورد که قرار است آزمایش ما باشد،
70
00:02:19,520 –> 00:02:21,760
بنابراین من در اینجا مجموعه داده هایی دارم که
71
00:02:21,760 –> 00:02:23,840
شامل چند سؤال بسیار جالب و
72
00:02:23,840 –> 00:02:25,280
سپس چند
73
00:02:25,280 –> 00:02:26,720
سؤال در مورد برنامه نویسی و سپس
74
00:02:26,720 –> 00:02:29,680
برخی از بیانیه های اساسی است، بنابراین بیایید ببینیم چگونه
75
00:02:29,680 –> 00:02:31,200
این موارد خاص را به
76
00:02:31,200 –> 00:02:32,879
درستی برچسب گذاری کنیم. ما می خواهیم از آن استفاده کنیم،
77
00:02:32,879 –> 00:02:35,519
این مجموعه داده را کامل برچسب گذاری
78
00:02:35,519 –> 00:02:37,360
نمی کند، بنابراین متصل است،
79
00:02:37,360 –> 00:02:39,440
بنابراین بیایید بسته های ویرایش من را بارگیری کنیم تا
80
00:02:39,440 –> 00:02:40,720
بسته های ایده خود را
81
00:02:40,720 –> 00:02:42,000
مانند همیشه بارگیری
82
00:02:42,000 –> 00:02:44,959
کنیم تا از پانداها برای وارد کردن
83
00:02:44,959 –> 00:02:46,239
84
00:02:46,239 –> 00:02:48,879
سریع پانداها استفاده کنیم و سپس به صورت تصادفی مهم باشیم.
85
00:02:48,879 –> 00:02:50,720
86
00:02:50,720 –> 00:02:52,080
تصادفی برای کمک به ما در مورد اینکه
87
00:02:52,080 –> 00:02:53,840
فعلاً از numpy استفاده نمیکنید،
88
00:02:53,840 –> 00:02:55,280
خوب
89
00:02:55,280 –> 00:02:56,720
قبل از این یک درک اساسی از
90
00:02:56,720 –> 00:02:58,560
کاری است که میخواهید انجام دهید، اکنون
91
00:02:58,560 –> 00:02:59,920
میخواهیم بتوانیم کل این
92
00:02:59,920 –> 00:03:02,319
موارد را به یک مجموعه داده تبدیل کنیم، بنابراین بیایید
93
00:03:02,319 –> 00:03:04,959
ببینیم چگونه این کار را انجام دهیم. اما به گونه ای تنظیم شده
94
00:03:04,959 –> 00:03:07,599
است که وظایف ما اکنون
95
00:03:07,599 –> 00:03:09,200
مشخص کنیم که
96
00:03:09,200 –> 00:03:11,200
وظیفه ما اکنون این است که بتوانیم
97
00:03:11,200 –> 00:03:14,319
کاری را انجام دهیم که می خواهید به درستی انجام
98
00:03:14,400 –> 00:03:18,720
دهید مالیات ما این است که بتوانیم
99
00:03:18,720 –> 00:03:20,000
مجموعه داده ها را به درستی برچسب گذاری کنیم. برای ترک
100
00:03:20,000 –> 00:03:21,920
آیا فقط می پرسید بیایید به عنوان یک سؤال ببینیم،
101
00:03:21,920 –> 00:03:25,440
اما یک سؤال وجود دارد
102
00:03:27,280 –> 00:03:30,720
یا خوب است،
103
00:03:30,959 –> 00:03:33,120
بنابراین اینها چیزهای اساسی
104
00:03:33,120 –> 00:03:34,319
هستند که شما سعی می کنید درست انجام دهید، بنابراین می
105
00:03:34,319 –> 00:03:36,319
خواهید مجموعه داده ها را برچسب گذاری کنید، چه
106
00:03:36,319 –> 00:03:37,760
سؤال باشد یا سؤال دیگر سوال و همانطور که
107
00:03:37,760 –> 00:03:40,879
می دانید اکثر سوالات
108
00:03:40,879 –> 00:03:42,239
برای الگوی سوالات مانند
109
00:03:42,239 –> 00:03:45,040
اکثر سوالاتی است که با پنج
110
00:03:45,040 –> 00:03:47,280
w درست شروع می شود و
111
00:03:47,280 –> 00:03:49,599
سپس هر نیمه سمت راست
112
00:03:49,599 –> 00:03:51,840
بنابراین پنج w می تواند
113
00:03:51,840 –> 00:03:53,760
همانطور که می دانیم باشد
114
00:03:53,760 –> 00:03:55,040
می تواند
115
00:03:55,040 –> 00:03:56,480
چرا
116
00:03:56,480 –> 00:03:57,439
وقتی
117
00:03:57,439 –> 00:03:59,280
که کجا
118
00:03:59,280 –> 00:04:00,480
119
00:04:00,480 –> 00:04:02,239
کدام راست
120
00:04:02,239 –> 00:04:04,319
یک دو سه چهار پنج و همچنین
121
00:04:04,319 –> 00:04:07,280
چگونه تا اینها برخی از راههای اساسی است
122
00:04:07,280 –> 00:04:08,799
که ما میتوانیم به درستی سؤال بپرسیم، شما
123
00:04:08,799 –> 00:04:10,159
در واقع میتوانید از این یکی استفاده کنید، همچنین میتوانید از
124
00:04:10,159 –> 00:04:11,840
علامت سؤال
125
00:04:11,840 –> 00:04:13,439
به عنوان راه دیگری برای دانستن اینکه آیا
126
00:04:13,439 –> 00:04:15,040
کسی سؤال درستی است یا خیر، استفاده کنید، بنابراین این است
127
00:04:15,040 –> 00:04:16,880
که چگونه انسان سؤال دیگری دارد، بنابراین
128
00:04:16,880 –> 00:04:19,120
با استفاده از این الگوی خاص که ما
129
00:04:19,120 –> 00:04:19,918
130
00:04:19,918 –> 00:04:21,759
این اکتشافات را داشته باشید تا بتوانید
131
00:04:21,759 –> 00:04:23,600
از این لیست ما تعیین کنید که کدام یک
132
00:04:23,600 –> 00:04:25,520
سؤال است و کدام یک
133
00:04:25,520 –> 00:04:27,520
سؤال نیست، بنابراین اگر به عقب برگردم و
134
00:04:27,520 –> 00:04:30,960
این را بررسی کنم، داده ای وجود دارد که
135
00:04:31,440 –> 00:04:33,520
اگر آن را بررسی کنم، می توانید ببینید که
136
00:04:33,520 –> 00:04:35,120
هنوز مرتب شده است اما برخی
137
00:04:35,120 –> 00:04:36,639
از آنها نه همه آنها به خوبی مرتب شده اند
138
00:04:36,639 –> 00:04:38,080
بنابراین می توانید ببینید که از همه
139
00:04:38,080 –> 00:04:40,720
این موارد همه اینها سؤال هستند
140
00:04:40,720 –> 00:04:43,120
اما برخی از آنها سؤال نیستند
141
00:04:43,120 –> 00:04:45,199
ابتدا مشکل را حل کنید سپس
142
00:04:45,199 –> 00:04:47,520
کد را درست بنویسید تا
143
00:04:47,520 –> 00:04:49,759
یک کد ساده است بسیار جالب
144
00:04:49,759 –> 00:04:51,759
یاقوتی است زباله است php
145
00:04:51,759 –> 00:04:53,840
فوق العاده است نقل قول های بسیار جالب، بنابراین
146
00:04:53,840 –> 00:04:55,600
بیایید ببینیم چگونه می توان این را تغییر داد و
147
00:04:55,600 –> 00:04:57,280
سپس یک مجموعه داده از آن ایجاد کرد و سپس
148
00:04:57,280 –> 00:05:00,479
سعی کنید یک مجموعه داده یک طراحی برچسب بسازید.
149
00:05:00,479 –> 00:05:02,560
از همه چیزهایی که قرار است مجموعه داده ها را تغییر دهم یا به هم بزنم،
150
00:05:02,560 –> 00:05:03,600
151
00:05:03,600 –> 00:05:07,360
شما می توانید بنویسید
152
00:05:09,199 –> 00:05:10,800
چگونه این کار را انجام می دهید، بنابراین به این
153
00:05:10,800 –> 00:05:13,280
نتیجه نرسیده اید، بنابراین نمونه تصادفی را به هم بزنید،
154
00:05:13,280 –> 00:05:15,919
155
00:05:15,919 –> 00:05:18,320
156
00:05:18,320 –> 00:05:20,800
من می خواهم در داده های خود درست به آن منتقل کنم.
157
00:05:20,800 –> 00:05:22,240
با ارسال مجموعه داده ها، آنها را به هم می
158
00:05:22,240 –> 00:05:23,360
زند
159
00:05:23,360 –> 00:05:25,440
و حالا اگر دوباره
160
00:05:25,440 –> 00:05:27,520
آن را بررسی کنم، با فرمت دیگری مرتب شده است،
161
00:05:27,520 –> 00:05:30,800
درست همانطور که از
162
00:05:30,800 –> 00:05:33,120
اینجا می بینید، امیدوارم که بتوانید همه
163
00:05:33,120 –> 00:05:34,479
چیز را به
164
00:05:34,479 –> 00:05:36,639
165
00:05:36,639 –> 00:05:38,400
خوبی ببینید. اکنون فقط آنها را تغییر دهید فرمت را تغییر دهید
166
00:05:38,400 –> 00:05:40,080
اکنون من می خواهم
167
00:05:40,080 –> 00:05:42,960
کل این موارد را به یک مجموعه داده یا به یک
168
00:05:42,960 –> 00:05:45,600
قاب داده تبدیل کنم تا بتوانید از آن استفاده
169
00:05:45,600 –> 00:05:48,000
170
00:05:49,120 –> 00:05:52,120
171
00:05:53,039 –> 00:05:54,800
172
00:05:54,800 –> 00:05:56,880
کنید تا به قاب داده تبدیل شود.
173
00:05:56,880 –> 00:05:59,039
174
00:05:59,039 –> 00:06:01,600
قاب دادههای نقطهای را که میخواهم در اینجا بچسبانم، به
175
00:06:01,600 –> 00:06:04,240
جملات بروید،
176
00:06:04,639 –> 00:06:07,280
سپس این دادههای من خواهد بود
177
00:06:07,280 –> 00:06:08,639
، درست است که میخواهید یک مجموعه داده
178
00:06:08,639 –> 00:06:11,120
برای ما ایجاد کنید، بنابراین اگر آن را بررسی کنم،
179
00:06:11,120 –> 00:06:12,800
میتوانید ببینید که اکنون در یک وضعیت بسیار زیاد است.
180
00:06:12,800 –> 00:06:15,600
مجموعه داده های ساده
181
00:06:15,680 –> 00:06:17,280
همانطور که می بینید، بنابراین ما جملات را داریم
182
00:06:17,280 –> 00:06:18,800
و سپس
183
00:06:18,800 –> 00:06:20,319
نداریم برچسب درست نیست، هیچ برچسبی وجود
184
00:06:20,319 –> 00:06:22,240
ندارد، بنابراین وظایف ما
185
00:06:22,240 –> 00:06:24,400
این است که بتوانیم
186
00:06:24,400 –> 00:06:27,120
توابعی ایجاد کنیم تا از آنها برای
187
00:06:27,120 –> 00:06:29,840
برچسب زدن سرنوشت برچسب خود برای تولید مجموعه داده برچسب استفاده کنیم،
188
00:06:29,840 –> 00:06:31,199
بنابراین من دوباره به جایی که کار می کنم برمی گردم
189
00:06:31,199 –> 00:06:32,800
190
00:06:32,800 –> 00:06:34,479
و سپس از در اینجا بیایید آموزش و سیستم خود را ایجاد کنیم،
191
00:06:34,479 –> 00:06:36,080
پس بیایید به
192
00:06:36,080 –> 00:06:37,280
صفحه نمایش برویم
193
00:06:37,280 –> 00:06:40,160
و سپس درست تست کنیم، بنابراین بیایید از خط مدار استفاده کنیم،
194
00:06:40,160 –> 00:06:42,960
بنابراین از sklen
195
00:06:42,960 –> 00:06:45,840
dot انتخاب ماژول
196
00:06:45,840 –> 00:06:49,680
تغییرات واردات،
197
00:06:49,680 –> 00:06:51,120
ما از صفحه نمایش رشته برای
198
00:06:51,120 –> 00:06:54,000
نمایش استفاده می کنیم که فقط اجازه دهید به قطار df من برویم
199
00:06:54,000 –> 00:06:56,240
و سپس تست df من
200
00:06:56,240 –> 00:06:57,440
201
00:06:57,440 –> 00:06:59,280
فقط برای داشتن مجموعه ای از داده ها که می توانیم
202
00:06:59,280 –> 00:07:03,199
با آن تمرین کنیم و تقسیم را تخلیه
203
00:07:03,199 –> 00:07:05,280
کنیم تا آزمایش قطار من
204
00:07:05,280 –> 00:07:07,680
تقسیم شود من در مجموعه داده های من
205
00:07:07,680 –> 00:07:09,919
که df است قبول می کنم سپس
206
00:07:09,919 –> 00:07:11,840
اندازه قطار را
207
00:07:11,840 –> 00:07:16,599
درست برای رشته بنابراین آموزش
208
00:07:17,520 –> 00:07:20,319
آره ما می توانیم به آن 0.5 بدهیم، امیدوارم
209
00:07:20,319 –> 00:07:21,599
عالی
210
00:07:21,599 –> 00:07:23,759
باشد،
211
00:07:23,759 –> 00:07:26,880
بنابراین ما فقط از این
212
00:07:26,880 –> 00:07:28,479
سمت راست انتخاب می کنیم، بنابراین آن را تقسیم کرده ایم، بنابراین بیایید
213
00:07:28,479 –> 00:07:30,160
آن را بررسی کنیم اگر شکل
214
00:07:30,160 –> 00:07:32,080
اصلی کل مجموعه داده ای را که داریم بررسی کنم،
215
00:07:32,080 –> 00:07:35,039
بیایید چاپ کنیم. شکل بنابراین
216
00:07:35,039 –> 00:07:36,960
شکل نقطهای df بابت نویز اینجا معذرت میخواهیم
217
00:07:36,960 –> 00:07:38,000
ب ehind
218
00:07:38,000 –> 00:07:40,880
و چاپ کنید سپس
219
00:07:40,880 –> 00:07:42,880
شکل نقطه df train درست اگر آن را بیرون بیاورم می
220
00:07:42,880 –> 00:07:44,479
توانید تفاوت را به درستی ببینید، بنابراین نمونه
221
00:07:44,479 –> 00:07:46,720
اصلی 88 است و این 44 است زیرا ما
222
00:07:46,720 –> 00:07:48,160
آن را بر
223
00:07:48,160 –> 00:07:51,520
50 به سمت راست تقسیم می کنیم، فقط می خواهیم آنها را برچسب گذاری کنیم خوب هستند،
224
00:07:51,520 –> 00:07:53,440
حالا بیایید دوباره به عقب برگردیم. و ببینید
225
00:07:53,440 –> 00:07:55,520
که از اینجا چه کاری می توانید انجام دهید، بنابراین
226
00:07:55,520 –> 00:07:57,520
ما مجموعه داده های خود را آماده کرده ایم، اکنون می
227
00:07:57,520 –> 00:07:59,919
خواهیم به این گزینه خاص
228
00:07:59,919 –> 00:08:00,960
229
00:08:00,960 –> 00:08:01,759
230
00:08:01,759 –> 00:08:04,560
برویم، بنابراین باید
231
00:08:04,560 –> 00:08:06,800
مسیر خود را مشخص کنیم عملکرد برچسب گذاری خود را به گونه ای که عملکرد
232
00:08:06,800 –> 00:08:07,919
برچسب زدن
233
00:08:07,919 –> 00:08:09,520
به درستی انجام شود،
234
00:08:09,520 –> 00:08:11,360
بنابراین در صورتی که شما نمی توانید نگاه کنید.
235
00:08:11,360 –> 00:08:12,800
فقط با این گزینه به نصب آن بروید
236
00:08:12,800 –> 00:08:13,840
تا pip
237
00:08:13,840 –> 00:08:15,599
install
238
00:08:15,599 –> 00:08:16,639
snow
239
00:08:16,639 –> 00:08:19,440
kill من از
240
00:08:19,440 –> 00:08:21,840
لپ تاپ طلایی استفاده می کنم با این
241
00:08:21,840 –> 00:08:24,000
علامت سوال می روم اینجا
242
00:08:24,000 –> 00:08:24,800
243
00:08:24,800 –> 00:08:28,160
بسیار خوب پس بیایید آن را بررسی
244
00:08:28,400 –> 00:08:31,199
کنیم فقط آن را روی سیستم نصب
245
00:08:31,199 –> 00:08:34,000
کنیم تا اولین مرحله
246
00:08:34,000 –> 00:08:36,399
این است که ما باید بتوانیم تابع برچسب خود را تعریف کنیم
247
00:08:36,399 –> 00:08:38,159
تا عملکردهای
248
00:08:38,159 –> 00:08:41,839
برچسب گذاری خود
249
00:08:42,000 –> 00:08:43,279
را
250
00:08:43,279 –> 00:08:44,880
درست
251
00:08:44,880 –> 00:08:46,959
252
00:08:46,959 –> 00:08:48,160
253
00:08:48,160 –> 00:08:49,200
254
00:08:49,200 –> 00:08:50,720
255
00:08:50,720 –> 00:08:52,399
بیابیم.
256
00:08:52,399 –> 00:08:54,000
اما
257
00:08:54,000 –> 00:08:58,560
تابع برچسب گذاری برف q dot در
258
00:09:00,320 –> 00:09:03,360
سمت راست، اجازه دهید از برچسب برویم، ما فقط
259
00:09:03,360 –> 00:09:05,519
تابع فعال کردن خود را وارد می کنیم، بنابراین دو گزینه وجود دارد،
260
00:09:05,519 –> 00:09:06,880
ما تابع برچسب را با
261
00:09:06,880 –> 00:09:09,680
کوچک داریم، بعداً این گزینه را در اینجا داریم
262
00:09:09,680 –> 00:09:11,279
و سپس شما منبع
263
00:09:11,279 –> 00:09:13,040
پاندا را نیز دارید، بنابراین اگر
264
00:09:13,040 –> 00:09:14,800
پانداها اعمال شوند،
265
00:09:14,800 –> 00:09:18,080
ما نیز باید آنالیز
266
00:09:18,080 –> 00:09:19,760
درستی انجام دهیم. اینها مهمترین
267
00:09:19,760 –> 00:09:22,320
مواردی هستند که ما در نمودار خود داریم، بنابراین ما
268
00:09:22,320 –> 00:09:23,760
به یک تابع برچسب گذاری نیاز داریم تا به ما در برچسب گذاری کمک کند
269
00:09:23,760 –> 00:09:25,680
که پانداها lf
270
00:09:25,680 –> 00:09:28,640
اعمال می کنیم تا توابع ما را در
271
00:09:28,640 –> 00:09:31,040
کل مجموعه داده اعمال کنیم و سپس
272
00:09:31,040 –> 00:09:33,360
تجزیه و تحلیل تجزیه و تحلیل lf را نیز برای انجام خود داریم.
273
00:09:33,360 –> 00:09:36,000
ارزیابی، پس بیایید دوباره به عقب برگردیم، من
274
00:09:36,000 –> 00:09:37,839
آنها را وارد
275
00:09:37,839 –> 00:09:39,120
میکنم و اجازه میدهیم یک تابع ایجاد کنیم، بنابراین
276
00:09:39,120 –> 00:09:40,880
روشهای مختلفی برای ایجاد
277
00:09:40,880 –> 00:09:43,360
توابع وجود دارد،
278
00:09:44,399 –> 00:09:46,080
بنابراین
279
00:09:46,080 –> 00:09:47,360
میتوانید راههایی
280
00:09:47,360 –> 00:09:48,320
281
00:09:48,320 –> 00:09:49,680
برای ایجاد تابع برای ایجاد
282
00:09:49,680 –> 00:09:51,839
توابع درست
283
00:09:51,839 –> 00:09:53,600
بنویسید. همچنین
284
00:09:53,600 –> 00:09:55,600
میتوانید از کلمه
285
00:09:55,600 –> 00:09:59,120
کلیدی کلمه کلیدی
286
00:10:00,480 –> 00:10:03,519
استفاده کنید، بهعنوان مثال، میتوانید از یک الگوی
287
00:10:03,519 –> 00:10:04,399
جستجوی
288
00:10:04,399 –> 00:10:07,920
درست با استفاده از شاید بیان منظم
289
00:10:07,920 –> 00:10:09,680
استفاده کنید، همچنین میتوانید از مدلهای شخص ثالث
290
00:10:09,680 –> 00:10:12,720
با t استفاده کنید. کتابخانه شخص ثالث،
291
00:10:12,720 –> 00:10:14,320
بنابراین
292
00:10:14,320 –> 00:10:17,519
کتابخانهها مانند Spay،
293
00:10:17,519 –> 00:10:18,880
همه ابزارهای مناسب را برای کمک به شما در این زمینه میخواهند
294
00:10:18,880 –> 00:10:21,440
و سپس بقیه درست، بنابراین اینها موارد
295
00:10:21,440 –> 00:10:23,440
غیره هستند، اینها مهمترین ابزارهایی هستند
296
00:10:23,440 –> 00:10:24,720
که میتوانید برای ایجاد یک
297
00:10:24,720 –> 00:10:27,040
تابع برچسبگذاری استفاده کنید، ما سعی میکنیم ببینیم چگونه
298
00:10:27,040 –> 00:10:29,920
از اینها استفاده کنیم. سه روشی که شما
299
00:10:29,920 –> 00:10:31,519
باید بتوانید
300
00:10:31,519 –> 00:10:36,160
حملات ما را به درستی انجام دهید، پس بیایید اینجا را
301
00:10:36,160 –> 00:10:38,480
بچسبانیم، خوب
302
00:10:38,560 –> 00:10:40,000
حالا بیایید با آن شروع کنیم، بنابراین من
303
00:10:40,000 –> 00:10:41,279
با اولین مورد که یک
304
00:10:41,279 –> 00:10:42,399
305
00:10:42,399 –> 00:10:45,200
رویکرد کلیدواژه است شروع می کنم، بنابراین ما از قبل
306
00:10:45,200 –> 00:10:47,360
این جستجوی کلمه کلیدی را
307
00:10:47,360 –> 00:10:48,640
308
00:10:48,640 –> 00:10:50,480
309
00:10:50,480 –> 00:10:53,519
همانطور که بیان کردیم می دانیم. قبلاً اگر می خواهید یک
310
00:10:53,519 –> 00:10:55,600
انسان تشخیص دهد که آیا
311
00:10:55,600 –> 00:10:57,680
چیزی سؤال است یا نه، قبلاً بیان کردیم
312
00:10:57,680 –> 00:10:58,959
که الگوهایی وجود دارد
313
00:10:58,959 –> 00:11:00,640
که قبلاً می دانستیم آیا
314
00:11:00,640 –> 00:11:02,480
چیزی سؤال است یا نه.
315
00:11:02,480 –> 00:11:04,000
316
00:11:04,000 –> 00:11:06,240
به همین دلیل است که
317
00:11:06,240 –> 00:11:09,200
وقتی سوال این است که چرا کی کجاست
318
00:11:09,200 –> 00:11:12,079
که یک سوال درست یا سیمون
319
00:11:12,079 –> 00:11:13,440
چگونه فقط یک سوال است چه چیزی دارای
320
00:11:13,440 –> 00:11:15,040
علامت سوال است، بنابراین این الگوی است که ما
321
00:11:15,040 –> 00:11:17,760
استفاده می کنیم تا بفهمیم یک جمله سوالی است یا
322
00:11:17,760 –> 00:11:19,440
نه، بنابراین دوباره به عقب برمی گردم
323
00:11:19,440 –> 00:11:20,800
من می روم یک تابع ایجاد کنید تا به ما کمک کند آن
324
00:11:20,800 –> 00:11:22,560
را تشخیص دهیم، بنابراین بیایید با
325
00:11:22,560 –> 00:11:24,640
اولین
326
00:11:24,640 –> 00:11:26,800
تابع شروع کنیم، بنابراین اولین تابع خواهد بود، بنابراین من آن را به عنوان
327
00:11:26,800 –> 00:11:30,160
مثال میگویم تابع تزئین کننده من بنابراین برچسب،
328
00:11:30,160 –> 00:11:31,600
بنابراین این تابع برچسبگذاری از همان تابعی است
329
00:11:31,600 –> 00:11:33,600
که ما وارد کردهایم. از
330
00:11:33,600 –> 00:11:35,040
اینجا سمت
331
00:11:35,040 –> 00:11:36,880
راست یک دکوراتور است و سپس من
332
00:11:36,880 –> 00:11:38,959
میخواهم عملکردم را تعریف کنم، بنابراین
333
00:11:38,959 –> 00:11:41,120
بیایید این lf را برای تابع برچسبگذاری صدا بزنیم،
334
00:11:41,120 –> 00:11:43,680
سپس میخواهم آن را به عنوان جستجوی کلمه کلیدی
335
00:11:43,680 –> 00:11:45,600
336
00:11:45,600 –> 00:11:46,959
درست صدا بزنم، بنابراین میخواهم
337
00:11:46,959 –> 00:11:48,000
کلمه
338
00:11:48,000 –> 00:11:49,600
now passing را جستجو کنم. بنابراین،
339
00:11:49,600 –> 00:11:51,519
این مجموعه ای از داده های مجموعه داده خواهد بود
340
00:11:51,519 –> 00:11:54,079
، سپس من می خواهم کلمات کلیدی خود را مشخص کنم،
341
00:11:54,079 –> 00:11:56,399
بنابراین من کلمات کلیدی خود را در اینجا دارم، بنابراین
342
00:11:56,399 –> 00:11:58,000
بیایید همه کلمات کلیدی را که
343
00:11:58,000 –> 00:12:00,079
روی آنها کار می کنیم ارائه دهیم تا راه هایی داشته باشیم که می توانیم
344
00:12:00,079 –> 00:12:03,040
آن را ارائه دهیم. بهعنوان فهرستی مانند این، بنابراین ما داریم
345
00:12:03,040 –> 00:12:04,079
y
346
00:12:04,079 –> 00:12:06,160
347
00:12:06,160 –> 00:12:07,440
،
348
00:12:07,440 –> 00:12:09,440
وقتی داریم چه
349
00:12:09,440 –> 00:12:11,760
کسی
350
00:12:11,760 –> 00:12:13,600
داریم، درست است، بنابراین این
351
00:12:13,600 –> 00:12:15,760
سه سؤال اصلی هستند که حق
352
00:12:15,760 –> 00:12:17,839
داریم و میتوانیم از آنها برای کمک به ما در دانستن اینکه
353
00:12:17,839 –> 00:12:19,279
این یک
354
00:12:19,279 –> 00:12:22,320
سؤال است یا نه، استفاده کنیم. y را به آن اضافه کنید که چگونه
355
00:12:22,320 –> 00:12:24,160
به
356
00:12:24,160 –> 00:12:25,600
این
357
00:12:25,600 –> 00:12:27,120
بی نقص است
358
00:12:27,120 –> 00:12:29,440
حالا اجازه دهید بنویسیم یک سوال، بنابراین قبل از اینکه
359
00:12:29,440 –> 00:12:32,000
مشخص کنیم باید یک مقدار
360
00:12:32,000 –> 00:12:33,120
ثابت
361
00:12:33,120 –> 00:12:34,639
برای برچسب خود تعیین کنیم، بنابراین این
362
00:12:34,639 –> 00:12:38,079
ثابت برای برچسب های ما خواهد بود، ثابت
363
00:12:38,079 –> 00:12:40,240
برای برچسب های ما درست است،
364
00:12:40,240 –> 00:12:42,000
بنابراین اولین موردی که می خواهیم
365
00:12:42,000 –> 00:12:43,200
اگر چیزی سوالی باشد می خواهیم
366
00:12:43,200 –> 00:12:45,519
ارائه دهیم.
367
00:12:46,160 –> 00:12:49,680
این عدد صفر است پس
368
00:12:49,680 –> 00:12:51,680
اگر سوالی است این یک را رها کنید درست است اگر
369
00:12:51,680 –> 00:12:53,839
یک کد است
370
00:12:54,800 –> 00:12:57,200
می خواهید به آن صفر بدهید و اگر
371
00:12:57,200 –> 00:12:59,120
هیچ کدام از آنها خودداری
372
00:12:59,120 –> 00:13:00,639
کنید به دست آمده است مهم است که من
373
00:13:00,639 –> 00:13:02,560
به این یک منفی درست می دهم پس اینها
374
00:13:02,560 –> 00:13:04,320
استفاده از برچسبها ثابت ما خواهد بود
375
00:13:04,320 –> 00:13:06,399
،
376
00:13:06,399 –> 00:13:08,079
سپس من فقط به اینجا میآیم
377
00:13:08,079 –> 00:13:09,920
و میگوییم بسیار خوب،
378
00:13:09,920 –> 00:13:11,519
شما میتوانید با این گزینه بروید، بنابراین
379
00:13:11,519 –> 00:13:12,800
فرض کنید
380
00:13:12,800 –> 00:13:14,480
381
00:13:14,480 –> 00:13:16,399
382
00:13:16,399 –> 00:13:18,240
سؤال برگشتی،
383
00:13:18,240 –> 00:13:19,200
اگر
384
00:13:19,200 –> 00:13:20,480
چندین ویسکانسین وجود دارد، سؤال را برگردانید، اما
385
00:13:20,480 –> 00:13:22,160
بیایید همان را ادامه دهیم. فرمت مکان شما
386
00:13:22,160 –> 00:13:25,279
می توانید از طریق آنها نگاه کنید بنابراین اگر
387
00:13:27,440 –> 00:13:30,079
کلمه ما
388
00:13:31,760 –> 00:13:34,320
بیایید از ساده ترین رویکرد استفاده کنیم درست است بله
389
00:13:34,320 –> 00:13:37,920
ایران پس این سوال من خواهد بود
390
00:13:37,920 –> 00:13:39,680
بنابراین اگر
391
00:13:39,680 –> 00:13:42,320
هر یک از این کلمات وجود دارد بنابراین اگر هر یک
392
00:13:42,320 –> 00:13:45,120
از این کلمات
393
00:13:45,120 –> 00:13:48,639
در جمله من باشد بنابراین ما این جمله را داریم
394
00:13:48,639 –> 00:13:51,040
این جمله او است
395
00:13:51,040 –> 00:13:53,360
e از تابع pandas ما می آید
396
00:13:53,360 –> 00:13:55,120
در اینجا
397
00:13:55,120 –> 00:13:55,920
سمت راست
398
00:13:55,920 –> 00:13:58,079
df.head
399
00:13:58,079 –> 00:14:00,079
نام ستون جملات نامیده می شود
400
00:14:00,079 –> 00:14:02,160
401
00:14:02,160 –> 00:14:04,480
این چیزی است که شما می گذارید
402
00:14:04,480 –> 00:14:05,440
این
403
00:14:05,440 –> 00:14:06,399
همان چیزی است که در اینجا قرار می دهید بنابراین من می خواهم
404
00:14:06,399 –> 00:14:08,399
از طریق آنها نگاه کنم بنابراین اگر هر یک از این
405
00:14:08,399 –> 00:14:11,199
کلمات داخل جمله ما باشد. ستون سمت راست
406
00:14:11,199 –> 00:14:14,320
بیایید آن را با حروف کوچک
407
00:14:15,440 –> 00:14:18,079
قرار دهیم در کلمات کلیدی ما یافت می شود،
408
00:14:18,079 –> 00:14:19,600
بنابراین برای کلمه
409
00:14:19,600 –> 00:14:20,720
در
410
00:14:20,720 –> 00:14:22,079
کلمات کلیدی من
411
00:14:22,079 –> 00:14:24,480
بسیار ساده است مانند کلمه برای کلمه در کلمات کلیدی
412
00:14:24,480 –> 00:14:27,040
درست برای این اگر هر یک از این کلمات
413
00:14:27,040 –> 00:14:28,639
در جمله ما یافت شد، از شما می خواهم
414
00:14:28,639 –> 00:14:30,639
که کلمه سوال را برگردانید
415
00:14:30,639 –> 00:14:32,240
416
00:14:32,240 –> 00:14:34,959
اگر می خواهید هیچ یک از آنها را درست ممتنع پیدا نکنید،
417
00:14:34,959 –> 00:14:36,800
418
00:14:36,800 –> 00:14:38,959
بنابراین این گزینه دوم خواهد بود،
419
00:14:38,959 –> 00:14:41,839
بنابراین ما کد 0 سوال 1 و
420
00:14:41,839 –> 00:14:44,959
یک حق ممتنع داریم که یک
421
00:14:44,959 –> 00:14:46,560
راه ساده برای ایجاد یک نسخه ساده است،
422
00:14:46,560 –> 00:14:48,320
بنابراین اولین سوال ما
423
00:14:48,320 –> 00:14:49,920
424
00:14:49,920 –> 00:14:51,760
درست است. یک فلش به ما می دهد، بنابراین
425
00:14:51,760 –> 00:14:52,959
بیایید با آن روبرو شویم،
426
00:14:52,959 –> 00:14:55,279
427
00:14:57,440 –> 00:15:00,320
بله، سازنده چیزی را گم کرده است،
428
00:15:00,320 –> 00:15:03,120
پس بیایید درست با آن روبرو شویم،
429
00:15:04,320 –> 00:15:06,480
زیرا خالق کامل است،
430
00:15:06,480 –> 00:15:07,519
ما با آن تمام شده
431
00:15:07,519 –> 00:15:09,040
ایم، با اولین تابع جستجوی ما تمام شده
432
00:15:09,040 –> 00:15:11,279
است، بیایید یک تابع دیگر ایجاد کنیم، بنابراین
433
00:15:11,279 –> 00:15:13,360
من می روم بیرون تابع جستجو،
434
00:15:13,360 –> 00:15:16,160
متا2 خواهد بود
435
00:15:16,240 –> 00:15:19,680
، جستجوی کلمه کلیدی
436
00:15:19,680 –> 00:15:21,920
437
00:15:21,920 –> 00:15:24,160
این یکی جستجوی کلمه کلیدی بود، بیایید از یک
438
00:15:24,160 –> 00:15:27,760
الگوی جستجوی الگوی جستجوی درست یا
439
00:15:27,760 –> 00:15:30,480
عبارت منظم استفاده کنیم، بنابراین تابع regis،
440
00:15:30,480 –> 00:15:31,839
بنابراین میتوانید از
441
00:15:31,839 –> 00:15:33,120
عبارت منظم برای عبور از آن استفاده کنید، بنابراین بیایید
442
00:15:33,120 –> 00:15:34,560
همان کار را انجام دهیم، بنابراین
443
00:15:34,560 –> 00:15:37,360
تابع برچسبگذاری
444
00:15:37,519 –> 00:15:39,199
که ما داریم، من می خواهم
445
00:15:39,199 –> 00:15:42,240
توابع را به lf dot
446
00:15:42,320 –> 00:15:43,600
regis تعریف
447
00:15:43,600 –> 00:15:45,839
448
00:15:45,839 –> 00:15:47,440
کنم، می خواهم ببینم آیا این کلمه حاوی
449
00:15:47,440 –> 00:15:49,040
چه حقی است، بنابراین من آنجا را عبور خواهم داد، بله
450
00:15:49,040 –> 00:15:51,680
فقط با استفاده از یک سمت راست
451
00:15:51,680 –> 00:15:53,440
و من فقط می روم به همین ترتیب
452
00:15:53,440 –> 00:15:56,160
،
453
00:15:56,160 –> 00:15:58,560
454
00:15:58,720 –> 00:16:02,399
اگر نقطه ما میخواهد کلمه را جستجو
455
00:16:02,399 –> 00:16:06,560
کنیم، مثلاً r، حاوی چه
456
00:16:07,440 –> 00:16:10,959
حقی و سپس هر چیزی است و سپس
457
0