در این مطلب، ویدئو پایتون – استخراج اطلاعات از متن با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:02:24
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,880 –> 00:00:03,120
هفت خوب کلیک کنید
2
00:00:03,120 –> 00:00:06,960
عالی است، بنابراین آنچه که ما هفته گذشته به پایان رساندیم
3
00:00:06,960 –> 00:00:09,599
سناریوهای طبقه بندی بود، بنابراین ما
4
00:00:09,599 –> 00:00:10,400
در مورد
5
00:00:10,400 –> 00:00:12,799
اینکه چگونه می توانید احساسات را طبقه بندی کنید، چگونه
6
00:00:12,799 –> 00:00:13,759
7
00:00:13,759 –> 00:00:15,679
می توانید جنسیت را طبقه بندی کنید، می توانید هر چیزی را
8
00:00:15,679 –> 00:00:17,520
که دارای دسته بندی و داده های مناسب هستید طبقه بندی کنید،
9
00:00:17,520 –> 00:00:18,400
10
00:00:18,400 –> 00:00:21,119
بنابراین ما به نوعی پوشش داده ایم که اکثر
11
00:00:21,119 –> 00:00:22,000
افراد در کجا هستند.
12
00:00:22,000 –> 00:00:23,519
واقعاً علاقهمند به این نوع
13
00:00:23,519 –> 00:00:25,119
تحلیل متنی
14
00:00:25,119 –> 00:00:27,840
، یافتن طرحهای طبقهبندی است، بنابراین
15
00:00:27,840 –> 00:00:29,679
استخراج ویژگیهای شما
16
00:00:29,679 –> 00:00:32,719
میتواند از هر نوع باشد، اما عموماً برای
17
00:00:32,719 –> 00:00:35,200
این نوع تحلیلها با کلمات است و
18
00:00:35,200 –> 00:00:36,320
سپس
19
00:00:36,320 –> 00:00:38,320
سناریوی طبقهبندی um شما میتواند از هر
20
00:00:38,320 –> 00:00:40,879
نوعی باشد، ممکن است مثبت و منفی
21
00:00:40,879 –> 00:00:45,120
باشد. بله و خیر
22
00:00:45,120 –> 00:00:47,760
باشید، واقعاً یک سیستم منعطف به
23
00:00:47,760 –> 00:00:49,760
شما می دهد که در آن شما می توانید چیزی بیش از
24
00:00:49,760 –> 00:00:52,559
احساس، بیشتر از قطبیت، انجام
25
00:00:52,559 –> 00:00:54,879
دهید.
26
00:00:54,879 –> 00:00:58,239
27
00:00:58,239 –> 00:01:00,160
28
00:01:00,160 –> 00:01:02,640
29
00:01:02,640 –> 00:01:04,720
30
00:01:04,720 –> 00:01:07,280
چگونه از کار کردن با
31
00:01:07,280 –> 00:01:10,960
کلمات تکی به متن بزرگتر
32
00:01:10,960 –> 00:01:14,560
برویم و اولین چیزی که این فصل واقعاً
33
00:01:14,560 –> 00:01:15,680
در مورد تکه تکه کردن است
34
00:01:15,680 –> 00:01:18,960
فصل هشتم در مورد تجزیه است، بنابراین
35
00:01:18,960 –> 00:01:20,000
در طول ترم
36
00:01:20,000 –> 00:01:21,439
شما می خواهید برچسب گذاری را برای بخشی از طبقه بندی
37
00:01:21,439 –> 00:01:22,280
برچسب گذاری گفتار
38
00:01:22,280 –> 00:01:25,680
به صورت تکه تکه و تجزیه یاد بگیرید،
39
00:01:25,680 –> 00:01:29,600
اما هر چهار آنها
40
00:01:29,600 –> 00:01:32,240
حس و ساختار بسیار مشابهی با آنها دارند، بنابراین همه آنها
41
00:01:32,240 –> 00:01:33,840
به نوعی مربی نیاز دارند
42
00:01:33,840 –> 00:01:35,840
و آنها به نوعی
43
00:01:35,840 –> 00:01:37,600
مجموعه ویژگی نیاز دارند که بعد
44
00:01:37,600 –> 00:01:40,560
تمرین کنید و سپس به خروجی نگاه کنید خوب
45
00:01:40,560 –> 00:01:42,159
اجازه دهید ac را روشن کنم
46
00:01:42,159 –> 00:01:44,240
زیرا چند روز گذشته بسیار گرم بوده است
47
00:01:44,240 –> 00:01:45,759
و سپس ما این
48
00:01:45,759 –> 00:01:48,320
اسلایدها را اینجا شروع
49
00:01:51,920 –> 00:01:55,280
می کنیم، بنابراین
50
00:01:55,280 –> 00:01:58,000
ما صحبت کردیم. در مورد کدنویسی زیاد فکر
51
00:01:58,000 –> 00:01:59,920
کردهایم و اکنون میخواهیم
52
00:01:59,920 –> 00:02:03,200
برنامههای کوچکی بسازیم تا
53
00:02:03,200 –> 00:02:05,920
به ما کمک کند کارهای زیر را انجام دهیم تا بتوانیم
54
00:02:05,920 –> 00:02:08,080
سیستمی بسازیم که دادههایی
55
00:02:08,080 –> 00:02:11,680
مانند جداول را از متن
56
00:02:11,680 –> 00:02:13,040
57
00:02:13,040 –> 00:02:14,640
استخراج میکند. به
58
00:02:14,640 –> 00:02:17,200
نوعی استفاده از این رویه
59
00:02:17,200 –> 00:02:18,080
60
00:02:18,080 –> 00:02:21,040
برخی از کارهایی است که من انجام دادهام، ما
61
00:02:21,040 –> 00:02:22,879
میتوانیم رابطه بین
62
00:02:22,879 –> 00:02:26,400
موارد در متن را کشف کنیم و سپس از چه شرکتی
63
00:02:26,400 –> 00:02:27,680
استفاده میکنیم، در
64
00:02:27,680 –> 00:02:30,239
مورد بدنه جک و شرکت قهوهای صحبت
65
00:02:30,239 –> 00:02:30,879
کردهایم. ما
66
00:02:30,879 –> 00:02:34,160
چه مجموعههای موجود برای ما وجود دارد تا
67
00:02:34,160 –> 00:02:38,080
68
00:02:38,080 –> 00:02:42,959
ساختار جملهای را
69
00:02:44,239 –> 00:02:46,640
بسازیم، بنابراین وقتی با دادههای ساختاریافته
70
00:02:46,640 –> 00:02:47,360
71
00:02:47,360 –> 00:02:50,160
کار میکنیم، قابل پیشبینی است، اینها
72
00:02:50,160 –> 00:02:51,599
چیزهایی هستند که مانند فایلهای اکسل هستند
73
00:02:51,599 –> 00:02:55,200
یا مجموعهای دارند که میدانید هر
74
00:02:55,200 –> 00:02:56,959
خط سوم همان است. من
75
00:02:56,959 –> 00:03:00,000
میخواهم و بیشتر دادههایی که ما در اختیار داریم از نظر زبانشناسی
76
00:03:00,000 –> 00:03:01,280
ساختار مناسبی ندارند،
77
00:03:01,280 –> 00:03:04,640
78
00:03:04,640 –> 00:03:06,800
بنابراین مجموعههایی که استفاده میکنیم بسیار
79
00:03:06,800 –> 00:03:07,680
ساختارمند هستند،
80
00:03:07,680 –> 00:03:10,800
اما بعد از
81
00:03:10,800 –> 00:03:13,120
آن مشکلی که در
82
00:03:13,120 –> 00:03:13,920
هفته گذشته
83
00:03:13,920 –> 00:03:16,000
داشتیم این است که ما سعی میکنیم چکیدههایی را
84
00:03:16,000 –> 00:03:17,680
برای برخی از مقالات و مقالات علمی پیدا
85
00:03:17,680 –> 00:03:18,640
86
00:03:18,640 –> 00:03:22,400
کنیم که سپس میتوانیم از آنها برای
87
00:03:22,400 –> 00:03:25,360
پیشبینی اینکه آیا مقاله باید
88
00:03:25,360 –> 00:03:27,680
وارد طرح طبقهبندی ما شود یا نه، استفاده کنیم
89
00:03:27,680 –> 00:03:30,879
که جالب است، اما
90
00:03:30,879 –> 00:03:33,360
هر وبسایت مجله مقاله
91
00:03:33,360 –> 00:03:33,920
92
00:03:33,920 –> 00:03:35,680
خود را در چکیدههای متفاوت خود در مکان متفاوتی قرار میدهد.
93
00:03:35,680 –> 00:03:37,040
صفحه وب آنها
94
00:03:37,040 –> 00:03:38,400
و بنابراین هیچ رابطه قابل پیش بینی
95
00:03:38,400 –> 00:03:40,080
در مورد نحوه دریافت آن از
96
00:03:40,080 –> 00:03:41,440
صفحه وب آنها وجود ندارد.
97
00:03:41,440 –> 00:03:43,120
98
00:03:43,120 –> 00:03:45,120
99
00:03:45,120 –> 00:03:47,120
100
00:03:47,120 –> 00:03:50,159
101
00:03:51,040 –> 00:03:53,760
اگر بتوانم به راحتی چیزی را در
102
00:03:53,760 –> 00:03:54,239
جدول
103
00:03:54,239 –> 00:03:58,840
قرار دهم، زبان دادههای ساختاریافته است، نه چندان
104
00:03:58,840 –> 00:04:01,840
105
00:04:01,840 –> 00:04:05,200
اوه، بنابراین در اینجا نمونهای از مجموعهای جدی
106
00:04:05,200 –> 00:04:06,319
از جملات وجود دارد.
107
00:04:06,319 –> 00:04:09,840
108
00:04:09,840 –> 00:04:14,720
109
00:04:14,720 –> 00:04:17,680
110
00:04:17,680 –> 00:04:18,798
111
00:04:18,798 –> 00:04:22,160
برندهای آنها و جایی که آنها قرار دارند،
112
00:04:22,160 –> 00:04:25,919
بنابراین من به عنوان یک خواننده می توانم به شما
113
00:04:25,919 –> 00:04:29,120
114
00:04:29,120 –> 00:04:32,880
بگویم که چگونه این موجودیت ها
115
00:04:32,880 –> 00:04:34,240
با یکدیگر مرتبط هستند،
116
00:04:34,240 –> 00:04:35,759
اما به عنوان یک رایانه بسیار
117
00:04:35,759 –> 00:04:37,440
دشوار است که در مورد اینکه چگونه
118
00:04:37,440 –> 00:04:39,120
هر شرکت با هر شرکت دیگری ارتباط دارد
119
00:04:39,120 –> 00:04:41,120
بدون آن صحبت کنیم. نوشتن نوعی
120
00:04:41,120 –> 00:04:42,000
برنامه کدگذاری شده
121
00:04:42,000 –> 00:04:45,199
که بتواند این روابط متنوع را مدیریت کند،
122
00:04:45,199 –> 00:04:46,160
123
00:04:46,160 –> 00:04:47,520
منظورم این است که گاهی اوقات
124
00:04:47,520 –> 00:04:48,960
ابتدای جمله است، گاهی اوقات
125
00:04:48,960 –> 00:04:49,840
در
126
00:04:49,840 –> 00:04:51,360
عبارت اسمی است، گاهی اوقات در عبارت فعل است،
127
00:04:51,360 –> 00:04:54,720
بنابراین من باید بفهمم که چگونه
128
00:04:54,720 –> 00:04:58,639
رابطه بین آنها را تعیین کنم
129
00:05:00,320 –> 00:05:02,800
و بنابراین چیزی که ما قصد داریم به سمت آن کار کنیم
130
00:05:02,800 –> 00:05:03,360
، شناسایی موجودیت نامیده میشود،
131
00:05:03,360 –> 00:05:06,720
این جایی است که میتوانم
132
00:05:06,720 –> 00:05:10,160
معمولاً جملات
133
00:05:10,160 –> 00:05:13,520
134
00:05:13,520 –> 00:05:15,520
را بخشبندی کرده و آن موجودیتها را برای درک رابطه برچسبگذاری کنم. روابط بین آنها
135
00:05:15,520 –> 00:05:17,600
بسیار زیاد است، بنابراین ما در مورد اینکه کلمات توقف اطلاعات چندان مفیدی نیستند صحبت کرده ایم،
136
00:05:17,600 –> 00:05:19,680
137
00:05:19,680 –> 00:05:22,720
اما اکنون آنها به اطلاعات بسیار جالبی تبدیل شده اند،
138
00:05:22,720 –> 00:05:23,120
139
00:05:23,120 –> 00:05:25,759
بنابراین می توانم بگویم
140
00:05:25,759 –> 00:05:27,199
شرکت
141
00:05:27,199 –> 00:05:30,479
در نیویورک درست است و یک نشانگر رابطه خوب وجود
142
00:05:30,479 –> 00:05:31,280
دارد
143
00:05:31,280 –> 00:05:34,000
که آیتم قبل و بعد
144
00:05:34,000 –> 00:05:34,639
از
145
00:05:34,639 –> 00:05:38,240
اتصال n و بنابراین یافتن پیوندهای
146
00:05:38,240 –> 00:05:39,680
بین موجودیت
147
00:05:39,680 –> 00:05:42,400
ها اکنون می تواند از طریق ساختار جمله انجام شود
148
00:05:42,400 –> 00:05:44,800
149
00:05:46,160 –> 00:05:48,160
و بنابراین فقط یک ثانیه به من فرصت دهید که
150
00:05:48,160 –> 00:05:49,600
دوست داشته باشم دماغم را باد
151
00:05:49,600 –> 00:05:51,759
کنم زیرا من مانند
152
00:05:51,759 –> 00:05:52,639
دیوانه
153
00:05:52,639 –> 00:05:54,880
دویدن است. یک ثانیه
154
00:05:54,880 –> 00:05:56,479
دیر شما می توانید در حالی که من بالای بینی ام می روم جلو
155
00:05:56,479 –> 00:05:57,520
156
00:05:57,520 –> 00:06:07,840
بیایید و سپس من اینجا را شروع
157
00:06:40,800 –> 00:06:42,560
خواهم کرد با عرض پوزش بابت این که بچه ها
158
00:06:42,560 –> 00:06:45,199
نمی توانم نفس بکشم
159
00:06:45,199 –> 00:06:49,120
بنابراین
160
00:06:49,120 –> 00:06:51,680
اگر به روندی که طی کرده ایم فکر کنم دوباره می پرم داخل
161
00:06:51,680 –> 00:06:52,639
162
00:06:52,639 –> 00:06:54,000
درست است، بنابراین من می خواهم در یک
163
00:06:54,000 –> 00:06:56,400
رشته رشته ای از جمله
164
00:06:56,400 –> 00:06:58,720
i may یا یک پاراگراف قرار
165
00:06:58,720 –> 00:07:00,639
دهم که ممکن است آن را به دسته ای از
166
00:07:00,639 –> 00:07:02,400
جملات با نشانه گذاری جمله
167
00:07:02,400 –> 00:07:05,120
تقسیم بندی درست تقسیم
168
00:07:05,440 –> 00:07:08,000
کنم، جایی که می توانم آنها را به
169
00:07:08,000 –> 00:07:09,599
فهرستی از w تقسیم کنم.
170
00:07:09,599 –> 00:07:12,720
دستورات با نشانه گذاری می
171
00:07:12,720 –> 00:07:16,000
توانم دو تا از این کلمات را
172
00:07:16,000 –> 00:07:20,000
به برچسب گذاری قسمت های گفتار اضافه کنم
173
00:07:20,000 –> 00:07:22,400
و این لیست لیست هایی از تاپل ها است
174
00:07:22,400 –> 00:07:23,520
175
00:07:23,520 –> 00:07:25,199
و سپس اکنون می توانم این
176
00:07:25,199 –> 00:07:27,039
رابطه را بین آنها
177
00:07:27,039 –> 00:07:29,199
درست انجام دهم، بنابراین تشخیص موجودیت و تشخیص رابطه
178
00:07:29,199 –> 00:07:30,639
179
00:07:30,639 –> 00:07:34,000
معمولاً مبتنی است. در مورد درختان جمله، بنابراین
180
00:07:34,000 –> 00:07:35,840
ما می خواهیم در مورد تکه تکه شدن صحبت کنیم،
181
00:07:35,840 –> 00:07:37,840
زیرا این یک جزء مهم
182
00:07:37,840 –> 00:07:44,080
برای تشخیص رابطه است،
183
00:07:44,080 –> 00:07:47,360
184
00:07:47,360 –> 00:07:49,759
بنابراین من احساس می کنم نام
185
00:07:49,759 –> 00:07:50,639
آن وحشتناک است،
186
00:07:50,639 –> 00:07:52,800
بنابراین برخی از نام های واقعا تاسف بار
187
00:07:52,800 –> 00:07:54,639
برای چیزهای این فصل وجود دارد.
188
00:07:54,639 –> 00:07:56,479
و تکهشدن اولین مورد است،
189
00:07:56,479 –> 00:07:58,160
دومی در راه است
190
00:07:58,160 –> 00:08:01,360
خوب در جریان باشید، اما تکهشدن زمانی است که
191
00:08:01,360 –> 00:08:01,759
ما
192
00:08:01,759 –> 00:08:04,879
بخشهایی از جملات
193
00:08:04,879 –> 00:08:08,400
را به گروههایی تقسیم میکنیم، خوب است و بنابراین
194
00:08:08,400 –> 00:08:10,080
قبل از اینکه بخشی از برچسبگذاری گفتار را انجام
195
00:08:10,080 –> 00:08:11,919
دادیم، اساساً در جایی که
196
00:08:11,919 –> 00:08:13,199
n برابر است با
197
00:08:13,199 –> 00:08:17,440
یک، هر کلمه را تکه تکه میکنیم. برچسب خود را دارد
198
00:08:17,440 –> 00:08:20,000
اکنون ما می خواهیم بزرگتر از آن بسازیم
199
00:08:20,000 –> 00:08:20,639
200
00:08:20,639 –> 00:08:24,720
و عبارات اسمی و عبارات فعل را انجام دهیم،
201
00:08:24,720 –> 00:08:28,240
بنابراین عبارت اسمی عبارتی است که حاوی
202
00:08:28,240 –> 00:08:31,199
یک اسم است که به درستی بازیگر در جمله است. از آنجایی
203
00:08:31,199 –> 00:08:33,200
که عبارت فعل شامل عمل
204
00:08:33,200 –> 00:08:34,320
و جمله می شود
205
00:08:34,320 –> 00:08:36,320
و سپس ممکن است شما یک یا چند عبارت اسمی دیگر داشته باشید
206
00:08:36,320 –> 00:08:38,000
207
00:08:38,000 –> 00:08:42,080
که عبارتند از چه کسی عمل می کند
208
00:08:42,080 –> 00:08:46,080
یا این عمل در مورد چیست و غیره،
209
00:08:46,080 –> 00:08:48,720
بنابراین عبارات اسمی تمایل دارند که ما بیشتر
210
00:08:48,720 –> 00:08:49,920
روی اسم موجود در آنها تمرکز
211
00:08:49,920 –> 00:08:51,279
کنیم. به عنوان مثال این یک
212
00:08:51,279 –> 00:08:53,760
ضمیر شخصی است
213
00:08:53,760 –> 00:08:56,480
یک عبارت فعل در اینجا این زمان گذشته است
214
00:08:56,480 –> 00:08:58,880
و سپس عبارت اسمی دوم
215
00:08:58,880 –> 00:09:03,360
یک تعیین کننده یک صفت و یک اسم دارد،
216
00:09:03,360 –> 00:09:05,839
بنابراین ما باید نوعی سیستم را پیدا
217
00:09:05,839 –> 00:09:07,040
کنیم که بتواند
218
00:09:07,040 –> 00:09:10,080
عبارات اسمی یا عبارات فعل
219
00:09:10,080 –> 00:09:10,959
را
220
00:09:10,959 –> 00:09:14,560
یک um استخراج کند،
221
00:09:14,560 –> 00:09:16,240
بنابراین باید مجموعه ای از قوانین در مورد چگونگی
222
00:09:16,240 –> 00:09:19,040
ساختار اینها داشته باشید،
223
00:09:20,640 –> 00:09:22,320
بنابراین ما بیشتر بر روی عبارات اسمی
224
00:09:22,320 –> 00:09:24,080
در سخنرانی تمرکز می کنیم و سپس روی
225
00:09:24,080 –> 00:09:25,440
تکالیفی که می توانید انجام دهید،
226
00:09:25,440 –> 00:09:27,600
می توانید آن را در عبارات فعل اعمال کنید
227
00:09:27,600 –> 00:09:29,519
228
00:09:29,519 –> 00:09:31,360
و بنابراین اکنون برش دادن عبارت
229
00:09:31,360 –> 00:09:33,279
وقتی صحبت از شناسایی موجودیت و رابطه به میان میآید، محبوبترین است،
230
00:09:33,279 –> 00:09:35,040
231
00:09:35,040 –> 00:09:37,680
زیرا معمولا موجودیتها شبکه در نظر گرفته میشوند،
232
00:09:37,680 –> 00:09:38,480
233
00:09:38,480 –> 00:09:40,080
بنابراین اگر به نام شرکت
234
00:09:40,080 –> 00:09:43,040
یا نام شخصی
235
00:09:43,040 –> 00:09:44,640
فکر میکنیم، در مورد اسمهای موجود در
236
00:09:44,640 –> 00:09:46,880
جمله
237
00:09:46,880 –> 00:09:49,760
صحبت میکنیم. d تکه ها را جستجو کنید یا تکه های
238
00:09:49,760 –> 00:09:50,000
ما
239
00:09:50,000 –> 00:09:53,040
را از اسم ها بسازید،
240
00:09:53,040 –> 00:09:55,920
بنابراین در اینجا یک مثال برای بازار وجود دارد،
241
00:09:55,920 –> 00:09:58,080
بنابراین بازار اینجا یک عبارت اسمی
242
00:09:58,080 –> 00:10:00,880
برای یک رابط یا یک عبارت اضافه
243
00:10:00,880 –> 00:10:02,720
244
00:10:02,720 –> 00:10:05,120
وجود دارد سیستم مدیریت نرم افزار مدیریت سیستم
245
00:10:05,120 –> 00:10:07,440
یک عبارت اسمی دیگر است
246
00:10:07,440 –> 00:10:10,640
um برای اینجا یکی دیگر از
247
00:10:10,640 –> 00:10:14,079
سخت افزار دیجیتال اینجاست. در نهایت یک فعل
248
00:10:14,079 –> 00:10:18,399
درست شش کلمه بعد um است و سپس
249
00:10:18,399 –> 00:10:20,000
ما یک نوع عبارت قید عجیب و غریب
250
00:10:20,000 –> 00:10:24,320
داریم fragi به اندازه کافی تکه تکه شده
251
00:10:24,320 –> 00:10:27,519
252
00:10:27,519 –> 00:10:30,480
253
00:10:30,480 –> 00:10:32,320
254
00:10:32,320 –> 00:10:33,519
است.
255
00:10:33,519 –> 00:10:36,079
بنابراین این جمله در
256
00:10:36,079 –> 00:10:37,760
واقع واقعا پیچیده است
257
00:10:37,760 –> 00:10:39,839
زیرا یک جمله ساده می تواند عبارت اسمی باشد
258
00:10:39,839 –> 00:10:41,040
race
259
00:10:41,040 –> 00:10:44,240
done جملات پیچیده عبارت اسمی عبارت فعل
260
00:10:44,240 –> 00:10:44,800
261
00:10:44,800 –> 00:10:46,320
عبارت اسمی این در واقع
262
00:10:46,320 –> 00:10:48,079
چندین بند تعبیه شده دارد
263
00:10:48,079 –> 00:10:50,880
بنابراین من مانند عبارت اسمی و سپس
264
00:10:50,880 –> 00:10:51,839
عبارت فعل
265
00:10:51,839 –> 00:10:54,399
اسمی عبارت اسمی عبارت فعل عبارت
266
00:10:54,399 –> 00:10:56,560
قید عبارت اسم عبارت so it
267
00:10:56,560 –> 00:11:00,720
like بسیار پیچیده است و بنابراین این
268
00:11:00,720 –> 00:11:03,920
یکی از دلایلی است که این
269
00:11:03,920 –> 00:11:06,720
کار می تواند متفاوت باشد فیکول به این دلیل است که
270
00:11:06,720 –> 00:11:09,360
جملات بسیار خلاقانه هستند،
271
00:11:09,360 –> 00:11:11,519
بنابراین قبلاً در مورد اینکه چگونه
272
00:11:11,519 –> 00:11:13,440
مقابله با ابهام
273
00:11:13,440 –> 00:11:15,760
دشوار است صحبت کردیم همچنین مقابله با خلاقیت
274
00:11:15,760 –> 00:11:17,360
دشوار است زیرا من باید بتوانم
275
00:11:17,360 –> 00:11:19,600
عبارات اسمی را بدون توجه به جایی که آنها
276
00:11:19,600 –> 00:11:22,000
در جمله گیر کرده اند و آنها را کشف کنم. می توان
277
00:11:22,000 –> 00:11:24,720
آن را در هر جایی قرار داد،
278
00:11:26,800 –> 00:11:28,800
بنابراین یک مثال ساده در بازار
279
00:11:28,800 –> 00:11:30,959
نرم افزار مدیریت سیستم برای سخت افزار دیجیتال بسیار
280
00:11:30,959 –> 00:11:32,079
281
00:11:32,079 –> 00:11:35,839
خوب است که یک عبارت اسمی جدی است، بسیار
282
00:11:35,839 –> 00:11:39,440
خوب، از نظر فنی یک
283
00:11:39,440 –> 00:11:42,079
عبارت اسمی تشکیل دهنده در یک جمله است
284
00:11:42,079 –> 00:11:44,560
زیرا کل بازیگر است،
285
00:11:44,560 –> 00:11:46,480
اما ممکن است این را مانند چند
286
00:11:46,480 –> 00:11:49,200
اسم کوچک کوچک در نظر بگیریم. عبارات
287
00:11:49,200 –> 00:11:51,680
بنابراین بازار می تواند یک
288
00:11:51,680 –> 00:11:54,240
عبارت اضافه برای نرم افزار مدیریت سیستم باشد، بنابراین
289
00:11:54,240 –> 00:11:56,240
این می تواند یک عبارت حرف اضافه باشد
290
00:11:56,240 –> 00:11:58,639
که یک عبارت اسمی
291
00:11:58,639 –> 00:12:02,320
مانند این در اینجا و سپس یک عبارت دیگر
292
00:12:02,320 –> 00:12:03,040
293
00:12:03,040 –> 00:12:06,320
برای سخت افزار دیجیتال جاسازی شده است، بنابراین
294
00:12:06,320 –> 00:12:09,040
این نشانگرهای اضافه به ما کمک می کنند
295
00:12:09,040 –> 00:12:09,440
مانند
296
00:12:09,440 –> 00:12:11,360
oh we را ببینیم. قرار است یک عبارت اسمی جاسازی شده داشته باشیم،
297
00:12:11,360 –> 00:12:12,880
مثل اینکه اسمهای بیشتری وجود خواهند داشت
298
00:12:12,880 –> 00:12:13,360
299
00:12:13,360 –> 00:12:15,839
300
00:12:16,560 –> 00:12:18,800
و بنابراین ما آنها را به کوچکتر و کوچکتر تقسیم میکنیم.
301
00:12:18,800 –> 00:12:20,079
تکه های r
302
00:12:20,079 –> 00:12:23,040
برای نگه داشتن آنها متعامد متعامد به معنای
303
00:12:23,040 –> 00:12:24,720
جدا از یکدیگر است،
304
00:12:24,720 –> 00:12:27,519
بنابراین در حالی که این یک عبارت اسمی غول پیکر است،
305
00:12:27,519 –> 00:12:28,880
ما بیشتر می
306
00:12:28,880 –> 00:12:33,200
خواهیم ساختار عبارتی خود را در جایی که فقط یک اسم وجود دارد حفظ کنیم،
307
00:12:33,200 –> 00:12:35,760
308
00:12:36,560 –> 00:12:38,160
بنابراین در اینجا مثالی است که رئیس
309
00:12:38,160 –> 00:12:39,920
سوپ را در خانه خورد.
310
00:12:39,920 –> 00:12:42,000
باشه رئیس قبل از اسم عبارت
311
00:12:42,000 –> 00:12:43,360
قبل از
312
00:12:43,360 –> 00:12:46,880
فعل کل عبارت فعل که شامل یک
313
00:12:46,880 –> 00:12:47,600
فعل
314
00:12:47,600 –> 00:12:51,040
و دو عبارت اسمی است، بنابراین حتی اگر
315
00:12:51,040 –> 00:12:52,560
این دو در اینجا
316
00:12:52,560 –> 00:12:56,240
به نوعی سوپ خانگی هستند،
317
00:12:56,240 –> 00:12:58,560
اساساً ما می خواهیم آنها را از هم جدا کنیم تا هر
318
00:12:58,560 –> 00:13:00,720
کدام اکنون خاص خود را داشته باشد،
319
00:13:00,720 –> 00:13:04,079
بنابراین هر مسیر کوچکی در اینجا به پایان می رسد. بالا با
320
00:13:04,079 –> 00:13:05,839
یک و تنها یک پایین، زیرا این به
321
00:13:05,839 –> 00:13:07,519
ما در قسمت نهاد کمک میکند، زیرا اکنون
322
00:13:07,519 –> 00:13:08,800
میدانم که این
323
00:13:08,800 –> 00:13:13,600
اسم در خانه وجود دارد، بنابراین
324
00:13:13,920 –> 00:13:15,360
اگر من این را جدا نمیکردم،
325
00:13:15,360 –> 00:13:17,440
نمیتوانستم ببینم
326
00:13:17,440 –> 00:13:19,440
که حروف اضافه خوب هستند. نشانگرهایی که
327
00:13:19,440 –> 00:13:23,200
می خواهید یک عبارت اسمی اضافی دریافت کنید،
328
00:13:26,000 –> 00:13:27,680
بنابراین ما این کار را با
329
00:13:27,680 –> 00:13:31,200
بخشی از جملات تگ گفتاری شروع می کنیم
330
00:13:32,839 –> 00:13:34,240
331
00:13:34,240 –> 00:13:35,839
و سپس قوانین دستور زبان را می نویسیم
332
00:13:35,839 –> 00:13:38,959
تا بتوانیم این چیزها را
333
00:13:38,959 –> 00:13:41,199
از هم
334
00:13:41,199 –> 00:13:43,120
جدا کنیم. قاعده گرامر t به
335
00:13:43,120 –> 00:13:45,120
دنبال اسم است،
336
00:13:45,120 –> 00:13:46,959
بنابراین عبارات اسمی به نوعی
337
00:13:46,959 –> 00:13:48,160
تعیین کننده
338
00:13:48,160 –> 00:13:51,199
v هستند و a به دنبال آن
339
00:13:51,199 –> 00:13:55,760
ممکن است یک صفت و سپس یک
340
00:13:56,399 –> 00:13:57,760
نه، قوانین دستور زبان خود را
341
00:13:57,760 –> 00:13:59,600
با استفاده از عبارات منظم نمی نویسیم،
342
00:13:59,600 –> 00:14:03,040
اما ایده منظم است. عبارات
343
00:14:03,040 –> 00:14:06,560
از آنجا ما chunker خود را
344
00:14:06,560 –> 00:14:08,959
با قانون آموزش می دهیم بنابراین مانند
345
00:14:08,959 –> 00:14:10,720
مجموعه داده های آموزشی
346
00:14:10,720 –> 00:14:13,920
نیست، بیشتر شبیه به استفاده از این
347
00:14:13,920 –> 00:14:16,560
نوع آموزش است و سپس آزمایش می کنیم
348
00:14:16,560 –> 00:14:19,120
که کار نمی
349
00:14:19,920 –> 00:14:22,000
کند، اوه من می خواستم اینجا بگویم امیدوارم اینجا بگویم
350
00:14:22,000 –> 00:14:24,639
این بسیار شبیه
351
00:14:24,639 –> 00:14:26,720
به چیزی است که چند هفته گذشته در مورد
352
00:14:26,720 –> 00:14:27,839
353
00:14:27,839 –> 00:14:30,000
آن صحبت کردیم، جایی که ما در مورد مرحله شماره یک صحبت کردیم
354
00:14:30,000 –> 00:14:32,079
استخراج ویژگی
355
00:14:32,079 –> 00:14:34,800
ام، این اساساً استخراج ویژگی است
356
00:14:34,800 –> 00:14:37,199
در اینجا قوانین
357
00:14:37,199 –> 00:14:39,279
شماره دو این است که آموزش درست ایجاد کنید
358
00:14:39,279 –> 00:14:41,360
و مجموعه های داده را آزمایش کنید،
359
00:14:41,360 –> 00:14:42,880
اما ما نیازی نداریم یک مجموعه داده آموزشی
360
00:14:42,880 –> 00:14:45,519
چون قانون اینجاست،
361
00:14:45,519 –> 00:14:48,320
سپس آن را آموزش دهید
362
00:14:48,880 –> 00:14:52,480
و سپس آن را آزمایش کنید، بنابراین ما
363
00:14:52,480 –> 00:14:53,040
آن را اینجا آموزش میدهیم
364
00:14:53,040 –> 00:14:55,279
و سپس آزمایش میکنیم تا همان مجموعه
365
00:14:55,279 –> 00:14:58,639
رویهها باشد، ما فقط مجموعه دادهای
366
00:14:58,639 –> 00:15:00,880
برای یادگیری قوانین
367
00:15:00,880 –> 00:15:04,959
نداریم که فقط میگوییم. اینجا آیا قوانین
368
00:15:08,480 –> 00:15:10,320
درست هستند، بنابراین برای انجام این کار، من فقط
369
00:15:10,320 –> 00:15:11,519
با آن جمله شروع می کنم که
370
00:15:11,519 –> 00:15:13,199
قبلاً
371
00:15:13,199 –> 00:15:16,639
اوکی سگ زرد کوچک را دیده ایم، بنابراین دو
372
00:15:16,639 –> 00:15:17,519
صفت
373
00:15:17,519 –> 00:15:20,959
و یک اسم به صورت زمان گذشته در گربه پارس می کند
374
00:15:20,959 –> 00:15:24,320
، بنابراین اگر ما سعی می کردیم این کار را انجام دهیم.
375
00:15:24,320 –> 00:15:26,639
درک تشخیص رابطه
376
00:15:26,639 –> 00:15:28,720
چیزی که ما می دانیم این است که سگ آنها از طریق پارس
377
00:15:28,720 –> 00:15:30,079
کردن با گربه مرتبط است،
378
00:15:30,079 –> 00:15:32,800
379
00:15:33,680 –> 00:15:36,320
من می خواهم یک قانون دستور زبان ساده بنویسم
380
00:15:36,320 –> 00:15:37,440
زیرا این اولین بار است
381
00:15:37,440 –> 00:15:40,959
که یکی از این موارد را می بینیم، بنابراین بیایید
382
00:15:40,959 –> 00:15:43,279
قوانین دستور زبان را بشکنیم. سمت چپ داشته باشید
383
00:15:43,279 –> 00:15:44,560
و فکر میکنم
384
00:15:44,560 –> 00:15:47,440
در اینجا بیشتر در مورد آن صحبت میشود
385
00:15:47,759 –> 00:15:50,000
بله، بنابراین من یک مرور مختصر به شما ارائه میدهم
386
00:15:50,000 –> 00:15:50,880
سمت چپ
387
00:15:50,880 –> 00:15:54,079
388
00:15:54,079 –> 00:15:56,560
برچسب عبارت okay است، بنابراین من آن را
389
00:15:56,560 –> 00:15:57,199
np
390
00:15:57,199 –> 00:16:00,240
برای عبارت اسمی um میتوانم صدا کنم اگر بخواهم پنیر سوئیسی است،
391
00:16:00,240 –> 00:16:01,680
اما
392
00:16:01,680 –> 00:16:05,199
np منطقیتر است، پس یک
393
00:16:05,199 –> 00:16:06,240
قانون دست راست،
394
00:16:06,240 –> 00:16:09,279
بنابراین همه چیز در سمت راست
395
00:16:09,279 –> 00:16:12,959
یکی از اینجا um که نشان میدهد
396
00:16:12,959 –> 00:16:16,079
397
00:16:16,160 –> 00:16:18,320
در این مورد چه چیزی را باید جستجو کرد،
398
00:16:18,320 –> 00:16:20,839
399
00:16:20,839 –> 00:16:23,600
400
00:16:23,600 –> 00:16:25,440
الگوی تعیینکننده است.
401
00:16:25,440 –> 00:16:26,959
علامت سوال
402
00:16:26,959 –> 00:16:31,600
هر عددی از صفات
403
00:16:31,600 –> 00:16:34,720
صفر یا بیشتر صفت بنابراین یک
404
00:16:34,720 –> 00:16:36,560
صفر یا یک تعیین کننده صفر
405
00:16:36,560 –> 00:16:39,839
صفت بیشتر و سپس یک اسم
406
00:16:41,680 –> 00:16:44,800
این یک تجزیه کننده regex در نظر گرفته می شود
407
00:16:44,800 –> 00:16:48,320
و بنابراین ما در دستور زبان خود قرار می دهیم بنابراین
408
00:16:48,320 –> 00:16:50,560
تجزیه کننده chunker ما این همان چیزی است که cp مخفف آن است،
409
00:16:50,560 –> 00:16:51,279
410
00:16:51,279 –> 00:16:53,920
اکنون به دنبال این الگو خواهیم بود. و بنابراین
411
00:16:53,920 –> 00:16:54,800
412
00:16:54,800 –> 00:16:56,800
سگ زرد کوچک را پیدا میکند و سپس
413
00:16:56,800 –> 00:16:57,920
414
00:16:57,920 –> 00:17:00,560
گربه را پیدا میکند
415
00:17:03,040 –> 00:17:06,160
تا آن را آزمایش کند تا آن را اجرا کند.
416
00:17:06,160 –> 00:17:09,119
417
00:17:09,119 –> 00:17:11,039
418
00:17:11,039 –> 00:17:13,679
419
00:17:13,679 –> 00:17:15,359
420
00:17:15,359 –> 00:17:18,480
خوب یک تجزیه کننده تکه ای
421
00:17:18,480 –> 00:17:19,359
و سپس ما می خواهیم نتیجه را چاپ کنیم
422
00:17:19,359 –> 00:17:23,280
تا نتیجه یک جمله باشد
423
00:17:23,280 –> 00:17:25,199
بنابراین این یک ساختار جدید برای ما است بنابراین
424
00:17:25,199 –> 00:17:27,119
جمله is the global s
425
00:17:27,119 –> 00:17:30,960
بسته می شود اینجا عبارت اسمی ما
426
00:17:30,960 –> 00:17:34,320
نقطه زرد کوچکی است که آن را ترک کرد
427
00:17:34,320 –> 00:17:38,000
و در از
428
00:17:38,000 –> 00:17:40,400
آنجا که این عبارت فعل ما است و سپس
429
00:17:40,400 –> 00:17:42,240
عبارت اسمی دیگر ما را پیدا کرد.
430
00:17:42,240 –> 00:17:47,200
okay the cat, آن نیز می تواند برای ما ترسیم کند و
431
00:17:47,200 –> 00:17:49,679
این همان پنجره کوچکی است که ظاهر شد،
432
00:17:49,679 –> 00:17:52,559
خوب برگرد
433
00:17:54,000 –> 00:17:55,919
و من تا آخر عمر نمی توانم
434
00:17:55,919 –> 00:17:57,039
بفهمم چگونه درست کنم این بزرگتر است
435
00:17:57,039 –> 00:17:58,640
پس تیتانیم متاسفم
436
00:17:58,640 –> 00:18:00,640
اما به شما نشان می دهد که عبارت اسمی جمله
437
00:18:00,640 –> 00:18:03,200
اکنون عبارت
438
00:18:03,919 –> 00:18:07,120
now chunkers اولین گام برای
439
00:18:07,120 –> 00:18:10,000
تجزیه کننده
440
00:18:10,400 –> 00:18:12,000
کامل و تجزیه کننده کامل است، کاری که
441
00:18:12,000 –> 00:18:14,320
ما هفته آینده انجام خواهیم داد این است که کل جمله را تجزیه می کنیم،
442
00:18:14,320 –> 00:18:17,120
بنابراین ما داریم بهعنوان «اوه» بهعنوان عبارت اسمی برچسبگذاری شده است،
443
00:18:17,120 –> 00:18:19,360
عبارت اسمی عبارت اسمی و
444
00:18:19,360 –> 00:18:21,039
آن را
445
00:18:21,039 –> 00:18:23,919
کاملاً از بین میبرد، اوه صبر کنید، ما یکی را پیدا کردیم
446
00:18:23,919 –> 00:18:26,080
447
00:18:26,840 –> 00:18:28,720
448
00:18:28,720 –> 00:18:30,720
تا بیشتر شبیه این به
449
00:18:30,720 –> 00:18:32,640
450
00:18:32,640 –> 00:18:34,960
451
00:18:34,960 –> 00:18:35,919
452
00:18:35,919 –> 00:18:38,240
نظر برسیم. عبارات اسمی کوچک
453
00:18:38,240 –> 00:18:39,039
454
00:18:39,039 –> 00:18:41,039
Okay یا عبارات فعل که می توانید
455
00:18:41,039 –> 00:18:42,160
هر یک از اینها را انتخاب کنید، اما ما
456
00:18:42,160 –> 00:18:43,919
بر روی آن عبارات تمرکز می
457
00:18:43,919 –> 00:18:47,520
کنیم. مزیت تکه تکه کردن
458
00:18:47,520 –> 00:18:49,440
این است که اگر تنها کاری که
459
00:18:49,440 –> 00:18:51,440
انجام می دهید تشخیص نهاد یا تشخیص رابطه
460
00:18:51,440 –> 00:18:54,400
باشد، فقط به آن نیاز دارید. قیمت اسم
461
00:18:54,400 –> 00:18:57,600
و شاید کلمه بین آنها، اما
462
00:18:57,600 –> 00:19:01,120
شما نیازی به ساختار جمله کامل ندارید ساختار جمله
463
00:19:01,760 –> 00:19:04,799
کامل نوشتن کمی
464
00:19:04,799 –> 00:19:05,679
سخت تر است،
465
00:19:05,679 –> 00:19:11,840
همانطور که هفته آینده خواهید دید،
466
00:19:12,480 –> 00:19:14,160
بنابراین چیزی که ما می سازیم به نام الگوهای برچسب نامیده می شود آن برچسب را
467
00:19:14,160 –> 00:19:15,520
468
00:19:15,520 –> 00:19:17,280
به خاطر بسپارید. مخفف pa برچسب rt از
469
00:19:17,280 –> 00:19:20,080
گفتار
470
00:19:20,400 –> 00:19:22,240
خود الگوها
471
00:19:22,240 –> 00:19:24,160
با استفاده از این پرانتزها مشخص می شوند
472
00:19:24,160 –> 00:19:26,320
به این معنی که به دنبال آن است که می دانید
473
00:19:26,320 –> 00:19:29,440
این کلمه یک است و این کار دوم است
474
00:19:29,440 –> 00:19:31,520
و بنابراین اگر من فقط این الگو را انجام
475
00:19:31,520 –> 00:19:33,360
می دادم همیشه باید یک
476
00:19:33,360 –> 00:19:36,640
تعیین کننده و سپس یک صفت داشته باشید.
477
00:19:36,640 –> 00:19:39,039
به یاد داشته باشید که این کدها با توجه به
478
00:19:39,039 –> 00:19:40,880
مجموعه برچسب هایی که استفاده می کنید تعیین می شوند،
479
00:19:40,880 –> 00:19:44,160
بنابراین اینها به طور همزمان برچسب های جهانی هستند،
480
00:19:44,160 –> 00:19:47,919
اما اگر از پیکره قهوه ای استفاده می کنید،
481
00:19:47,919 –> 00:19:48,960
482
00:19:48,960 –> 00:19:53,679
به یاد داشته باشید که کدهای دیگری مانند nnp
483
00:19:53,679 –> 00:19:56,000
uh برای اسم خاص ما n در دلار علامت
484
00:19:56,000 –> 00:19:58,880
برای اسم جمع دارد. فکر میکنم
485
00:19:58,880 –> 00:20:01,280
و بنابراین میتوانم همه انواع
486
00:20:01,280 –> 00:20:02,640
صفتها را
487
00:20:02,640 –> 00:20:06,559
با انجام دادن ستاره نقطهای به معنای هر
488
00:20:06,559 –> 00:20:09,679
jj به اضافه هر چیز دیگری ضبط کنم، بنابراین
489
00:20:09,679 –> 00:20:12,720
نمیدانم چه گزینههایی با
490
00:20:12,720 –> 00:20:14,000
صفت در آنجا میآیند، اما
491
00:20:14,000 –> 00:20:17,120
اوه میتواند jjp jjr jj
492
00:20:17,120 –> 00:20:20,159
rp باشد. هر
493
00:20:20,159 –> 00:20:21,600
کاراکتری و ستاره به معنای
494
00:20:21,600 –> 00:20:24,480
هر تعداد کاراکتر است، بنابراین این
495
00:20:24,480 –> 00:20:25,520
ستاره نقطهای به معنای
496
00:20:25,520 –> 00:20:29,520
jj است و هر چیز دیگری که
497
00:20:29,520 –> 00:20:32,559
با jj شروع میشود
498
00:20:33,360 –> 00:20:35,280
، علامت سؤال به این معنی است که
499
00:20:35,280 –> 00:20:38,080
صفر یا یک است
500
00:20:38,080 –> 00:20:40,559
. ستاره در اینجا به معنای هر تعداد از آنها
501
00:20:40,559 –> 00:20:42,240
ze است. ro یک دو سه چهار
502
00:20:42,240 –> 00:20:45,280
هر عدد جادویی
503
00:20:45,280 –> 00:20:48,720
مثبت به معنای یک یا چند است،
504
00:20:48,720 –> 00:20:50,480
بنابراین ما به نوعی کل یک دنباله کامل
505
00:20:50,480 –> 00:20:52,240
از گزینه های مختلف را دریافت کردیم
506
00:20:52,240 –> 00:20:54,240
که در آن صفر یا یک است، بنابراین اگر ما
507
00:20:54,240 –> 00:20:55,840
داشتیم هرگز دو عامل تعیین کننده را در
508
00:20:55,840 –> 00:20:57,360
یک ردیف قرار نمی دادید، اما اگر شما آیا از دست شما عصبانی می شود،
509
00:20:57,360 –> 00:20:59,520
510
00:21:00,080 –> 00:21:02,559
پس ما هر تعداد صفت داریم
511
00:21:02,559 –> 00:21:03,360
0 1 2
512
00:21:03,360 –> 00:21:06,640
3 و بالاتر،
513
00:21:06,640 –> 00:21:09,280
متأسفم که سعی می کنم اینجا و سپس یک یا چند اسم را برجسته کنم،
514
00:21:09,280 –> 00:21:11,520
515
00:21:11,520 –> 00:21:12,799
بنابراین سخت ترین قسمت برای من این است
516
00:21:12,799 –> 00:21:14,799
که به یاد بیاورم علامت سوال
517
00:21:14,799 –> 00:21:16,720
کدام یک است. ستاره غیره است،
518
00:21:16,720 –> 00:21:18,559
بنابراین من به یاد میآورم
519
00:21:18,559 –> 00:21:21,679
که اوه صفر یا یک مثل
520
00:21:21,679 –> 00:21:26,799
این است که ممکن است اتفاق بیفتد یا ممکن است رخ ندهد علامت سوال به
521
00:21:27,280 –> 00:21:30,400
این
522
00:21:30,400 –> 00:21:34,559
معنی است که من یک یا یک به علاوه یک دارم،
523
00:21:34,559 –> 00:21:36,559
بنابراین وقتی مردم در مورد بیرون رفتن
524
00:21:36,559 –> 00:21:38,000
در رویدادها یا رفتن به یک مکان صحبت میکنند. آنها
525
00:21:38,000 –> 00:21:40,080
در مورد عروسی خود صحبت می کنند که به علاوه یک شما
526
00:21:40,080 –> 00:21:42,159
درست است، منظورم این است که حداقل شما
527
00:21:42,159 –> 00:21:43,120
دیگر آنجا هستید،
528
00:21:43,120 –> 00:21:44,799
بنابراین من به این فکر می کنم که
529
00:21:44,799 –> 00:21:47,520
آیا دعوتنامه عروسی شما یک پلاس یک دارید
530
00:21:47,520 –> 00:21:48,880
و سپس ستاره تنها چیزی است که
531
00:21:48,880 –> 00:21:51,440
باقی مانده است، واقعاً صادقانه
532
00:21:51,440 –> 00:21:52,080
آن را به
533
00:21:52,080 –> 00:21:53,600
یاد دارم. به نوعی من آن را نگه می
534
00:21:53,600 –> 00:21:56,720
دارم آیا من در ذهنم هستم، صفحات آموزشی
535
00:21:56,720 –> 00:21:59,840
regex زیادی وجود دارد،
536
00:21:59,840 –> 00:22:03,679
اگرچه اگر
537
00:22:07,280 –> 00:22:09,600
همه چیز را فراموش کردید، بنابراین وقتی از این تجزیه کننده regex استفاده
538
00:22:09,600 –> 00:22:11,120
539
00:22:11,120 –> 00:22:13,360
می کنیم، می توانیم اساساً با گفتن اینکه
540
00:22:13,360 –> 00:22:15,200
ساختاری وجود ندارد، جمله این
541
00:22:15,200 –> 00:22:17,440
542
00:22:18,240 –> 00:22:21,120
است که قوانین را یکی یکی اعمال کنید.
543
00:22:21,120 –> 00:22:21,919
بنابراین اگر
544
00:22:21,919 –> 00:22:24,960
چندین قانون دارید که می توانید انجام دهید،
545
00:22:24,960 –> 00:22:26,720
این جمله را طی می کند و
546
00:22:26,720 –> 00:22:29,760
قانون اول را به طور کامل اعمال می
547
00:22:29,760 –> 00:22:30,720
کند،
548
00:22:30,720 –> 00:22:32,159
سپس از آنچه باقی مانده است عبور می کند
549
00:22:32,159 –> 00:22:34,720
و قانون دوم را اعمال می کند،
550
00:22:34,720 –> 00:22:36,159
بنابراین معمولاً می خواهید با پیچیده ترین کار خود شروع کنید.
551
00:22:36,159 –> 00:22:37,919
ساختار
552
00:22:37,919 –> 00:22:39,760
را بسازید و به
553
00:22:39,760 –> 00:22:41,840
ساختار کمپیچیدهتر بروید،
554
00:22:41,840 –> 00:22:45,440
زیرا اگر
555
00:22:45,440 –> 00:22:48,159
عبارت اسمی مناسب را انجام دهم،
556
00:22:48,159 –> 00:22:48,880
557
00:22:48,880 –> 00:22:51,440
ابتدا ممکن است عبارت اسمی مناسب را در یک عبارت معین از دست بدهم،
558
00:22:51,440 –> 00:22:55,440
559
00:22:55,440 –> 00:22:59,200
بنابراین در اینجا یک قاعده
560
00:22:59,200 –> 00:23:02,960
یا حرف اضافه وجود دارد
561
00:23:02,960 –> 00:23:05,039
و حرف اضافه ممکن است دارای یک عبارت باشد.
562
00:23:05,039 –> 00:23:06,960
علامت دلار بعد از آن این اسلش در اینجا یک
563
00:23:06,960 –> 00:23:09,360
کاراکتر فرار است پس حرف اضافه
564
00:23:09,360 –> 00:23:12,400
گاهی اوقات با علامت دلار
565
00:23:12,400 –> 00:23:14,080
به یاد داشته باشید علامت سوال به معنای صفر یا
566
00:23:14,080 –> 00:23:16,480
یکی از آن
567
00:23:16,480 –> 00:23:20,840
صفت um صفر یا بیشتر است. es و یک اسم واحد
568
00:23:20,840 –> 00:23:23,120
569
00:23:23,120 –> 00:23:25,600
که قانون شماره یک است، بنابراین این همان
570
00:23:25,600 –> 00:23:26,960
چیزی است که ما
571
00:23:26,960 –> 00:23:28,400
572
00:23:28,400 –> 00:23:31,360
573
00:23:32,320 –> 00:23:35,200
574
00:23:35,200 –> 00:23:38,640
575
00:23:39,280 –> 00:23:42,880
میدیدیم، اما اکنون آن را به اضافههای اضافه تغییر دادهایم و بنابراین لوله در اینجا نماد یا تعیینکننده است یا حرف اضافه nnp یک عبارت اسمی مناسب
576
00:23:42,880 –> 00:23:45,600
این است. زمانی است که شما بانک مانند چاههای فارگو دارید،
577
00:23:45,600 –> 00:23:46,320
578
00:23:46,320 –> 00:23:49,440
درست همه آنها اسم هستند، اما همه آنها
579
00:23:49,440 –> 00:23:50,000
580
00:23:50,000 –> 00:23:51,440
با هم ترکیب میشوند، زیرا چاههای فارگو از نظر
581
00:23:51,440 –> 00:23:53,520
فنی بانک را تغییر میدهند، این است که کدام
582
00:23:53,520 –> 00:23:54,400
بانک است،
583
00:23:54,400 –> 00:23:56,400
اما صفت در نظر گرفته
584
00:23:56,400 –> 00:24:00,320
نمیشود زیرا نام مناسبی
585
00:24:02,799 –> 00:24:06,400
نیست، پس بیایید یک قانون r در اینجا برای نشان دادن عبارات با قاعده ایجاد کنید
586
00:24:06,400 –> 00:24:08,080
587
00:24:08,080 –> 00:24:09,679
سه نقل قول برای نشان دادن اینکه شما می خواهید
588
00:24:09,679 –> 00:24:12,640
از چند خط
589
00:24:13,360 –> 00:24:16,320
عبارت اسمی سمت چپ استفاده کنید و این هم
590
00:24:16,320 –> 00:24:17,200
591
00:24:17,200 –> 00:24:19,440
تعیین کننده ما مالکیت است.
592
00:24:19,440 –> 00:24:22,159
593
00:24:22,159 –> 00:24:25,520
594
00:24:25,520 –> 00:24:27,810
595
00:24:27,810 –> 00:24:28,960
596
00:24:28,960 –> 00:24:32,240
یک نماد خاص
597
00:24:32,240 –> 00:24:35,360
یا اسمهای خاص است،
598
00:24:35,360 –> 00:24:38,480
بنابراین ما این قانون را نوشتیم که چگونه
599
00:24:38,480 –> 00:24:39,360
اینها را
600
00:24:39,360 –> 00:24:42,400
آزمایش و خطا بنویسید.
601
00:24:42,400 –> 00:24:45,039
602
00:24:45,039 –> 00:24:46,000
603
00:24:46,000 –> 00:24:47,760
om کتاب
604
00:24:47,760 –> 00:24:49,200
و سپس آن را ویرایش کنید تا زمانی
605
00:24:49,200 –> 00:24:51,200
که با آنچه که میخواهید نتیجه بگیرید مطابقت داشته باشد،
606
00:24:51,200 –> 00:24:53,760
607
00:24:53,840 –> 00:24:58,240
بنابراین در اینجا ویژگیهای من است
608
00:24:58,240 –> 00:25:00,720
که مینویسم، من یک
609
00:25:00,720 –> 00:25:02,799
تجزیهکننده عبارات منظم با آن
610
00:25:02,799 –> 00:25:03,840
قوانین آموزش میدهم
611
00:25:03,840 –> 00:25:05,279
تا همه شما خوب باشید انجام دهید این است که فقط به گرامر پایبند باشید
612
00:25:05,279 –> 00:25:07,279
613
00:25:07,279 –> 00:25:09,360
و من یک جمله به آن میگویم: باشه
614
00:25:09,360 –> 00:25:11,760
راپونزل راپونزل موهای بلند
615
00:25:11,760 –> 00:25:15,039
طلاییاش را رها کرد،
616
00:25:15,039 –> 00:25:18,240
با توجه به این قوانین، باید موهای طلایی بلند او را بگیرم
617
00:25:18,240 –> 00:25:21,520
تا او به
618
00:25:21,520 –> 00:25:24,080
619
00:25:25,840 –> 00:25:28,000
عنوان یک عبارت اسمی مالکیت داشته باشد و سپس راپونزل
620
00:25:28,000 –> 00:25:30,720
که یک عبارت درست است. اسم
621
00:25:30,720 –> 00:25:34,640
بهعنوان یک اسم مجزا است، بنابراین اول آن را پاس
622
00:25:34,640 –> 00:25:37,360
کنید، تمام انتهای جمله
623
00:25:37,360 –> 00:25:39,039
را میکشد، پاس دوم راپونزل میگیرد،
624
00:25:39,039 –> 00:25:41,440
اما واقعاً به شما نشان نمیدهد که
625
00:25:41,440 –> 00:25:44,080
راههایی وجود دارد که به شما نشان دهد که
626
00:25:44,080 –> 00:25:44,799
627
00:25:44,799 –> 00:25:48,159
میتوانید آن را یاد بگیرید. فصل بعدی
628
00:25:48,480 –> 00:25:52,080
اما تنها چیزی که ما اکنون می بینیم این خروجی
629
00:25:52,159 –> 00:25:55,279
است اگر به تجزیه یک جمله بروید و چیزی صفر چاپ نکند به
630
00:25:55,279 –> 00:25:56,720
631
00:25:56,720 –> 00:26:00,080
این معنی است که
632
00:26:00,080 –> 00:26:01,919
چیزی را که به دنبالش بودید پیدا نکرده است
633
00:26:01,919 –> 00:26:04,960
یا درست کار نمی کند،
634
00:26:04,960 –> 00:26:07,600
بنابراین گاهی اوقات شما یک خطا دریافت کنید، بنابراین اگر
635
00:26:07,600 –> 00:26:08,640
636
00:26:08,640 –> 00:26:10,400
um دارید این واقعا بیشتر است از
637
00:26:10,400 –> 00:26:11,679
فصل بعد، اما
638
00:26:11,679 –> 00:26:13,039
گاهی اوقات شما خطایی را مشاهده می کنید که در
639
00:26:13,039 –> 00:26:14,720
آن همه نمادهای مناسب را
640
00:26:14,720 –> 00:26:17,039
اساساً درج
641
00:26:17,039 –> 00:26:20,480
نمی کنید، اما اگر به معنای واقعی کلمه چیزی چاپ نمی
642
00:26:20,480 –> 00:26:22,240
کند، به این دلیل است که نمی تواند
643
00:26:22,240 –> 00:26:24,080
بفهمد شما از جمله چه می خواهید.
644
00:26:24,080 –> 00:26:25,919
645
00:26:25,919 –> 00:26:27,520
آن ساختار را در جمله پیدا نکنید یا
646
00:26:27,520 –> 00:26:30,559
نتوانستید خودتان را تجزیه کنید،
647
00:26:30,559 –> 00:26:39,039
بنابراین خروجی خالی نشانه بدی است،
648
00:26:39,039 –> 00:26:41,840
بنابراین اگر قوانین ما با هم تداخل داشته باشند چه کاری انجام می دهد
649
00:26:41,840 –> 00:26:44,480
650
00:26:45,360 –> 00:26:47,679
و بنابراین فرض کنید تصمیم گرفتیم که
651
00:26:47,679 –> 00:26:48,960
قانون ما در
652
00:26:48,960 –> 00:26:53,039
اینجا یک مثال دو اسم در یک است.
653
00:26:53,039 –> 00:26:56,400
هر دو اسم را ردیف کنید، بنابراین
654
00:26:56,400 –> 00:26:58,480
اگر عبارت صندوق بازار پول را به آن بدهیم
655
00:26:58,480 –> 00:26:59,440
656
00:26:59,440 –> 00:27:01,919
چه اتفاقی میافتد، زیرا در تئوری
657
00:27:01,919 –> 00:27:03,279
که میتواند بازار پول
658
00:27:03,279 –> 00:27:06,400
باشد، میتواند صندوق بازار باشد یا یکی از
659
00:27:06,400 –> 00:27:08,159
آنها درست باشد، هر دو با توجه به جمله ما مناسب خواهند بود.
660
00:27:08,159 –> 00:27:10,080
661
00:27:10,080 –> 00:27:12,799
662
00:27:12,799 –> 00:27:14,880
قبل از چپ به این دلیل است
663
00:27:14,880 –> 00:27:18,159
که شما انگلیسی را از چپ به راست میدانید
664
00:27:18,159 –> 00:27:20,159
، میخواهد بگوید بازار پول را پیدا کنید و
665
00:27:20,159 –> 00:27:21,279
آن را بیرون بکشید،
666
00:27:21,279 –> 00:27:23,840
بنابراین وقتی اینها پردازش میشوند،
667
00:27:23,840 –> 00:27:25,760
اساساً آن را تکه تکه میکند، آن را
668
00:27:25,760 –> 00:27:26,399
خارج میکند
669
00:27:26,399 –> 00:27:28,240
و میگوید خوب چه چیزی باقی مانده است.
670
00:27:28,240 –> 00:27:30,240
آن را برداشته و سپس فقط یک
671
00:27:30,240 –> 00:27:31,440
اسم است، بنابراین در واقع
672
00:27:31,440 –> 00:27:34,399
اسم دیگر را کاملاً بیرون میگذارد، در
673
00:27:34,399 –> 00:27:36,080
نهایت به یک عبارت اسمی
674
00:27:36,080 –> 00:27:40,960
ختم نمیشود، اما این فقط یک کلمه اضافی خواهد بود،
675
00:27:41,200 –> 00:27:45,279
بنابراین ما او را آموزش میدهیم. تجزیه کننده چک کننده
676
00:27:45,279 –> 00:27:49,120
در این مجموعه از قوانین دستور زبان چاپ شده است،
677
00:27:49,120 –> 00:27:50,559
می توانید ببینید که من با یک عبارت اسمی به پایان
678
00:27:50,559 –> 00:27:53,039
رسیدم
679
00:27:53,039 –> 00:27:55,200
و سپس این یکی دیگر فقط در حال معاشرت
680
00:27:55,200 –> 00:27:57,440
است،
681
00:27:58,000 –> 00:28:00,880
بنابراین اغلب ترفند اینجا واقعاً
682
00:28:00,880 –> 00:28:03,279
یافتن انعطاف پذیرترین نقش است که
683
00:28:03,279 –> 00:28:06,159
بیشتر موقعیت ها را پوشش می دهد،
684
00:28:06,159 –> 00:28:07,919
زیرا روشهای مختلفی
685
00:28:07,919 –> 00:28:10,240
برای نوشتن عبارات اسمی وجود دارد.
686
00:28:10,240 –> 00:28:12,080
687
00:28:12,080 –> 00:28:14,240
688
00:28:14,240 –> 00:28:16,720
689
00:28:16,720 –> 00:28:18,720
690
00:28:18,720 –> 00:28:21,039
691
00:28:23,279 –> 00:28:24,880
692
00:28:24,880 –> 00:28:27,039
چون این
693
00:28:27,039 –> 00:28:27,760
عبارت
694
00:28:27,760 –> 00:28:32,320
ام اوهوم نوعی توهین نژادی است،
695
00:28:32,320 –> 00:28:34,799
بنابراین من پیشاپیش عذرخواهی
696
00:28:34,799 –> 00:28:36,640
میکنم، زیرا این را پیدا کردم، ای کاش آنها فقط این عبارت را حذف میکردند،
697
00:28:36,640 –> 00:28:38,399
698
00:28:38,399 –> 00:28:41,520
اما اگر
699
00:28:41,520 –> 00:28:43,520
بخشهایی را حذف کنیم، بخشهایی باقی میماند که در یک قطعه گنجانده نشده است.
700
00:28:43,520 –> 00:28:45,520
701
00:28:45,520 –> 00:28:48,559
بنابراین آنچه که ما می توانیم انجام دادن این است که در آن جهت کار کنیم،
702
00:28:48,559 –> 00:28:49,679
703
00:28:49,679 –> 00:28:52,000
بنابراین به جای اینکه تکه ها را بیرون بیاوریم، می توانیم
704
00:28:52,000 –> 00:28:52,720
705
00:28:52,720 –> 00:28:56,000
بخش هایی را که نمی خواهیم بیرون بیاوریم یا آن ها را بیرون
706
00:28:56,000 –> 00:28:58,640
بیاوریم تا بدانیم که عبارات اسمی می خواهیم،
707
00:28:58,640 –> 00:29:00,320
یید فقط تمام اف
708
00:29:00,320 –> 00:29:00,960
الی را که
709
00:29:00,960 –> 00:29:02,480
می خواهیم چند افعال احمقانه را بر
710
00:29:02,480 –> 00:29:04,559
اریم. آنها را از بین ببرید
711
00:29:04,559 –> 00:29:06,240
و این از آن ایده از
712
00:29:06,240 –> 00:29:08,399
عبارت گونه در زره ناشی
713
00:29:08,399 –> 00:29:10,840
714
00:29:10,840 –> 00:29:13,840
715
00:29:15,919 –> 00:29:19,200
716
00:29:19,200 –> 00:29:21,520
717
00:29:21,520 –> 00:29:23,520
می شود. بیرون کشیدن چیزهایی
718
00:29:23,520 –> 00:29:26,399
که نمیخواهید به جای
719
00:29:26,399 –> 00:29:29,440
بیرون کشیدن چیزهایی که میخواهید،
720
00:29:29,440 –> 00:29:33,520
بنابراین اگر یک بخش را بیرون میآورید
721
00:29:33,520 –> 00:29:35,440
و دنباله با یک کل مطابقت دارد
722
00:29:35,440 –> 00:29:37,279
،
723
00:29:37,279 –> 00:29:39,039
اگر کاملاً مطابقت داشته باشد، کل آن حذف میشود، فقط
724
00:29:39,039 –> 00:29:41,679
کل قسمت
725
00:29:41,679 –> 00:29:44,880
را بیرون بکشید. چیزی که شما به دنبال آن هستید
726
00:29:44,880 –> 00:29:48,159
در وسط تکه است که آن را حذف می کند،
727
00:29:48,159 –> 00:29:48,880
728
00:29:48,880 –> 00:29:50,399
بنابراین بیایید بگوییم که جمله
729
00:29:50,399 –> 00:29:52,640
سگ آبی است
730
00:29:52,640 –> 00:29:54,080
را داریم، نمی دانم چرا اما بیایید با آن پیش برویم
731
00:29:54,080 –> 00:29:55,919
و شما به دنبال افعالی
732
00:29:55,919 –> 00:29:57,120
هستید که با کل شروع می کنید. جمله the
733
00:29:57,120 –> 00:29:59,440
dog is blue است شما
734
00:29:59,440 –> 00:30:01,679
متوجه می شوید که من هستم n وسط تمام این
735
00:30:01,679 –> 00:30:03,600
تکه جمله،
736
00:30:03,600 –> 00:30:05,200
بنابراین شما هست را بیرون می آورید و اکنون
737
00:30:05,200 –> 00:30:07,120
با سگ و آبی
738
00:30:07,120 –> 00:30:09,360
به عنوان دو تکه جدید مجزا می مانید، زیرا
739
00:30:09,360 –> 00:30:12,559
740
00:30:12,559 –> 00:30:15,279
اگر در عوض سعی دارید آن را بیرون بیاورید، وسط دیگری را انتخاب می کنید.
741
00:30:15,279 –> 00:30:16,799
742
00:30:16,799 –> 00:30:18,799
سگ آبی است و در
743
00:30:18,799 –> 00:30:20,240
ابتدای قطعه است
744
00:30:20,240 –> 00:30:22,080
v فقط ابتدا را حذف می کند و
745
00:30:22,080 –> 00:30:25,360
بقیه گچ ثابت می ماند،
746
00:30:25,600 –> 00:30:28,159
بنابراین تعداد تکه هایی که
747
00:30:28,159 –> 00:30:28,640
748
00:30:28,640 –> 00:30:30,399
در پایان به آنها پایان می دهید بستگی به جایی دارد که
749
00:30:30,399 –> 00:30:33,679
کلماتی را که می خواهید حذف کنید.
750
00:30:34,840 –> 00:30:37,840
اتفاق بیفتد
751
00:30:39,360 –> 00:30:44,559
تا بتوانید
752
00:30:44,559 –> 00:30:48,080
اینها را با هم ترکیب کنید،
753
00:30:48,080 –> 00:30:49,760
بنابراین من میخواهم یک عبارت اسمی