در این مطلب، ویدئو Word2Vec چیست؟ یک توضیح ساده | آموزش عمیق 41 (Tensorflow، Keras و Python) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:18:27
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:02,000
کلمه به کار تکنیکی در
2
00:00:02,000 –> 00:00:04,080
علوم کامپیوتر است که به شما امکان می دهد
3
00:00:04,080 –> 00:00:06,640
ریاضیات را با کلمه انجام دهید برای مثال
4
00:00:06,640 –> 00:00:09,200
می توانید این معادله را به یک کامپیوتر بدهید
5
00:00:09,200 –> 00:00:11,920
که چیزی شبیه پادشاه منهای
6
00:00:11,920 –> 00:00:13,360
مردان به اضافه زن
7
00:00:13,360 –> 00:00:16,160
خواهد بود و کامپیوتر به شما می گوید که پاسخ
8
00:00:16,160 –> 00:00:17,359
9
00:00:17,359 –> 00:00:20,400
ملکه چیست.
10
00:00:20,400 –> 00:00:23,199
این شگفتانگیز است که بسیار جالب است و واقعاً خوب کار میکند
11
00:00:23,199 –> 00:00:23,760
12
00:00:23,760 –> 00:00:26,320
و من این را نمیسازم، بنابراین چگونه
13
00:00:26,320 –> 00:00:27,920
رایانه میتواند این کار را به خوبی انجام دهد به
14
00:00:27,920 –> 00:00:29,840
این فکر کنید که رایانهها
15
00:00:29,840 –> 00:00:31,119
متن
16
00:00:31,119 –> 00:00:34,079
را نمیفهمند تا اعداد را بفهمند، بنابراین اگر
17
00:00:34,079 –> 00:00:35,760
راهی برای نمایش وجود دارد یک کلمه
18
00:00:35,760 –> 00:00:40,000
پادشاه در یک عدد به گونه ای که می تواند به
19
00:00:40,000 –> 00:00:42,399
طور دقیق معنی
20
00:00:42,399 –> 00:00:43,520
کلمه پادشاه را نشان دهد
21
00:00:43,520 –> 00:00:45,600
اکنون آن عدد نمی تواند یک عدد باشد
22
00:00:45,600 –> 00:00:47,200
بنابراین باید
23
00:00:47,200 –> 00:00:49,760
مجموعه ای از اعداد داشته باشید و در ریاضیات به مجموعه
24
00:00:49,760 –> 00:00:51,360
اعداد بردار می گویند
25
00:00:51,360 –> 00:00:53,600
پس بیایید به این فکر کنیم که ما چطور
26
00:00:53,600 –> 00:00:55,280
کار بر
27
00:00:55,280 –> 00:00:57,920
روی یک بردار را نشان می دهد که فقط یک دسته از
28
00:00:57,920 –> 00:00:58,879
اعداد است به
29
00:00:58,879 –> 00:01:01,199
طوری که می تواند
30
00:01:01,199 –> 00:01:02,079
معنی کلمه
31
00:01:02,079 –> 00:01:05,600
پادشاه را به طور دقیق نشان دهد. اکنون فکر کنید که king
32
00:01:05,600 –> 00:01:08,400
king ویژگی متفاوتی دارد بنابراین
33
00:01:08,400 –> 00:01:10,720
راه های مختلفی برای نمایش وجود دارد. استفاده
34
00:01:10,720 –> 00:01:12,560
از کلمه پادشاه به عنوان مثال پادشاه دارای
35
00:01:12,560 –> 00:01:14,479
اقتدار است
36
00:01:14,479 –> 00:01:17,600
پادشاه ثروتمند است معمولاً پادشاه
37
00:01:17,600 –> 00:01:22,000
دارای جنسیت مذکر است خوب
38
00:01:22,000 –> 00:01:25,119
آیا پادشاه دم
39
00:01:25,119 –> 00:01:26,960
دارد هیچ اسبی معمولاً دم درستی ندارد
40
00:01:26,960 –> 00:01:28,960
بنابراین پاسخ صفر خواهد بود
41
00:01:28,960 –> 00:01:32,000
پس اگر این کار را به خوبی انجام دهیم
42
00:01:32,000 –> 00:01:33,040
برای اقتدار چه می شود
43
00:01:33,040 –> 00:01:36,159
ما عدد یک را برای دم میدهیم،
44
00:01:36,159 –> 00:01:37,680
عدد صفر را میدهیم زیرا
45
00:01:37,680 –> 00:01:41,040
پادشاه برای پولدار بودن دم ندارد
46
00:01:41,040 –> 00:01:43,360
، عدد یک را به معنای فوقالعاده
47
00:01:43,360 –> 00:01:44,079
غنی
48
00:01:44,079 –> 00:01:47,119
صفر به معنای بسیار فقیر و برای جنسیت
49
00:01:47,119 –> 00:01:48,960
فرض کنید عدد منهای یک منهای یک را میدهیم.
50
00:01:48,960 –> 00:01:50,479
51
00:01:50,479 –> 00:01:53,920
نر است و یکی ماده است حالا ما
52
00:01:53,920 –> 00:01:56,880
به این بردار رسیدیم یک صفر یک منهای یک
53
00:01:56,880 –> 00:01:59,920
که نشان دهنده معنای کلمه
54
00:01:59,920 –> 00:02:02,079
پادشاه است شما می توانید مشابه آن را با
55
00:02:02,079 –> 00:02:04,880
کلمه دیگری انجام دهید به عنوان مثال اسب برای اسب
56
00:02:04,880 –> 00:02:08,000
دم دارایی یکی می شود
57
00:02:08,000 –> 00:02:10,479
اما خاصیت دیگر مانند اقتدار
58
00:02:10,479 –> 00:02:12,080
ثروتمند بودن و غیره
59
00:02:12,080 –> 00:02:14,720
نزدیک به صفر خواهد بود و اگر این کار را
60
00:02:14,720 –> 00:02:15,520
برای
61
00:02:15,520 –> 00:02:17,120
انواع کلمات مختلف در
62
00:02:17,120 –> 00:02:20,080
دایره لغات خود انجام دهید، می توانید
63
00:02:20,080 –> 00:02:22,160
یک ریاضی انجام دهید، بنابراین اجازه دهید یک
64
00:02:22,160 –> 00:02:24,239
مثال بسیار ساده را در اینجا
65
00:02:24,239 –> 00:02:26,080
به شما نشان دهم، فرض کنید من یک داستان از پادشاه دارم. و
66
00:02:26,080 –> 00:02:27,680
ملکه الف و من میخواهم
67
00:02:27,680 –> 00:02:30,959
تمام کلمات آن داستان را با
68
00:02:30,959 –> 00:02:33,680
بردارهای کلمه در اینجا نشان دهم،
69
00:02:33,680 –> 00:02:35,440
ویژگیهای مختلفی مانند هشتگ رویداد اقتدار
70
00:02:35,440 –> 00:02:37,599
و غیره دارم و فرض
71
00:02:37,599 –> 00:02:39,120
کنید کلمهای به نام جنگ
72
00:02:39,120 –> 00:02:41,840
برای نبرد جنگ یک رویداد است، بنابراین
73
00:02:41,840 –> 00:02:43,680
آن مقدار یک مقدار باقیمانده است. آیا
74
00:02:43,680 –> 00:02:44,959
75
00:02:44,959 –> 00:02:47,680
اسب صفر دم دارد به همین دلیل است که یک
76
00:02:47,680 –> 00:02:50,400
اسب ممکن است قدرت کمی داشته باشد
77
00:02:50,400 –> 00:02:54,319
0.01 یا ممکن است کمی ثروتمند باشد 0.1
78
00:02:54,319 –> 00:02:57,360
اگر اسب پادشاه باشد
79
00:02:57,360 –> 00:03:00,720
بنابراین و جنسیت آن 1 است. در اینجا مانند
80
00:03:00,720 –> 00:03:03,599
مقادیر ممکن است 0 نباشد زیرا به
81
00:03:03,599 –> 00:03:04,879
شما می گویم دلیل پشت
82
00:03:04,879 –> 00:03:08,000
آن کمی بعد، اما زمانی که شما پادشاه را دارید،
83
00:03:08,000 –> 00:03:11,760
قبلاً دیدیم که 1 0 0 1 -1 است
84
00:03:11,760 –> 00:03:14,239
و برای کلمات مختلف می
85
00:03:14,239 –> 00:03:15,440
توانید این
86
00:03:15,440 –> 00:03:18,800
نوع بردارهای مختلف را پیدا کنید و هنگامی
87
00:03:18,800 –> 00:03:20,480
که بردارها را دارید می توانید ریاضیات را انجام دهید،
88
00:03:20,480 –> 00:03:22,640
بنابراین اکنون که من شاه منهای
89
00:03:22,640 –> 00:03:23,360
مردان به اضافه
90
00:03:23,360 –> 00:03:27,519
زن فقط یک ریاضی ساده انجام می دهم 1 منهای 0.2
91
00:03:27,519 –> 00:03:29,760
به اضافه 0.2 می شود 1
92
00:03:29,760 –> 00:03:32,480
0 0 من عناصر جداگانه را در نظر می گیرم خوب
93
00:03:32,480 –> 00:03:34,799
یک منهای نقطه سه نقطه هفت
94
00:03:34,799 –> 00:03:37,920
به اضافه نقطه دو نقطه نه است و آن
95
00:03:37,920 –> 00:03:41,280
بردار نتیجه شبیه بردار است
96
00:03:41,280 –> 00:03:42,480
ملکه
97
00:03:42,480 –> 00:03:43,760
دقیقا اینطور نیست همان است، اما
98
00:03:43,760 –> 00:03:45,360
کاملاً مشابه نقطه نهم است و یکی
99
00:03:45,360 –> 00:03:47,200
که تنها تفاوت دارد،
100
00:03:47,200 –> 00:03:49,920
بنابراین قبلاً
101
00:03:49,920 –> 00:03:51,840
دیدید که وقتی این معادله را به رایانه
102
00:03:51,840 –> 00:03:54,000
رایانه میدهید این ریاضی چگونه کار میکند، میتواند به شما بگوید که
103
00:03:54,000 –> 00:03:54,959
104
00:03:54,959 –> 00:03:58,840
پاسخ ملکه است و اکنون بسیار
105
00:03:58,840 –> 00:04:01,680
106
00:04:01,680 –> 00:04:04,480
قدرتمند است. نمیخواهید همه این
107
00:04:04,480 –> 00:04:06,400
ویژگیها را برای همه این کلمات
108
00:04:06,400 –> 00:04:07,840
رمزگذاری کنید، فرض کنید در حال انجام
109
00:04:07,840 –> 00:04:10,560
پردازش زبان طبیعی برای
110
00:04:10,560 –> 00:04:12,959
تمام متن در ویکیپدیا هستید،
111
00:04:12,959 –> 00:04:14,080
هزاران
112
00:04:14,080 –> 00:04:17,199
کلمه وجود دارد و برای دستیابی به این نوع
113
00:04:17,199 –> 00:04:19,120
ویژگیها برای هر یک از این کلمات،
114
00:04:19,120 –> 00:04:21,839
بسیار بسیار دشوار است،
115
00:04:21,839 –> 00:04:24,720
بنابراین نمی خواهید آن را در
116
00:04:24,720 –> 00:04:26,400
برنامه نویسی کامپیوتری به دست
117
00:04:26,400 –> 00:04:29,440
آورید، می توانید اساساً از شبکه های
118
00:04:29,440 –> 00:04:32,880
عصبی برای یادگیری این بردارهای ویژگی استفاده کنید، بنابراین
119
00:04:32,880 –> 00:04:33,440
120
00:04:33,440 –> 00:04:36,160
این اعداد را بردارهای ویژگی می نامند،
121
00:04:36,160 –> 00:04:36,800
122
00:04:36,800 –> 00:04:39,600
بنابراین رویدادهای اقتدار هنوز
123
00:04:39,600 –> 00:04:40,240
124
00:04:40,240 –> 00:04:43,280
در زبان ویژگی ها نامیده می شوند. یادگیری ماشین
125
00:04:43,280 –> 00:04:45,520
و با استفاده از شبکه های عصبی می توانید
126
00:04:45,520 –> 00:04:46,880
این بردارهای ویژگی
127
00:04:46,880 –> 00:04:48,880
را یاد بگیرید، نیازی به کدنویسی دستی ندارید، بنابراین بیایید
128
00:04:48,880 –> 00:04:51,120
ببینیم چگونه این کار انجام می شود
129
00:04:51,120 –> 00:04:52,880
و به هر حال زمانی که آنها را یاد می گیرید.
130
00:04:52,880 –> 00:04:54,400
وکتورهای ویژگی یک چیز جالبی
131
00:04:54,400 –> 00:04:56,080
که رخ خواهد داد این است که شما نمی
132
00:04:56,080 –> 00:04:58,000
دانید این بردارهای ویژگی چیست، نمی دانید که این بردار به
133
00:04:58,000 –> 00:04:59,520
معنای
134
00:04:59,520 –> 00:05:00,720
قدرت است،
135
00:05:00,720 –> 00:05:04,320
اما همه چیز به طور جادویی کار می کند،
136
00:05:04,320 –> 00:05:06,639
بنابراین کاری که می کنید این است که یک مشکل جعلی را
137
00:05:06,639 –> 00:05:07,440
138
00:05:07,440 –> 00:05:09,199
انتخاب کنید و سعی کنید آن را حل کنید. با استفاده از
139
00:05:09,199 –> 00:05:11,680
شبکه عصبی و به عنوان یک عارضه جانبی،
140
00:05:11,680 –> 00:05:14,639
شما جاسازی کلمه را دریافت می کنید، حالا این به
141
00:05:14,639 –> 00:05:16,240
چه معناست،
142
00:05:16,240 –> 00:05:18,479
بنابراین مشکل جعلی چیست، فرض کنید
143
00:05:18,479 –> 00:05:21,199
مشکل جعلی این است که می
144
00:05:21,199 –> 00:05:24,400
خواهید یک کلمه گمشده را در یک جمله پیدا کنید
145
00:05:24,400 –> 00:05:26,720
که مشکل جعلی شماست، خوب
146
00:05:26,720 –> 00:05:28,240
مشکل واقعی است اما
147
00:05:28,240 –> 00:05:31,520
ما هدف این نیست که یاد بگیریم
148
00:05:31,520 –> 00:05:33,759
کلمه غایب در یک جمله چیست هدف ما
149
00:05:33,759 –> 00:05:34,479
یادگیری
150
00:05:34,479 –> 00:05:37,680
جاسازی کلمه به عنوان یک عارضه جانبی است.
151
00:05:37,680 –> 00:05:40,320
بگویید داستانی از پادشاه بزرگ
152
00:05:40,320 –> 00:05:41,440
شوکا وجود دارد،
153
00:05:41,440 –> 00:05:44,240
می دانید که او در زمان های قدیم پادشاه هند بوده
154
00:05:44,240 –> 00:05:46,000
است
155
00:05:46,000 –> 00:05:48,560
و زمانی که در حال مطالعه هستید. این داستان می
156
00:05:48,560 –> 00:05:52,160
توانید یک مشکل ساختگی بگیرید که
157
00:05:52,160 –> 00:05:55,280
این جمله را کامل می کند، بنابراین اینجا وقتی
158
00:05:55,280 –> 00:05:57,759
می گویم به وزیرش دستور بده بر اساس
159
00:05:57,759 –> 00:05:59,919
این مالیات این دستور گرفتن من
160
00:05:59,919 –> 00:06:01,919
وزیرش امپراطور دستور وزیرش را بدهد
161
00:06:01,919 –> 00:06:02,639
می توانم بگویم
162
00:06:02,639 –> 00:06:06,560
کلمه گمشده پادشاه است یا امپراطور
163
00:06:06,560 –> 00:06:09,520
و وقتی این وظیفه پر
164
00:06:09,520 –> 00:06:10,560
کردن کلمه گمشده را
165
00:06:10,560 –> 00:06:13,680
به رایانه به عنوان یک عارضه جانبی
166
00:06:13,680 –> 00:06:16,479
167
00:06:16,479 –> 00:06:17,120
168
00:06:17,120 –> 00:06:20,639
می دهم، این یک عارضه جانبی کلیدواژه بسیار مهم است به عنوان یک عارضه جانبی، بردارهای پادشاه و امپراطور را یاد می گیرد،
169
00:06:20,639 –> 00:06:23,840
170
00:06:23,840 –> 00:06:26,400
این بردارهای ویژگی هستند و زمانی
171
00:06:26,400 –> 00:06:28,400
که شما بردارهایی که می توانید ریاضی انجام دهید
172
00:06:28,400 –> 00:06:30,880
می توانید بگویید پادشاه تقریباً برابر با
173
00:06:30,880 –> 00:06:31,600
امپراطور است
174
00:06:31,600 –> 00:06:34,479
بنابراین ببینید می توانید مترادف ها را استخراج کنید
175
00:06:34,479 –> 00:06:36,319
نام های آنتن که می توانید ریاضی انجام دهید
176
00:06:36,319 –> 00:06:38,319
مانند پادشاه منهای مرد به اضافه
177
00:06:38,319 –> 00:06:39,360
زن برابر با ملکه
178
00:06:39,360 –> 00:06:42,800
و غیره است بنابراین اکنون
179
00:06:42,800 –> 00:06:44,960
بیایید بررسی کنیم این مشکل کمی
180
00:06:44,960 –> 00:06:46,840
جلوتر به عنوان مثال شما این
181
00:06:46,840 –> 00:06:48,000
جمله را دارید
182
00:06:48,000 –> 00:06:50,479
خوردن چیزی خیلی
183
00:06:50,479 –> 00:06:51,520
سالم نیست
184
00:06:51,520 –> 00:06:53,440
و اگر از شما بخواهم کلمه غایب را
185
00:06:53,440 –> 00:06:54,639
186
00:06:54,639 –> 00:06:56,479
خوب پر کنید به احتمال زیاد آوریل و گردو خواهید گفت
187
00:06:56,479 –> 00:06:57,680
زیرا این
188
00:06:57,680 –> 00:07:00,880
غذا است و پیتزای سالم نیز
189
00:07:00,880 –> 00:07:02,400
غذا است اما سالم نیست، بنابراین شما
190
00:07:02,400 –> 00:07:03,199
آن را احساس نخواهید کرد و
191
00:07:03,199 –> 00:07:05,680
فراموش نکنید که صحبت کردن با کامیون غذا خوردن بسیار سالم است،
192
00:07:05,680 –> 00:07:07,520
آیا شما دیوانه هستید،
193
00:07:07,520 –> 00:07:09,919
به طور مشابه وقتی این جمله را دارید
194
00:07:09,919 –> 00:07:11,199
که کلمه کلیدی احتمالی
195
00:07:11,199 –> 00:07:13,840
موشک خواهد بود، قرار نیست بگویید
196
00:07:13,840 –> 00:07:15,280
پیتزای پرتاب ناسا
197
00:07:15,280 –> 00:07:19,120
در ماه گذشته، اکنون
198
00:07:19,120 –> 00:07:22,800
که در این فرآیند
199
00:07:22,800 –> 00:07:25,039
یافتن کلمه گمشده هستید، متوجه می شوید که
200
00:07:25,039 –> 00:07:27,039
یک واقعیت که معنای یک کلمه است را می
201
00:07:27,039 –> 00:07:29,599
توان با کلمات اطراف آن استنباط کرد،
202
00:07:29,599 –> 00:07:31,599
اگر کسی کلمات اطراف را به شما
203
00:07:31,599 –> 00:07:33,440
بدهد، بنابراین این کلمات اطراف را نیز
204
00:07:33,440 –> 00:07:33,919
205
00:07:33,919 –> 00:07:37,120
زمینه نامیده می شود. پس زمینه
206
00:07:37,120 –> 00:07:39,199
را میتوانید بفهمید که آن
207
00:07:39,199 –> 00:07:40,960
کلمه گمشده چیست،
208
00:07:40,960 –> 00:07:44,160
بنابراین حالا بیایید این پاراگراف را در نظر
209
00:07:44,160 –> 00:07:47,440
بگیریم و
210
00:07:47,440 –> 00:07:51,360
سعی میکنیم آن کلمات گمشده را بهطور خودکار تکمیل کنیم
211
00:07:51,360 –> 00:07:53,840
و تکمیل خودکار کلمات گمشده
212
00:07:53,840 –> 00:07:55,759
واقعاً حوزه مورد علاقه ما نیست
213
00:07:55,759 –> 00:07:57,120
، مشکل جعلی
214
00:07:57,120 –> 00:07:59,360
ما است که حوزه مورد علاقه ما است. برای یادگیری
215
00:07:59,360 –> 00:08:00,560
واژه
216
00:08:00,560 –> 00:08:02,240
جاسازی بردارهایی که می توانند آن کلمات را نشان دهند،
217
00:08:02,240 –> 00:08:04,240
218
00:08:04,240 –> 00:08:07,599
بنابراین این پاراگراف را تجزیه
219
00:08:07,599 –> 00:08:09,280
می کنم و پنجره ای از سه کلمه را می گیرم
220
00:08:09,280 –> 00:08:13,360
و در
221
00:08:13,360 –> 00:08:16,400
اینجا می گویم اگر بار کلمه
222
00:08:16,400 –> 00:08:18,800
ای داشته باشم و a می توانم پیش بینی کنم که یک کلمه در
223
00:08:18,800 –> 00:08:19,440
آنجا وجود دارد
224
00:08:19,440 –> 00:08:20,960
. من کلمه دوم و سوم را
225
00:08:20,960 –> 00:08:24,000
226
00:08:24,000 –> 00:08:25,599
می گیرم و سعی می کنم کلمه اول را پیش بینی کنم و اینها نمونه های آموزشی من هستند بنابراین
227
00:08:25,599 –> 00:08:28,800
می توانم آن پنجره سه کلمه ای را
228
00:08:28,800 –> 00:08:30,319
در سراسر پاراگراف حرکت دهم و
229
00:08:30,319 –> 00:08:33,919
همه این آموزش ها را ایجاد کنند. نمونههای g
230
00:08:33,919 –> 00:08:36,159
که میبینید، من تمام این نمونههای آموزشی را تولید کردم
231
00:08:36,159 –> 00:08:37,279
232
00:08:37,279 –> 00:08:39,519
و اکنون این یک مجموعه آموزشی برای
233
00:08:39,519 –> 00:08:40,799
شبکه عصبی میشود،
234
00:08:40,799 –> 00:08:43,279
بنابراین کلمات سمت چپ
235
00:08:43,279 –> 00:08:44,320
my x هستند
236
00:08:44,320 –> 00:08:47,839
، کلمه سمت راست، y من هستند
237
00:08:47,839 –> 00:08:50,880
و شما x را به شبکه عصبی تغذیه
238
00:08:50,880 –> 00:08:52,720
میکنید و شما اگر ویدیوی شبکه عصبی من را ندیده اید، می خواهید اکنون کلمه را در سراسر جهان پیش بینی کند،
239
00:08:52,720 –> 00:08:54,000
240
00:08:54,000 –> 00:08:56,640
241
00:08:56,640 –> 00:08:58,720
لطفاً به تماشای آن بروید،
242
00:08:58,720 –> 00:09:00,640
243
00:09:00,640 –> 00:09:02,080
244
00:09:02,080 –> 00:09:04,640
برای درک چیزهایی که
245
00:09:04,640 –> 00:09:06,080
در این ویدیو قصد توضیح
246
00:09:06,080 –> 00:09:07,279
آنها را دارم، باید کمی از شبکه عصبی در زیر بدانید. از قبل نمیدانم
247
00:09:07,279 –> 0