در این مطلب، ویدئو واحد بازگشتی دردار L19/7 در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:15:30
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:07,890
خوب پس این GRU معروف است
2
00:00:07,890 –> 00:00:12,150
که مطمئناً اما آزاردهنده دیگران است و خوب
3
00:00:12,150 –> 00:00:14,040
ما با انجام کاری که
4
00:00:14,040 –> 00:00:16,789
همیشه قبلاً انجام می دادیم شروع می کنیم
5
00:00:16,789 –> 00:00:24,869
و خیلی از داده ها بسیار خوب است، بنابراین
6
00:00:24,869 –> 00:00:27,900
به راحتی می توانید آن خطوط را ببینید
7
00:00:27,900 –> 00:00:30,570
خیلی از اوقات ممکن است
8
00:00:30,570 –> 00:00:32,549
نیازی به بحث در مورد آن با جزئیات زیاد نباشد
9
00:00:32,549 –> 00:00:34,649
، تنها مورد این است که تعداد واحدهای پنهان
10
00:00:34,649 –> 00:00:39,329
در اینجا ما آن را روی 256 تنظیم کردیم، کاملاً درست است.
11
00:00:39,329 –> 00:00:40,620
12
00:00:40,620 –> 00:00:48,149
مورد بعدی این
13
00:00:48,149 –> 00:00:54,390
است که ما باید روشی را پیاده سازی کنیم که چگونه
14
00:00:54,390 –> 00:00:57,360
می توان پارامترها را محاسبه کرد، بنابراین اولین
15
00:00:57,360 –> 00:01:00,090
چیزی که ما دو تابع کمکی داریم،
16
00:01:00,090 –> 00:01:01,890
بنابراین مانند قبل است با این تفاوت که
17
00:01:01,890 –> 00:01:05,099
قبلاً فقط هزار مقدار
18
00:01:05,099 –> 00:01:07,080
اولیه ماتریس سفید خود را داشتیم، اکنون ما یکی را می شناسیم.
19
00:01:07,080 –> 00:01:09,570
برای ورودیها یک برای مخفیها
20
00:01:09,570 –> 00:01:13,770
و خوب پس شما
21
00:01:13,770 –> 00:01:16,110
مقدار اولیه صفر را برای بایاس میدانید و
22
00:01:16,110 –> 00:01:18,180
ما اساساً برای سه
23
00:01:18,180 –> 00:01:22,439
نوع پارامتر مختلف به آن نیاز داریم، بنابراین
24
00:01:22,439 –> 00:01:24,650
برای بهروزرسانی و دروازه تنظیم مجدد و
25
00:01:24,650 –> 00:01:27,060
همچنین برای حالت مخفی نامزد
26
00:01:27,060 –> 00:01:30,960
به آن نیاز داریم. دقیقاً سه
27
00:01:30,960 –> 00:01:34,220
مؤلفه ای هستند که قبلاً در مورد آنها بحث کردیم
28
00:01:35,180 –> 00:01:38,900
و بنابراین کاری که من انجام می دهم این است که من و سپس خوب است،
29
00:01:38,900 –> 00:01:42,320
ما نیز خروجی را داریم و
30
00:01:42,320 –> 00:01:43,970
همچنین مقداری ماتریس وزن و پیشین ها
31
00:01:43,970 –> 00:01:47,480
خوب است، بنابراین من فقط می دانم که آنها را مقداردهی اولیه
32
00:01:47,480 –> 00:01:53,150
کنید و در اینجا بردار پارامتر من است بنابراین این
33
00:01:53,150 –> 00:01:55,100
تمام چیزی است که من برای پارامترها نیاز دارم
34
00:01:55,100 –> 00:01:57,860
و سپس کاری که انجام می دهم این است که
35
00:01:57,860 –> 00:02:00,620
تمام پارامترها را مرور می کنم و همه آنها را مجبور می کنم
36
00:02:00,620 –> 00:02:02,360
اربیل را یاد بگیرند به عبارت دیگر، من
37
00:02:02,360 –> 00:02:08,570
به همه آنها گرادیان را وصل می کنم هر سوالی که تاکنون
38
00:02:08,570 –> 00:02:10,600
39
00:02:12,850 –> 00:02:16,490
خوب بوده است، بنابراین این کاملاً
40
00:02:16,490 –> 00:02:21,830
ساده است. کمی خسته کننده
41
00:02:21,830 –> 00:02:25,780
است نکته بعدی این است که من می روم و مدل را تعریف می کنم
42
00:02:25,780 –> 00:02:28,130
خوب است بنابراین ابتدا حالت را خنثی کنید
43
00:02:28,130 –> 00:02:31,300
که همیشه چیز خوبی است
44
00:02:31,300 –> 00:02:34,190
اساساً اندازه دسته ای پنهان در
45
00:02:34,190 –> 00:02:37,190
واحدها و زمینه باقی می ماند و اکنون مورد بعدی این
46
00:02:37,190 –> 00:02:40,660
است که واقعاً باید DG را تعریف کنم آیا شما خوب هستید.
47
00:02:40,660 –> 00:02:44,750
ورودی وضعیت
48
00:02:44,750 –> 00:02:47,180
و پارامترها را وارد میکند، بنابراین دقیقاً
49
00:02:47,180 –> 00:02:51,170
مانند سلول b4 ما است،
50
00:02:51,170 –> 00:02:53,269
بنابراین به عمد امضای
51
00:02:53,269 –> 00:02:55,310
تماس یکسان است زیرا اگر یکسان باشد،
52
00:02:55,310 –> 00:02:58,250
امیدواریم بتوانیم از همان بهینهسازی استفاده کنیم.
53
00:02:58,250 –> 00:03:02,269
رمز r برای آن است بنابراین اولین کاری که انجام می دهیم این است
54
00:03:02,269 –> 00:03:05,739
که می رویم و همه پارامترها را باز می کنیم. خوب
55
00:03:05,739 –> 00:03:10,550
آسان انجام poison 5 است، سپس
56
00:03:10,550 –> 00:03:14,420
حالت پنهان را دریافت می کنیم و دلیل
57
00:03:14,420 –> 00:03:16,610
اینکه کاما H را می نویسیم این است که state
58
00:03:16,610 –> 00:03:18,890
در واقع می تواند لیستی از متغیرهای حالت باشد.
59
00:03:18,890 –> 00:03:24,350
و خیلی خوب از آنجایی که ما یک لیست را مصرف می کنیم،
60
00:03:24,350 –> 00:03:25,910
باید بتوانیم اولین
61
00:03:25,910 –> 00:03:28,280
عنصر را از لیست بیرون بیاوریم، می توانستم
62
00:03:28,280 –> 00:03:32,180
حالت صفر را نیز درست بنویسم که اگر
63
00:03:32,180 –> 00:03:37,370
به همان روشی که خروجی های ما تا
64
00:03:37,370 –> 00:03:40,100
کنون استخراج می شد، هنوز درست نمی شدیم. بنابراین ما
65
00:03:40,100 –> 00:03:42,200
آنها را به صورت خالی مقدار دهی اولیه می کنیم
66
00:03:42,200 –> 00:03:45,109
و سپس می رویم و روی ورودی ها تکرار می کنیم،
67
00:03:45,109 –> 00:03:47,340
68
00:03:47,340 –> 00:03:49,890
بنابراین این بسیار ساده است،
69
00:03:49,890 –> 00:03:56,860
یعنی در اینجا خوب تنظیم مجدد و
70
00:03:56,860 –> 00:04:00,099
به روز رسانی عالی است، بنابراین ما فقط سیگموید را
71
00:04:00,099 –> 00:04:04,390
بر روی شما محاسبه کردیم که X و H ورودی هستند و
72
00:04:04,390 –> 00:04:05,860
سپس ما بایاس ها و
73
00:04:05,860 –> 00:04:11,470
بردارهای وزن مربوطه خوب است، پس
74
00:04:11,470 –> 00:04:14,319
باید حالت مخفی کاندید خود را محاسبه کنیم
75
00:04:14,319 –> 00:04:18,668
و این فقط مماس این است
76
00:04:18,668 –> 00:04:21,940
که شما قبلاً چه چیزی داریم،
77
00:04:21,940 –> 00:04:26,290
بنابراین این اساساً چیزی است که من می
78
00:04:26,290 –> 00:04:29,500
خواستم و سپس در اینجا می دانید دوباره
79
00:04:29,500 –> 00:04:37,240
اگر حالت قبلی را وارد نمیکردید، زمانهایی را تنظیم کنید که از چاه
80
00:04:37,240 –> 00:04:39,100
به دست میآورید،
81
00:04:39,100 –> 00:04:42,550
بنابراین هشت بار بازنشانی کنید، میدانید که
82
00:04:42,550 –> 00:04:44,740
ما در اینجا با بردار بار
83
00:04:44,740 –> 00:04:48,790
ماتریس چه چیزی داریم.
84
00:04:48,790 –> 00:04:50,740
85
00:04:50,740 –> 00:04:53,530
سن
86
00:04:53,530 –> 00:04:56,620
و سپس سعی کنید باهوش باشید، اما در واقع از نظر
87
00:04:56,620 –> 00:04:59,610
محاسباتی هیچ تفاوتی ندارد،
88
00:04:59,669 –> 00:05:04,180
خوب است و سپس در پایان وقتی وضعیت پنهان خود را دریافت می کنم،
89
00:05:04,180 –> 00:05:06,520
شما می دانید
90
00:05:06,520 –> 00:05:10,110
z ضربدر h به اضافه y منهای c ضربدر h tilde
91
00:05:10,110 –> 00:05:12,310
در واقع قبل از اینکه تفاوتی ایجاد کند که
92
00:05:12,310 –> 00:05:14,530
چه چیزی آن را می کشم عذرخواهی می کند. در یا نه
93
00:05:14,530 –> 00:05:16,060
، این یک نوع متفاوت از جهان
94
00:05:16,060 –> 00:05:21,460
TM یا IDR خواهد بود، شاید بهتر کار کند، بنابراین
95
00:05:21,460 –> 00:05:24,640
من این را میگیرم و سپس فقط خروجی خود را تولید میکنم
96
00:05:24,640 –> 00:05:30,250
که آنها به آن متصل میشوند که هندی
97
00:05:30,250 –> 00:05:33,190
حالت مخفی جدید
98
00:05:33,190 –> 00:05:37,050
و خروجیها را برمیگرداند، بنابراین تقریباً این است.
99
00:05:37,050 –> 00:05:40,530
از آنچه قبلاً در ریاضی به شما نشان دادم کلمه به کلمه
100
00:05:40,530 –> 00:05:46,740
قابل خواندن است هر گونه
101
00:05:48,630 –> 00:05:55,479
سؤالی کاملاً وانیلی است خوب
102
00:05:55,479 –> 00:06:01,120
است بنابراین اکنون ما مدل را آموزش می دهیم و
103
00:06:01,120 –> 00:06:02,560
اولین کاری که باید انجام دهیم این است که باید
104
00:06:02,560 –> 00:06:04,810
چند p تنظیم کنیم. آرامترها تعداد
105
00:06:04,810 –> 00:06:08,650
دورهها 160 تعداد گامها 35
106
00:06:08,650 –> 00:06:12,190
اندازههای دستهای 32 سپس نرخ یادگیری و برش
107
00:06:12,190 –> 00:06:15,520
به ترتیب 100 و 0.01 میدانید که
108
00:06:15,520 –> 00:06:17,560
نرخ یادگیری بالا صرفاً به این دلیل که ما
109
00:06:17,560 –> 00:06:22,500
با پیوندهای دنبالهای بسیار زیاد هستیم و سپس
110
00:06:22,500 –> 00:06:27,900
ما اساساً آن مدل را پیشبینی میکنیم.
111
00:06:27,900 –> 00:06:30,880
این کار این است که من فوراً به شما نشان خواهم داد
112
00:06:30,880 –> 00:06:33,669
که اگر آن را اجرا کنید چه اتفاقی میافتد
113
00:06:33,669 –> 00:06:36,849
، مدتی طول میکشد که شما میدانید 3/4
114
00:06:36,849 –> 00:06:40,620
ثانیه برای یک فورک، بنابراین میدانید که
115
00:06:40,620 –> 00:06:44,950
شاید چند دقیقه طول بکشد تا تمام شود،
116
00:06:44,950 –> 00:06:47,440
اساساً تماس بگیرید. دقیقاً همان
117
00:06:47,440 –> 00:06:49,750
تابع پیشبینی آموزشی که در روز سهشنبه تعریف کردیم،
118
00:06:49,750 –> 00:06:54,400
بنابراین این اساساً مانند
119
00:06:54,400 –> 00:06:57,970
تابع fit در کاریس است فقط برای
120
00:06:57,970 –> 00:06:59,430
مدلهای دنبالهای به کمی پارامترسازی بیشتر نیاز دارد
121
00:06:59,430 –> 00:07:03,520
و بنابراین میتوانید ببینید که
122
00:07:03,520 –> 00:07:06,310
گیجی در حال کاهش است و
123
00:07:06,310 –> 00:07:07,870
با تولید زباله شروع میشود و سپس
124
00:07:07,870 –> 00:07:09,669
تولید میکند. چیزی کمی کمتر
125
00:07:09,669 –> 00:07:11,890
زباله است و هرچه ادامه میدهد
126
00:07:11,890 –> 00:07:17,680
بهتر میشود، بنابراین در تکالیف خود این
127
00:07:17,680 –> 00:07:20,940
کار را با شکسپیر انجام میدهید،
128
00:07:22,370 –> 00:07:26,210
خب، من میتوانستم
129
00:07:26,210 –> 00:07:28,760
کد منبع لینوکس را هم همینجا انتخاب کنم. یک
130
00:07:28,760 –> 00:07:31,280
پست وبلاگ بسیار زیبا توسط آندره کارپاتی در مورد انجام
131
00:07:31,280 –> 00:07:34,100
این کار و سپس نگاه کردن به نورون های مختلف او
132
00:07:34,100 –> 00:07:37,280
است و این یک
133
00:07:37,280 –> 00:07:40,639
تجسم فوق العاده است که این مرد واقعاً به طرز شگفت انگیزی
134
00:07:40,639 –> 00:07:42,699
خوب است که می دانید این مطالب را آموزش می دهید
135
00:07:42,699 –> 00:07:47,110
بله اگر وقت دارید پست وبلاگ او را بخوانید
136
00:07:47,110 –> 00:07:51,139
خوب است و این اساساً درست