در این مطلب، ویدئو گرید در مقابل تنظیم فراپارامتر جستجوی تصادفی با استفاده از پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:07:29
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:03,830 –> 00:00:06,750
در این ویدیو سعی میکنم
2
00:00:06,750 –> 00:00:08,429
تفاوتهای بین تئوری جستجوی شبکهای
3
00:00:08,429 –> 00:00:11,099
و سیدی جستجوی تصادفی را از نظر نحوه
4
00:00:11,099 –> 00:00:13,170
اجرای آنها در زیر هود و
5
00:00:13,170 –> 00:00:15,809
همچنین اینکه چگونه CV جستجوی تصادفی
6
00:00:15,809 –> 00:00:18,000
محاسباتی بهتر از CV جستجوی شبکهای بهتر است، بیان کنم،
7
00:00:18,000 –> 00:00:20,699
بنابراین بیایید با وارد کردن موارد
8
00:00:20,699 –> 00:00:22,800
ضروری شروع کنیم. ماژولها من یک
9
00:00:22,800 –> 00:00:25,050
تابع کمکی ساده به نام زمان آن ایجاد کردهام
10
00:00:25,050 –> 00:00:26,939
که زمان بین فراخوانیهای تابع را اندازهگیری میکند و
11
00:00:26,939 –> 00:00:28,920
12
00:00:28,920 –> 00:00:30,779
بعداً برای تعیین
13
00:00:30,779 –> 00:00:32,850
تفاوت زمان صرف شده توسط CV جستجوی تصادفی
14
00:00:32,850 –> 00:00:35,460
و CV جستجوی شبکهای استفاده میشود، بنابراین اجازه دهید این
15
00:00:35,460 –> 00:00:38,460
تابع را نیز وارد کنیم. من یک فایل ساده
16
00:00:38,460 –> 00:00:40,079
به نام پایین خط پیشبینی
17
00:00:40,079 –> 00:00:43,170
نقطه CSV دارم. آن را در
18
00:00:43,170 –> 00:00:45,870
متغیر قفل زیرخط بارگذاری میکنم، آن متغیر را در
19
00:00:45,870 –> 00:00:48,270
یک قاب داده به نام DF بار میکنم، بیایید ببینیم
20
00:00:48,270 –> 00:00:50,129
قاب داده چگونه به نظر میرسد که من پنج
21
00:00:50,129 –> 00:00:52,559
ستون ویژگی و یک ستون هدف دارم.
22
00:00:52,559 –> 00:00:54,930
ستون هدف وضعیت زیرخط وام است
23
00:00:54,930 –> 00:00:57,899
که مقادیری بین 1 و 0 دارد، بنابراین این
24
00:00:57,899 –> 00:01:00,359
به وضوح یک کار طبقه بندی است که ما
25
00:01:00,359 –> 00:01:02,100
در تلاش برای حل آن هستیم، اجازه دهید به شکل نگاه کنیم.
26
00:01:02,100 –> 00:01:04,949
از چارچوب داده من 614 سطر
27
00:01:04,949 –> 00:01:08,159
و 6 ستون دارم، یک متغیر ساده CLF ایجاد می کنم
28
00:01:08,159 –> 00:01:10,890
که یک طبقه بندی درخت تصمیم را تعریف یا نمونه می کند،
29
00:01:10,890 –> 00:01:13,500
بنابراین اگر
30
00:01:13,500 –> 00:01:15,900
اکنون به CLF بروم، اینها
31
00:01:15,900 –> 00:01:17,430
پارامترهای پیش فرض طبقه بندی درخت تصمیم من هستند،
32
00:01:17,430 –> 00:01:20,280
اکنون مقادیر x و y را جدا می کنم.
33
00:01:20,280 –> 00:01:22,500
از چارچوب دادههای من، بنابراین شما با 5
34
00:01:22,500 –> 00:01:25,380
ستون در ستون X و 1 ختم میشوید و زمانی
35
00:01:25,380 –> 00:01:27,360
که این کار را انجام دادید، اکنون دادههایم را
36
00:01:27,360 –> 00:01:30,180
به آموزش تقسیم میکنم و آزمایش میکنم که در آن آموزش
37
00:01:30,180 –> 00:01:32,640
من 75 درصد از نمونهها را دریافت میکند و آزمایش
38
00:01:32,640 –> 00:01:35,640
25 درصد از نمونهها را دریافت میکند. بنابراین شکل X
39
00:01:35,640 –> 00:01:39,030
قطار من برای 60 ردیف و 5 ستون است،
40
00:01:39,030 –> 00:01:42,060
شکل خط تیره X 154 ردیف و 5
41
00:01:42,060 –> 00:01:44,369
ستون است، بیایید یک اعتبارسنجی متقاطع نظرسنجی
42
00:01:44,369 –> 00:01:47,579
با 5 چین در
43
00:01:47,579 –> 00:01:49,680
آن انجام دهیم تا بفهمیم از نظر نمره f1 چقدر خوب عمل می کند.
44
00:01:49,680 –> 00:01:53,100
می توانید ببینید که نمره f1 نزدیک به
45
00:01:53,100 –> 00:01:55,530
0.6 0 است، یعنی این بهترین
46
00:01:55,530 –> 00:01:59,210
طبقه بندی کننده ای نیست که ما می توانستیم به آن فکر کنیم
47
00:02:00,520 –> 00:02:04,210
وقتی سعی می کنم نمره f1
48
00:02:04,210 –> 00:02:06,189
آموزش و تست را پیدا کنم، متوجه شدم که
49
00:02:06,189 –> 00:02:08,380
نمره آموزش f1 برای طبقه بندی کننده واقعاً بالا است.
50
00:02:08,380 –> 00:02:10,538
نزدیک به 1 است و
51
00:02:10,538 –> 00:02:13,390
آزمایش همزمان 4 نزدیک t است o 0.75
52
00:02:13,390 –> 00:02:14,920
کاملا مشهود است که مدل من بیش از حد برازش می کند
53
00:02:14,920 –> 00:02:15,640
54
00:02:15,640 –> 00:02:17,830
من مدلی می خواهم که دقت تمرینی بالایی داشته باشد
55
00:02:17,830 –> 00:02:20,260
و همچنین دقت تست 5 را داشته باشد
56
00:02:20,260 –> 00:02:22,090
به طور کلی دقت تمرین شما
57
00:02:22,090 –> 00:02:24,190
نزدیک به 1 نشان دهنده این است که شما
58
00:02:24,190 –> 00:02:26,500
بیش از حد برازش دارید اما اگر دقت تمرینی پایین تری دارید
59
00:02:26,500 –> 00:02:28,840
اما وزن یکسانی دارید.
60
00:02:28,840 –> 00:02:31,330
دقت تست، پس این یک
61
00:02:31,330 –> 00:02:32,830
مدل تعمیمیافته خوبی است که شما به آن دست یافتهاید،
62
00:02:32,830 –> 00:02:35,049
بنابراین برای انجام این کار یا
63
00:02:35,049 –> 00:02:37,060
برای رسیدن به آن مدل تعمیمیافتهای
64
00:02:37,060 –> 00:02:39,730
که به خوبی با دادههای تست شما مطابقت دارد یا
65
00:02:39,730 –> 00:02:41,739
روی دادههای دیده نشده شما به خوبی عمل میکند،
66
00:02:41,739 –> 00:02:44,200
ما میسازیم. استفاده از جستجوی شبکه ای CV
67
00:02:44,200 –> 00:02:46,810
و Adams یا CV برای یافتن
68
00:02:46,810 –> 00:02:49,209
مترهای فراصفحه بهینه که به بهترین نحو طبقه بندی کننده من را توصیف می کند،
69
00:02:49,209 –> 00:02:51,790
بنابراین این پارامترهای فوق العاده وگاس من هستند
70
00:02:51,790 –> 00:02:53,920
که نمی توانم برای
71
00:02:53,920 –> 00:02:56,440
طبقه بندی کننده درخت تصمیم خود برنده شوم و به
72
00:02:56,440 –> 00:02:58,630
نوعی به دنبال یک امتیاز f1 بالا هستم.
73
00:02:58,630 –> 00:03:00,670
در جایی که من متغیری به نام
74
00:03:00,670 –> 00:03:03,010
اسکوتر تعریف میکنم و با استفاده از یک دکوراتور زمان خود را انتخاب
75
00:03:03,010 –> 00:03:04,720
میکنم –
76
00:03:04,720 –> 00:03:06,609
که زمان اجرای این تابع را اندازهگیری میکند،
77
00:03:06,609 –> 00:03:08,530
من تابعی به نام g ایجاد کردهام
78
00:03:08,530 –> 00:03:11,170
. enerator underscore CLF
79
00:03:11,170 –> 00:03:13,720
underscore از جستجوی زیرخط که در
80
00:03:13,720 –> 00:03:16,269
x و y من مقادیر امتیاز دهنده مقدار
81
00:03:16,269 –> 00:03:18,790
طبقه بندی کننده پارامترها را می گیرد و همچنین
82
00:03:18,790 –> 00:03:20,590
اگر CV جستجوی شبکه ای است که می خواهم
83
00:03:20,590 –> 00:03:22,750
انجام دهم یا یک CV جستجوی تصادفی و
84
00:03:22,750 –> 00:03:25,299
بهترین تخمینگر
85
00:03:25,299 –> 00:03:27,640
تولید شده توسط برازش مقادیر x و y
86
00:03:27,640 –> 00:03:30,100
روی شی جستجوی تصادفی یا شی جستجوی شبکه،
87
00:03:30,100 –> 00:03:32,319
بنابراین ارسال را اجرا می کنم و
88
00:03:32,319 –> 00:03:34,420
اکنون کاری که انجام می دهم این است که
89
00:03:34,420 –> 00:03:36,970
90
00:03:36,970 –> 00:03:40,120
پس از اجرای سلول، بهترین طبقه بندی کننده را با استفاده از CV جستجوی شبکه ای پیدا کنم.
91
00:03:40,120 –> 00:03:42,010
نسخه
92
00:03:42,010 –> 00:03:44,139
طبقهبندیکننده درخت تصمیم برای
93
00:03:44,139 –> 00:03:46,840
مجموعه دادههای دادهشده با استفاده از جستجوی شبکهای خلاصهنویسی سریع CV
94
00:03:46,840 –> 00:03:49,239
درباره نحوه عملکرد جستجوی شبکهای، جستجوی شبکهای
95
00:03:49,239 –> 00:03:51,630
هر عنصر در
96
00:03:51,630