در این مطلب، ویدئو پایتون به عنوان ابزاری برای سیستم های سلامت الکترونیک با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:34:54
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,089 –> 00:00:03,990
به همه خوش آمد می گویم صحبت زیر
2
00:00:03,990 –> 00:00:08,010
روی صفحه نمایش پایتون به عنوان ابزاری برای
3
00:00:08,010 –> 00:00:16,800
سیستم های بهداشتی توسط دایان دنبال
4
00:00:16,800 –> 00:00:19,500
5
00:00:19,500 –> 00:00:21,420
6
00:00:21,420 –> 00:00:24,619
7
00:00:24,619 –> 00:00:27,480
می شود. از کنگو اما
8
00:00:27,480 –> 00:00:29,539
چه مدت در آفریقای جنوبی بودهاید،
9
00:00:29,539 –> 00:00:33,059
12 سال، 12 سال در آفریقای جنوبی و
10
00:00:33,059 –> 00:00:35,820
او زبان فرانسه خود را بسیار بهتر از
11
00:00:35,820 –> 00:00:42,770
من است، بنابراین من میخواهم به دایان خوش آمد بگویم، بنابراین
12
00:00:42,770 –> 00:00:46,920
بدون هیچ مقدمهای از شما بسیار سپاسگزارم
13
00:00:46,920 –> 00:00:49,959
[موسیقی]
14
00:00:50,180 –> 00:00:53,910
سلام به همه و نه، من
15
00:00:53,910 –> 00:00:55,530
درس فرانسه نمی دهم، خیلی سخت است،
16
00:00:55,530 –> 00:01:00,899
بله، امروز می خواهم در
17
00:01:00,899 –> 00:01:04,530
مورد پایتون با شما صحبت کنم، زیرا در مطالعاتم
18
00:01:04,530 –> 00:01:06,990
از آن استفاده می کنم، من از آن برای یک برنامه واقعی استفاده می کنم، بنابراین
19
00:01:06,990 –> 00:01:09,210
از پایتون به عنوان ابزاری برای سیستم های بهداشتی استفاده
20
00:01:09,210 –> 00:01:13,380
می کنم. برای شروع
21
00:01:13,380 –> 00:01:16,740
سلامتی یک حوزه چند رشته ای است که تجارت
22
00:01:16,740 –> 00:01:18,360
انفورماتیک پزشکی و سلامت عمومی را در کنار هم قرار می دهد
23
00:01:18,360 –> 00:01:21,030
و
24
00:01:21,030 –> 00:01:23,340
اساساً استفاده از اینترنت و
25
00:01:23,340 –> 00:01:26,360
فناوری های مرتبط با اینترنت برای
26
00:01:26,360 –> 00:01:31,740
اهداف پزشکی است، بنابراین برای استفاده از
27
00:01:31,740 –> 00:01:33,869
آنها باید مقداری از چه نوع
28
00:01:33,869 –> 00:01:36,329
دادههای پزشکی را دریافت میکنیم، تعدادی
29
00:01:36,329 –> 00:01:38,939
از دادههای پزشکی را دریافت میکنیم که بیمار ثبت میکند
30
00:01:38,939 –> 00:01:41,340
که یکی از منابع دادهای است که
31
00:01:41,340 –> 00:01:43,259
بیمار در این روز آمده است، بیمار دارای
32
00:01:43,259 –> 00:01:46,110
برخی اصطلاحات
33
00:01:46,110 –> 00:01:47,820
است.
34
00:01:47,820 –> 00:01:49,770
نتیجه و سپس دستگاه ما می تواند
35
00:01:49,770 –> 00:01:53,100
از آن بیاموزد و از بیمار بعدی پیش بینی کند که
36
00:01:53,100 –> 00:01:55,799
آیا این درمان
37
00:01:55,799 –> 00:01:58,200
روی این بیمار جواب می دهد یا احتمال بیشتری دارد که
38
00:01:58,200 –> 00:02:01,680
منجر به مرگ یا چیزی شود، بنابراین
39
00:02:01,680 –> 00:02:05,430
نوع دیگری از داده های ما تصاویر بسیاری از
40
00:02:05,430 –> 00:02:09,419
تصویربرداری در پزشکی است. مانند اشعه ایکس، بنابراین
41
00:02:09,419 –> 00:02:11,400
پردازش تصویر زیادی وجود دارد که
42
00:02:11,400 –> 00:02:13,170
می توان با استفاده از دستگاه انجام داد
43
00:02:13,170 –> 00:02:15,720
تا به عنوان مثال، از طریق اشعه ایکس بررسی شود که آیا
44
00:02:15,720 –> 00:02:18,209
بیمار مبتلا به سل است یا خیر، بنابراین
45
00:02:18,209 –> 00:02:20,910
می تواند از تعدادی از
46
00:02:20,910 –> 00:02:23,610
بیماران موجود که تشخیص آنها قبلاً
47
00:02:23,610 –> 00:02:25,920
شناخته شده است، یاد بگیرد و سپس میتوانیم از آن برای پیشبینی
48
00:02:25,920 –> 00:02:29,400
زمانی که بیمار جدیدی دریافت میکنیم استفاده کنیم که آیا
49
00:02:29,400 –> 00:02:32,250
سل دارد یا ندارد، و
50
00:02:32,250 –> 00:02:36,569
همچنین یادداشتهای پزشک را دریافت میکنیم که پزشک میتواند بگوید از
51
00:02:36,569 –> 00:02:39,390
چه فرآیندی برای رسیدن به تشخیص خود استفاده کرده است
52
00:02:39,390 –> 00:02:41,849
، میگویند این بیمار این بیماری را داشته است.
53
00:02:41,849 –> 00:02:43,709
علائم این علامت این علامت
54
00:02:43,709 –> 00:02:47,880
و به خاطر آنها با هم و به
55
00:02:47,880 –> 00:02:49,890
دلیل سن بیمار و به
56
00:02:49,890 –> 00:02:52,680
دلیل جنسیت بیمار می توان گفت
57
00:02:52,680 –> 00:02:55,170
که به احتمال زیاد این
58
00:02:55,170 –> 00:02:56,610
بیماری همان بیماری است که فرد در
59
00:02:56,610 –> 00:03:00,840
حال حاضر در حال انجام ماشین کاری از آن رنج می برد.
60
00:03:00,840 –> 00:03:03,269
یادگیری استفاده از تعدادی الگوریتم
61
00:03:03,269 –> 00:03:05,970
در حوزه سلامت، برخی از الگوریتمها
62
00:03:05,970 –> 00:03:08,549
بیش از سایرین مورد استفاده قرار میگیرند،
63
00:03:08,549 –> 00:03:10,890
زیرا دارای
64
00:03:10,890 –> 00:03:12,599
مزایایی هستند.
65
00:03:12,599 –> 00:03:16,530
66
00:03:16,530 –> 00:03:19,170
انجام این کار این است که
67
00:03:19,170 –> 00:03:21,000
فاصله بین
68
00:03:21,000 –> 00:03:24,450
آن نمونه جدید و تمام نمونه های موجود
69
00:03:24,450 –> 00:03:27,060
در مجموعه آموزشی خود را محاسبه کند، سپس
70
00:03:27,060 –> 00:03:30,600
محاسبه کند که کدام همسایه ها یا کدام
71
00:03:30,600 –> 00:03:33,359
نقاط در مجموعه های آموزشی
72
00:03:33,359 –> 00:03:36,239
به نمونه من نزدیکتر هستند که من دریافت کرده ام و
73
00:03:36,239 –> 00:03:38,519
ندارم. می دانم در مورد نمی دانم نزدیک است
74
00:03:38,519 –> 00:03:42,780
و بعد از اینکه دیدم اوه نزدیک ترین
75
00:03:42,780 –> 00:03:45,030
سه نفر در این مورد
76
00:03:45,030 –> 00:03:47,880
در اینجا دوست دارند فقط می خواهم ببینم کجا می توانم
77
00:03:47,880 –> 00:03:49,980
این گل را با علامت سوال طبقه بندی کنم.
78
00:03:49,980 –> 00:03:53,430
سه تا از نزدیکترین گلها اون سه گل هستن
79
00:03:53,430 –> 00:03:56,760
پس با
80
00:03:56,760 –> 00:03:59,700
اکثریت آرا میگم میگم که این
81
00:03:59,700 –> 00:04:02,519
گل قرمز هم کلاس
82
00:04:02,519 –> 00:04:04,739
روز گلهای بنفش هست پس اینطوری
83
00:04:04,739 –> 00:04:05,160
کار میکنه
84
00:04:05,160 –> 00:04:07,680
مسافت رو محاسبه میکنه
85
00:04:07,680 –> 00:04:10,530
همسایگان K همسایگان مانند
86
00:04:10,530 –> 00:04:12,810
این مورد k برابر است با سه و
87
00:04:12,810 –> 00:04:15,810
سپس اکثریت رای می دهد تا نمونه جدید را طبقه بندی کند،
88
00:04:15,810 –> 00:04:18,810
بنابراین در حال حاضر در اینجا می گویم که
89
00:04:18,810 –> 00:04:22,530
گل جدید من یک گل بنفش است
90
00:04:22,530 –> 00:04:26,070
الگوریتم دیگری درخت تصمیم است ابتدا باید بگویم
91
00:04:26,070 –> 00:04:26,760
92
00:04:26,760 –> 00:04:30,540
چرا KNN در داروی کنان در پزشکی
93
00:04:30,540 –> 00:04:33,630
خوب است زیرا می تواند وقتی
94
00:04:33,630 –> 00:04:36,180
مثال جدیدی می زنید و می گویید این چیزی است که
95
00:04:36,180 –> 00:04:39,420
قبلاً دیده ام این احتمال بیشتری دارد که
96
00:04:39,420 –> 00:04:41,790
همان چیزی باشد که قبلاً دیده ام بنابراین می توانم پس از آن
97
00:04:41,790 –> 00:04:44,490
می توانم تعیین کنم اما چون اینطور نیست
98
00:04:44,490 –> 00:04:47,040
تعمیم دهید این یک مشکل است و
99
00:04:47,040 –> 00:04:49,320
واقعاً توضیح نمی دهد شما نمی توانید فقط به بیمار خود بگویید
100
00:04:49,320 –> 00:04:53,400
من فکر می کنم شما مبتلا به سل هستید زیرا این
101
00:04:53,400 –> 00:04:55,650
مرد مبتلا به سل است و به نظر
102
00:04:55,650 –> 00:04:58,050
می رسد شما خوب است باید به من یک
103
00:04:58,050 –> 00:05:00,270
روند واقعی فکر کردن بدهید. بنابراین این یکی
104
00:05:00,270 –> 00:05:02,790
از اشکالات KNN حتی شماست اگر
105
00:05:02,790 –> 00:05:05,820
در زمینه ای مانند پزشکی عملکرد خوبی دارد،
106
00:05:05,820 –> 00:05:07,440
مشکل ساز خواهد بود،
107
00:05:07,440 –> 00:05:09,570
زیرا توضیح واضحی درباره
108
00:05:09,570 –> 00:05:13,020
نحوه
109
00:05:13,020 –> 00:05:16,440
110
00:05:16,440 –> 00:05:19,440
رسیدن به نتیجه به شما نمی
111
00:05:19,440 –> 00:05:22,050
دهد. به یک تصمیم نهایی برسید،
112
00:05:22,050 –> 00:05:25,310
مثلاً در اینجا این است که بچه های من چگونه فکر می کنند
113
00:05:25,310 –> 00:05:30,390
آیا مال من است بله خوب من نمی خواهم
114
00:05:30,390 –> 00:05:32,730
این مال من نیست بله برای من وجود دارد
115
00:05:32,730 –> 00:05:36,630
اوه در هر صورت برای من است بنابراین آنها
116
00:05:36,630 –> 00:05:39,300
به درستی فکر نمی کنند و در پزشکی به این
117
00:05:39,300 –> 00:05:41,340
صورت است که این شخص با
118
00:05:41,340 –> 00:05:43,710
سرفه آمد، فرض کنید من میخواهم بیماری سل را تشخیص دهم،
119
00:05:43,710 –> 00:05:46,920
آیا فرد سرفه میکند بله، اگر بله،
120
00:05:46,920 –> 00:05:48,720
من بررسی میکنم که متفرق کننده تب دارد،
121
00:05:48,720 –> 00:05:52,740
بله، آیا این شخص
122
00:05:52,740 –> 00:05:56,160
روی گردنش املای خود را نشان میدهد نه و سپس بر
123
00:05:56,160 –> 00:05:58,410
اساس آزمایشهای مختلفی که انجام
124
00:05:58,410 –> 00:06:01,860
125
00:06:01,860 –> 00:06:04,110
126
00:06:04,110 –> 00:06:06,180
127
00:06:06,180 –> 00:06:08,610
میدهم، پاسخ میدهم بله، بله، خیر و سپس به یک تشخیصی ختم میشوم که به احتمال زیاد یک فرد مبتلا به سل است یا برای آن شخص که سل ندارد، من از سل به عنوان مثال استفاده میکنم، زیرا
128
00:06:08,610 –> 00:06:10,260
این زمینه است. من در حال
129
00:06:10,260 –> 00:06:12,690
کار بر روی بنابراین من خیلی به آنجا می روم
130
00:06:12,690 –> 00:06:16,380
بنابراین مزیت آن این است که چون به
131
00:06:16,380 –> 00:06:19,470
این شکل نمایش داده می شود، می توانید
132
00:06:19,470 –> 00:06:21,540
به راحتی به یک دکتر توضیح دهید، زیرا
133
00:06:21,540 –> 00:06:23,160
دکتر یادگیری ماشینی را نمی داند،
134
00:06:23,160 –> 00:06:26,430
دکتر پایتون را نمی فهمد،
135
00:06:26,430 –> 00:06:29,220
وقتی آن را به این شکل قرار می دهید، دکتر می تواند
136
00:06:29,220 –> 00:06:31,680
بفهمد که چگونه سیستم شما از
137
00:06:31,680 –> 00:06:33,840
آن عبور کرده است. به همین دلیل است که
138
00:06:33,840 –> 00:06:36,210
درختان تصمیم گیری تصرف در زمینه سلامت بسیار خوب هستند
139
00:06:36,210 –> 00:06:38,760
و سپس ما بیزهای ساده لوح را
140
00:06:38,760 –> 00:06:39,710
141
00:06:39,710 –> 00:06:43,370
داریم وقتی نمونه جدیدی دریافت
142
00:06:43,370 –> 00:06:46,940
می کنند احتمال تعلق این
143
00:06:46,940 –> 00:06:49,970
نمونه به یک کلاس را محاسبه می کنند یا نه بنابراین
144
00:06:49,970 –> 00:06:53,710
من می خواهم یک عدد دریافت کنم. بیمار جدید با
145
00:06:53,710 –> 00:06:56,539
علائم یا علائمش و سپس
146
00:06:56,539 –> 00:06:58,550
بر اساس آنچه قبلا داشتم محاسبه می کنم
147
00:06:58,550 –> 00:07:01,430
که احتمال ابتلای این فرد
148
00:07:01,430 –> 00:07:05,620
به سل چقدر است یا نه حالا چرا ساده لوح است
149
00:07:05,620 –> 00:07:08,509
زیرا این فرضیه را می دهد که
150
00:07:08,509 –> 00:07:11,360
ممکن است درست باشد یا ممکن است درست نباشد. مثل
151
00:07:11,360 –> 00:07:13,130
اینجا که گفتم علم داده بیشتر
152
00:07:13,130 –> 00:07:16,220
در مورد مدلهای آموزشی است، فقط فکر
153
00:07:16,220 –> 00:07:17,810
کردم درست است، درست نیست، این چیزی است که
154
00:07:17,810 –> 00:07:18,560
من فکر
155
00:07:18,560 –> 00:07:21,259
میکردم این همان چیزی است که بیز سادهلوحانه فرض میکند
156
00:07:21,259 –> 00:07:23,990
که تمام ویژگیهای افرادی که
157
00:07:23,990 –> 00:07:26,960
در تمرین شما شرکت می کنند مستقل
158
00:07:26,960 –> 00:07:28,729
از یکدیگر هستند، بنابراین این که
159
00:07:28,729 –> 00:07:31,820
شما تب و سرفه با هم داشته باشید هیچ
160
00:07:31,820 –> 00:07:33,650
معنایی ندارد، اینکه شما
161
00:07:33,650 –> 00:07:36,740
برای مدت سه ماه تب یا یک ماه تب داشته باشید
162
00:07:36,740 –> 00:07:39,169
هیچ معنایی ندارد، بنابراین فقط
163
00:07:39,169 –> 00:07:40,910
بررسی کنید. آیا تب شما این است که
164
00:07:40,910 –> 00:07:42,919
احتمال دارد تلویزیون داشته باشید آیا سرفه کرده اید
165
00:07:42,919 –> 00:07:45,199
این احتمال شماست و سپس خواهیم
166
00:07:45,199 –> 00:07:46,909
دید که خوب با
167
00:07:46,909 –> 00:07:49,520
هم احتمال ابتلا به سل را دارید یا
168
00:07:49,520 –> 00:07:51,949
نه، به همین دلیل به آن می گویند ساده لوحانه
169
00:07:51,949 –> 00:07:54,349
، واقعا اینطور نیست واقعاً نمی داند
170
00:07:54,349 –> 00:07:58,669
چه چیزی را پیش بینی می کند و سپس ما این
171
00:07:58,669 –> 00:08:01,820
یک ماشین بردار پشتیبان را داریم این
172
00:08:01,820 –> 00:08:05,680
الگوریتم در اینجا سعی می کند
173
00:08:05,680 –> 00:08:08,780
نقطه داده مثبت مثلاً مثبت را به این
174
00:08:08,780 –> 00:08:10,970
سمت و نقاط داده منفی را که علامت می
175
00:08:10,970 –> 00:08:13,419
دهند قرار دهد بنابراین من همه افراد مبتلا به سل را قرار می دهم که تصمیم بگیرند
176
00:08:13,419 –> 00:08:16,159
همه بدون آن CB آن طرف و من
177
00:08:16,159 –> 00:08:18,460
محاسبه می کنم حداکثر فاصله
178
00:08:18,460 –> 00:08:20,990
بین دو نزدیک ترین نقطه چقدر است بله،
179
00:08:20,990 –> 00:08:23,180
بنابراین آخرین فرد مبتلا به سل در این طرف
180
00:08:23,180 –> 00:08:25,430
و آخرین فرد بدون CB در
181
00:08:25,430 –> 00:08:28,940
این طرف چقدر حاشیه بین آن دو است.
182
00:08:28,940 –> 00:08:31,310
من سعی خواهم کرد فاصله
183
00:08:31,310 –> 00:08:34,339
بین آن کلاس و آن
184
00:08:34,339 –> 00:08:36,320
روز کلاس را به حداکثر برسانم که هدف از ماشین بردار پشتیبانی است
185
00:08:36,320 –> 00:08:38,029
و این چیزی است که derp سعی
186
00:08:38,029 –> 00:08:40,578
در پیاده سازی آن دارد که می گوید
187
00:08:40,578 –> 00:08:42,529
عاقل نیست دوست دختر عصبانی است و او عمل می کند
188
00:08:42,529 –> 00:08:44,510
اما شما هرگز به هر حال آن را دریافت کنید و
189
00:08:44,510 –> 00:08:47,329
خیلی خنده دار است بنابراین او می خواهد فضایی داشته باشد که
190
00:08:47,329 –> 00:08:50,240
شما فکر می کنید پس برای اجرای آن
191
00:08:50,240 –> 00:08:52,940
پرسید آیا می توانیم روی مبل
192
00:08:52,940 –> 00:08:53,540
آنجا برویم تا
193
00:08:53,540 –> 00:08:56,089
بتوانیم حداکثر فاصله را بین
194
00:08:56,089 –> 00:08:58,790
من و شما در این اتاق داشته باشیم و نیازی به
195
00:08:58,790 –> 00:09:03,980
گفتن نیست برای خاک پایان خوبی نداشت، بنابراین اکنون
196
00:09:03,980 –> 00:09:06,740
میتوانیم ببینیم که چگونه میتوانیم
197
00:09:06,740 –> 00:09:12,589
تمام این numpy دعوت شده را پیادهسازی
198
00:09:12,589 –> 00:09:15,649
کنیم.
199
00:09:15,649 –> 00:09:20,050
200
00:09:20,050 –> 00:09:22,639
201
00:09:22,639 –> 00:09:25,370
آرایههای بسیار بیحرکت
202
00:09:25,370 –> 00:09:27,819
کمک زیادی میکنند و سپس از scikit-learn
203
00:09:27,819 –> 00:09:31,220
چه نیاز داریم، ما یک
204
00:09:31,220 –> 00:09:35,449
ماژول مجموعه داده را وارد میکنیم، ماژولهای مجموعه داده
205
00:09:35,449 –> 00:09:38,779
با سه مجموعه داده عمومی از قبل موجود
206
00:09:38,779 –> 00:09:40,069
هستند، بسیار خوب است،
207
00:09:40,069 –> 00:09:43,040
بنابراین SK Learn قبلاً تعدادی
208
00:09:43,040 –> 00:09:46,339
مجموعه داده موجود را به شما ارائه میکند. که شما می توانید سعی کنید
209
00:09:46,339 –> 00:09:48,110
زمانی که شروع به یادگیری می کنید می توانید
210
00:09:48,110 –> 00:09:51,019
خودتان را امتحان کنید و سپس ما
211
00:09:51,019 –> 00:09:53,720
وارد کردن همه الگوریتم های مختلفی
212
00:09:53,720 –> 00:09:55,220
را که در
213
00:09:55,220 –> 00:09:57,500
این مورد استفاده می کنیم
214
00:09:57,500 –> 00:10:00,290
215
00:10:00,290 –> 00:10:03,110
مختل می کنیم. ماشینها
216
00:10:03,110 –> 00:10:06,170
و سپس ما KNN را وارد میکنیم و سپس بیهای ساده را وارد میکنیم
217
00:10:06,170 –> 00:10:07,880
که کدام نوع چاقو را بر اساس
218
00:10:07,880 –> 00:10:09,529
مهم من وارد میکنم.
219
00:10:09,529 –> 00:10:12,620
220
00:10:12,620 –> 00:10:15,220
221
00:10:15,220 –> 00:10:19,579
222
00:10:19,579 –> 00:10:21,949
اگر از
223
00:10:21,949 –> 00:10:24,319
Bayes ساده لوح گاوسی استفاده میکنید و سپس من
224
00:10:24,319 –> 00:10:26,360
میخواهم تقسیمهای تست قطار و
225
00:10:26,360 –> 00:10:28,510
امتیاز متقاطع را وارد کنم، بعداً
226
00:10:28,510 –> 00:10:33,019
نحوه استفاده از آنها را به شما نشان خواهم داد، بنابراین اینجا این کتابخانه زیبا وجود دارد،
227
00:10:33,019 –> 00:10:36,199
این یک کتابخانه سلامت است که
228
00:10:36,199 –> 00:10:38,720
SK Learn همراه با آن است. به آن
229
00:10:38,720 –> 00:10:42,290
مجموعه داده سرطان پستان می گویند، بنابراین چگونه می
230
00:10:42,290 –> 00:10:44,750
توانید آن را به دست آورید، فقط مجموعه داده ها را صدا بزنید،
231
00:10:44,750 –> 00:10:47,779
سرطان پستان بارگذاری نشود و سپس آن را به
232
00:10:47,779 –> 00:10:51,529
عنوان یک آرایه داور برمی گرداند که در
233
00:10:51,529 –> 00:10:53,959
آنجا مجموعه داده نامیده می شود و سپس می توانم آن
234
00:10:53,959 –> 00:10:57,130
را به X خود تقسیم کنم. تمام ویژگیهای من و
235
00:10:57,130 –> 00:11:00,170
سپس Y من است که طبقهبندی
236
00:11:00,170 –> 00:11:03,319
این است که آیا فرد مبتلا به سرطان سینه است یا
237
00:11:03,319 –> 00:11:07,279
خیر و سپس میتوانم مجموعه دادههایم را
238
00:11:07,279 –> 00:11:10,459
به یک مجموعه آموزشی و یک مجموعه آزمایشی تقسیم کنم، زیرا
239
00:11:10,459 –> 00:11:12,829
اکثر وظایف یادگیری ماشینی به شما نیاز دارند که
240
00:11:12,829 –> 00:11:15,410
از مجموعه آموزشی خود یاد بگیرید. و
241
00:11:15,410 –> 00:11:17,660
سپس دقت مدلی را که ساخته اید آزمایش کنید،
242
00:11:17,660 –> 00:11:21,499
بنابراین SK Learn همچنین با آن
243
00:11:21,499 –> 00:11:23,420
ساخته شده همراه است، من فقط این تابع را
244
00:11:23,420 –> 00:11:26,779
می گویم تقسیم تست معاملاتی من می خواهم X
245
00:11:26,779 –> 00:11:30,079
و Y خود را تقسیم کنم و سپس آه های آزمایشی خود را ذخیره کردم.
246
00:11:30,079 –> 00:11:33,259
دارای اندازه 20
247
00:11:33,259 –> 00:11:36,829
درصد از مجموعه داده های کلی است و
248
00:11:36,829 –> 00:11:40,249
برای من یک مجموعه قطار و یک
249
00:11:40,249 –> 00:11:41,959
آزمایش درست در آنجا ایجاد می کند و اگر سعی کنید
250
00:11:41,959 –> 00:11:44,420
مجموعه داده ها را مانند من در آنجا نمایش دهید
251
00:11:44,420 –> 00:11:47,209
، تمام جزئیات مربوط به
252
00:11:47,209 –> 00:11:49,670
مجموعه داده را دریافت خواهید کرد. من استفاده می کنم شما تمام
253
00:11:49,670 –> 00:11:51,589
ویژگی هایی که من استفاده می کنم را دارید و سپس
254
00:11:51,589 –> 00:11:54,620
هر نمونه ای را که دریافت می کنم به شما نشان می دهد،
255
00:11:54,620 –> 00:11:56,870
بنابراین نمونه شماره یک دارای چه ویژگی هایی بود
256
00:11:56,870 –> 00:11:59,059
که متعلق به یک فیشر
257
00:11:59,059 –> 00:12:01,129
بود شماره دو شما باید به چه کلاسی
258
00:12:01,129 –> 00:12:04,790
تعلق دارند و به همین ترتیب مرحله بعدی پس از آن
259
00:12:04,790 –> 00:12:07,430
من مجموعه دادههایم را بارگذاری کردم و مجموعه آموزشی و آزمایشی خود را ایجاد کردم
260
00:12:07,430 –> 00:12:09,980
و برای من این است که اکنون
261
00:12:09,980 –> 00:12:13,129
مدلهایم را دوباره بسیار آسان در
262
00:12:13,129 –> 00:12:16,790
scikit-learn
263
00:12:16,790 –> 00:12:18,980
264
00:12:18,980 –> 00:12:21,620
آموزش دهم. برای ایجاد یک مدل SVM،
265
00:12:21,620 –> 00:12:25,040
بنابراین تابع SVC را فراخوانی میکنم و
266
00:12:25,040 –> 00:12:28,610
سپس این تابع را به دادههای آموزشی خود تطبیق میدهم،
267
00:12:28,610 –> 00:12:31,579
بنابراین در لحظهای که این کار را انجام میدهم، مدل
268
00:12:31,579 –> 00:12:35,839
اکنون از قطار X و باران سفید یاد میگیرد
269
00:12:35,839 –> 00:12:39,170
که قبلاً روی اسلاید قرار گرفتم و میخواهم این
270
00:12:39,170 –> 00:12:40,850
کار را انجام دهم. این برای همه الگوریتمهایی است
271
00:12:40,850 –> 00:12:44,779
که من استفاده میکنم، بنابراین برای SVM، به آنجا میروم،
272
00:12:44,779 –> 00:12:49,610
یک نمونه SVM
273
00:12:49,610 –> 00:12:51,889
ایجاد میکنم، آن را آموزش میدهم، سپس یک کلید و یک نمونه ایجاد میکنم که آن را
274
00:12:51,889 –> 00:12:54,319
با استفاده از دادههای آموزشی خود آموزش میدهم، همین کار را برای درختهای تصمیم انجام میدهم و این کار را انجام میدهم.
275
00:12:54,319 –> 00:12:56,839
همینطور برای
276
00:12:56,839 –> 00:12:59,959
Bayes ساده لوح، بنابراین من مدل های خود را دارم،
277
00:12:59,959 –> 00:13:01,910
آنها آموزش داده می شوند و مدل
278
00:13:01,910 –> 00:13:05,990
در این شی NB که من ایجاد
279
00:13:05,990 –> 00:13:09,290
کردم ذخیره می شود، سپس من می توانم از مدل خود استفاده کنم
280
00:13:09,290 –> 00:13:13,040
تا اکنون در مجموعه های آزمایشی خود پیش بینی کنم، بنابراین تنها
281
00:13:13,040 –> 00:13:16,339
کاری که انجام می دهم این است که بگویم من یک مثال زدم که من
282
00:13:16,339 –> 00:13:19,129
از الگوریتم مبتنی بر ساده لوح استفاده میکنم، بنابراین
283
00:13:19,129 –> 00:13:20,899
با پیشبینی پایه um خوب
284
00:13:20,899 –> 00:13:24,800
بر روی مجموعه تست بنابراین در اینجا
285
00:13:24,800 –> 00:13:27,410
همه چیزهایی را که
286
00:13:27,410 –> 00:13:30,769
مدل من پیشبینی کرده است به من نشان میدهد و سپس میتوانم
287
00:13:30,769 –> 00:13:35,230
ارزیابی کنم که مدل من با چه دقتی
288
00:13:35,230 –> 00:13:37,670
در مجموعه آزمایشی پیشبینی کرده
289
00:13:37,670 –> 00:13:41,749
290
00:13:41,749 –> 00:13:44,029
است.
291
00:13:44,029 –> 00:13:47,179
که من با
292
00:13:47,179 –> 00:13:50,029
مقادیر واقعی داخل تست سفید
293
00:13:50,029 –> 00:13:53,019
به اینجا رسیدم و در اینجا می بینم که دقت 0.95 را دریافت می کنم،
294
00:13:53,019 –> 00:13:57,920
بنابراین 95٪ از نمونه های مجموعه تست
295
00:13:57,920 –> 00:14:02,259
به درستی پیش بینی شده بودند
296
00:14:02,860 –> 00:14:05,300
راه دیگری که می توانم به جای
297
00:14:05,300 –> 00:14:07,670
انجام این کار انجام دهم، می توانم استفاده کنم. اعتبار سنجی متقابل
298
00:14:07,670 –> 00:14:10,339
چرا باید از اعتبارسنجی متقاطع استفاده کنم
299
00:14:10,339 –> 00:14:14,029
تا مطمئن شوم که مدل من با داده ها مطابقت ندارد
300
00:14:14,029 –> 00:14:16,550
، بنابراین می خواهم از برازش
301
00:14:16,550 –> 00:14:19,670
بیش از حد جلوگیری کنم زمانی است که
302
00:14:19,670 –> 00:14:23,839
مدل شما روی داده های آموزشی به خوبی عمل می کند و در
303
00:14:23,839 –> 00:14:26,149
لحظه ای که داده های جدیدی دریافت می کند.
304
00:14:26,149 –> 00:14:27,170
قبلاً هرگز دیده
305
00:14:27,170 –> 00:14:28,670
نشده بود، دیگر نمی داند چه کاری باید انجام دهد،
306
00:14:28,670 –> 00:14:31,329
زیرا به خوبی متناسب با
307
00:14:31,329 –> 00:14:35,179
داده های آموزشی شما طراحی شده بود، بنابراین من می
308
00:14:35,179 –> 00:14:37,610
خواهم شانس خود را برای بیش از حد مناسب شدن کاهش دهم، بنابراین چه کاری
309
00:14:37,610 –> 00:14:39,829
انجام دهم، اعتبار متقاطع انجام دهم آنچه که قرار
310
00:14:39,829 –> 00:14:41,749
است انجام شود این است که من تمامم را می گیرم
311
00:14:41,749 –> 00:14:45,350
مجموعه داده و تقسیم آن به false در
312
00:14:45,350 –> 00:14:48,110
این مورد در اینجا من یک اعتبار سنجی متقاطع پنج برابری انجام می دهم،
313
00:14:48,110 –> 00:14:50,870
بنابراین مجموعه داده خود
314
00:14:50,870 –> 00:14:54,279
را به پنج برابر تقسیم می کنم و در هر تکرار پنج تکرار
315
00:14:54,279 –> 00:14:57,649
انجام می دهم، چهار
316
00:14:57,649 –> 00:15:00,709
بار را به عنوان مجموعه آموزشی و یک برابر را به عنوان مجموعه آموزشی
317
00:15:00,709 –> 00:15:03,799
خود در نظر می گیرم. مجموعه تست بنابراین می بینید اینجا من شهریه
318
00:15:03,799 –> 00:15:06,199
شماره یک آخرین فولد مجموعه تست من است
319
00:15:06,199 –> 00:15:08,179
هر چیز دیگر مجموعه آموزشی است i
320
00:15:08,179 –> 00:15:11,779
دندانه شماره دو قسمت چهارم
321
00:15:11,779 –> 00:15:14,600
مجموعه آموزشی من است و بنابراین مجموعه تست من است
322
00:15:14,600 –> 00:15:16,249
و هر چیز دیگری مجموعه آموزشی
323
00:15:16,249 –> 00:15:19,399
و غیره است. بنابراین
324
00:15:19,399 –> 00:15:22,189
هر بار پنج بار تکرار میشود که از مجموعه آموزشی
325
00:15:22,189 –> 00:15:25,029
برای تناسب استفاده کنید و سپس از مجموعه تست برای
326
00:15:25,029 –> 00:15:28,730
پیشبینی و آزمایش استفاده کنید و چگونه میتوانم
327
00:15:28,730 –> 00:15:32,149
این را پیادهسازی کنم، من همچنین تابعی
328
00:15:32,149 –> 00:15:34,610
دارم که قبلاً
329
00:15:34,610 –> 00:15:38,089
با مقیاسکنندهای که متقاطع Vasco وارد کردم، وارد شده است.
330
00:15:38,089 –> 00:15:40,429
چه کاری قرار است انجام دهم کراس واسکو به
331
00:15:40,429 –> 00:15:42,980
آن می گویم می خواهم برای مدرسه از کدام
332
00:15:42,980 –> 00:15:44,959
مدل عبور کنم در این مورد می خواهم
333
00:15:44,959 –> 00:15:45,790
ساده لوحانه را امتحان کنم
334
00:15:45,790 –> 00:15:48,290
خوب من چه هستم در چه تاریخی کار می
335
00:15:48,290 –> 00:15:51,049
کنم وقتی با X&Y کار می کنم و چند
336
00:15:51,049 –> 00:15:51,769
فال
337
00:15:51,769 –> 00:15:54,110
می خواهم برای اعتبارسنجی من استفاده کنم
338
00:15:54,110 –> 00:15:56,600
میخواهم از پنج Falls استفاده کنم، بنابراین هر بار که
339
00:15:56,600 –> 00:15:58,970
مجموعه دادههای من را میگیرم، کل چیز
340
00:15:58,970 –> 00:16:02,600
را به پنج تکرار تقسیم میکنم،
341
00:16:02,600 –> 00:16:05,059
از یک برابر به عنوان یک مجموعه آزمایشی استفاده میکند و
342
00:16:05,059 –> 00:16:08,239
من دقت 92% و
343
00:16:08,239 –> 00:16:11,239
دفعه دوم دقت 92 را دریافت میکنم.
344
00:16:11,239 –> 00:16:16,519
96 95 سپس 96 و سپس می توانم از میانگین استفاده کنم
345
00:16:16,519 –> 00:16:19,639
تا بگویم که
346
00:16:19,639 –> 00:16:23,329
سیستم من به طور میانگین روی
347
00:16:23,329 –> 00:16:25,929
چیزی که قبلاً ندیده است پیش بینی می کند و
348
00:16:25,929 –> 00:16:29,029
با استفاده از numpy می توانم
349
00:16:29,029 –> 00:16:31,639
میانگین نتیجه را محاسبه کنم به یاد داشته باشید
350
00:16:31,639 –> 00:16:34,040
زمانی که شما در اینجا دیدم که میله متقاطع من
351
00:16:34,040 –> 00:16:36,860
یک آرایه کامل را برمی گرداند، امتیاز را برمی گرداند،
352
00:16:36,860 –> 00:16:39,439
امتیاز دقتی را که به عنوان
353
00:16:39,439 –> 00:16:43,910
هر تکرار در این اینجا کسب کردم،
354
00:16:43,910 –> 00:16:47,269
اکنون میانگین هر تکرار را می
355
00:16:47,269 –> 00:16:49,459
گیرم، بنابراین برای بیز ساده لوح من،
356
00:16:49,459 –> 00:16:56,449
دقت متوسط 94 را دریافت می کنم. درخت تصمیم
357
00:16:56,449 –> 00:16:58,309
من
358
00:16:58,309 –> 00:17:02,509
با SVM دقت 91 را به دست میآورم، دقت بسیار بدی
359
00:17:02,509 –> 00:17:07,579
63 درصد میگیرم و سپس با
360
00:17:07,579 –> 00:17:11,059
K&N من یک 93 میگیرم، چیزی که در اینجا باید به آن توجه
361
00:17:11,059 –> 00:1