در این مطلب، ویدئو آموزش پایتون: آماده سازی داده ها برای تجزیه و تحلیل خوشه ای با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:03:26
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,530 –> 00:00:03,020
سلام به همه، اکنون که
2
00:00:03,020 –> 00:00:05,840
با دو تکنیک شبه خوشهبندی آشنا شدید،
3
00:00:05,840 –> 00:00:08,559
اجازه دهید یک مرحله مهم در
4
00:00:08,559 –> 00:00:10,969
پردازش دادهها را که باید
5
00:00:10,969 –> 00:00:14,329
قبل از انجام خوشهبندی اعمال کنیم، بحث کنیم.
6
00:00:14,329 –> 00:00:16,660
7
00:00:16,660 –> 00:00:19,670
8
00:00:19,670 –> 00:00:22,550
واحدهای قابل مقایسه
9
00:00:22,550 –> 00:00:25,760
مانند ابعاد یک محصول و
10
00:00:25,760 –> 00:00:28,880
قیمت آن، حتی اگر متغیرها
11
00:00:28,880 –> 00:00:31,670
واحد یکسانی داشته باشند، ممکن است از نظر مقیاس و واریانس آنها تفاوت قابل توجهی داشته باشند،
12
00:00:31,670 –> 00:00:33,589
13
00:00:33,589 –> 00:00:37,039
به عنوان مثال، مقداری
14
00:00:37,039 –> 00:00:39,710
که ممکن است برای یک کالای ارزان قیمت مانند غلات خرج شود در
15
00:00:39,710 –> 00:00:42,620
مقایسه با
16
00:00:42,620 –> 00:00:46,460
هزینههای سفر اگر از دادهها به
17
00:00:46,460 –> 00:00:49,489
این شکل خام استفاده کنیم، نتیجه خوشهبندی
18
00:00:49,489 –> 00:00:52,940
ممکن است سوگیری داشته باشد، خوشههای تشکیلشده ممکن است
19
00:00:52,940 –> 00:00:55,550
به طور قابلتوجهی به یک متغیر وابسته
20
00:00:55,550 –> 00:00:58,370
باشد تا متغیر دیگر چگونه
21
00:00:58,370 –> 00:01:02,089
این مسائل را محاسبه کنیم، سپس از فرآیندی
22
00:01:02,089 –> 00:01:05,649
به نام عادیسازی استفاده میکنیم که
23
00:01:05,649 –> 00:01:09,770
عادیسازی دادهها است. این فرآیندی است
24
00:01:09,770 –> 00:01:12,350
که به وسیله آن مقادیر یک
25
00:01:12,350 –> 00:01:14,869
متغیر را با توجه به
26
00:01:14,869 –> 00:01:17,689
انحراف معیار دادههای حاصل تغییر مقیاس میدهیم.
27
00:01:17,689 –> 00:01:20,360
انحراف استاندارد پس از عادی سازی
28
00:01:20,360 –> 00:01:24,649
1 است. فرآیند عادی سازی ساده است
29
00:01:24,649 –> 00:01:27,619
و از طریق تقسیم یک مقدار بر
30
00:01:27,619 –> 00:01:29,960
انحراف استاندارد
31
00:01:29,960 –> 00:01:32,300
آن به دست می آید.
32
00:01:32,300 –> 00:01:35,900
33
00:01:35,900 –> 00:01:39,380
34
00:01:39,380 –> 00:01:43,820
35
00:01:43,820 –> 00:01:46,340
داده ها باید در یک لیست نرمال سازی شوند
36
00:01:46,340 –> 00:01:49,250
و سپس از روش whiten برای
3