در این مطلب، ویدئو بررسی نرمال بودن داده ها با پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:09:49
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,140 –> 00:00:02,280
بنابراین اکنون که ما در مورد
2
00:00:02,280 –> 00:00:04,290
برخی از این آمار توصیفی صحبت کرده ایم که شما می
3
00:00:04,290 –> 00:00:06,299
دانید به غیر از پیچیدگی،
4
00:00:06,299 –> 00:00:09,660
چولگی به این معنی است که شما یکی از چیزهایی را
5
00:00:09,660 –> 00:00:11,370
می دانید که معمولاً
6
00:00:11,370 –> 00:00:13,380
هنگام سر و کار با داده ها باید با آن دست و پنجه نرم
7
00:00:13,380 –> 00:00:16,740
کنید این است که آیا یا دادههای شما
8
00:00:16,740 –> 00:00:19,680
عادی نیستند، کل رویکرد به آن این است که اگر
9
00:00:19,680 –> 00:00:21,270
ما به نوعی به این
10
00:00:21,270 –> 00:00:24,269
نمودار کوچک زیبا نگاه کنیم، میدانید که میخواهیم
11
00:00:24,269 –> 00:00:26,609
روی یک منحنی زنگ توزیع عادی بسیار ساده
12
00:00:26,609 –> 00:00:28,980
باشیم که یک
13
00:00:28,980 –> 00:00:32,369
منحنی زنگ سنتی را مدل میکند، اما اگر چیزی داشته
14
00:00:32,369 –> 00:00:35,250
باشیم. مثل یک کشیدگی زیاد یا کشیدگی خیلی
15
00:00:35,250 –> 00:00:39,090
منفی یا دوباره با چولگی پیش
16
00:00:39,090 –> 00:00:42,149
میرویم، دیگر به طور معمول
17
00:00:42,149 –> 00:00:45,500
توزیع نمیشویم و در نتیجه
18
00:00:45,500 –> 00:00:48,930
آزمایشهای آماری مختلفی باید انجام شود، بنابراین
19
00:00:48,930 –> 00:00:51,360
چگونه میتوانم این کار را انجام دهم چگونه
20
00:00:51,360 –> 00:00:53,850
نرمال بودن را به خوبی بررسی کنم. چند
21
00:00:53,850 –> 00:00:57,840
مرحله برای رسیدن به آن بسیار است، برخی از آنها می
22
00:00:57,840 –> 00:01:00,210
توانند بسیار ساده باشند، اگر به
23
00:01:00,210 –> 00:01:01,829
آن فکر کنید، بنابراین اولین مورد
24
00:01:01,829 –> 00:01:04,650
بدیهی است که فقط هیستوگرام
25
00:01:04,650 –> 00:01:08,189
داده های خود را بررسی کنید اگر وارد شدم و فقط
26
00:01:08,189 –> 00:01:12,090
یک هیستوگرام از نسل خود را ترسیم کردم.
27
00:01:12,090 –> 00:01:14,189
دادههای پاکشده میدانید خوب است، با
28
00:01:14,189 –> 00:01:16,439
این کار به نظر میرسد به طور معمول
29
00:01:16,439 –> 00:01:18,210
توزیع شده است یا تا حدودی به طور معمول
30
00:01:18,210 –> 00:01:21,330
توزیع شده است، به نظر میرسد همه
31
00:01:21,330 –> 00:01:23,060
چیز بهطرز درستی بالا و پایین میرود،
32
00:01:23,060 –> 00:01:26,130
به همین دلیل است که اگر من فقط
33
00:01:26,130 –> 00:01:28,320
این را بدون انجام آزمایش اضافی فقط کره چشم انجام دهم،
34
00:01:28,320 –> 00:01:31,650
و اگر تولید کنم دادههایی
35
00:01:31,650 –> 00:01:33,780
که هفده نقطه میانی بود،
36
00:01:33,780 –> 00:01:36,990
دوباره میدانید که اکنون به شدت به
37
00:01:36,990 –> 00:01:39,960
سمت راست آویزان است و بنابراین در نتیجه فقط به خاطر
38
00:01:39,960 –> 00:01:41,460
چشماندازی به این، نیازی به انجام
39
00:01:41,460 –> 00:01:43,259
تستهای آماری دیگری نیست، نیازی به
40
00:01:43,259 –> 00:01:46,860
انجام آنها نیست. فقط
41
00:01:46,860 –> 00:01:49,049
از آن سمت راست می توانم بروم اوه خوب
42
00:01:49,049 –> 00:01:50,939
این طبیعی نیست،
43
00:01:50,939 –> 00:01:54,030
یک اتفاق مشابه می تواند
44
00:01:54,030 –> 00:01:57,479
در سمت راست یا سمت چپ رخ دهد، جایی
45
00:01:57,479 –> 00:01:59,579
که الان در 15 است، می توانید ببینید اوه، خوب
46
00:01:59,579 –> 00:02:01,530
می دانید که همه چیز در حال معاشرت است به طور کلی
47
00:02:01,530 –> 00:02:03,780
در 5 که به طور معمول توزیع نمی شود
48
00:02:03,780 –> 00:02:07,649
در حال حرکت است، اما ممکن است شما با
49
00:02:07,649 –> 00:02:11,459
مشکلاتی مواجه شده باشید که داده ها می تواند این باشد که
50
00:02:11,459 –> 00:02:14,640
می دانید آن را می دانید اکنون من آن را در
51
00:02:14,640 –> 00:02:17,430
نقطه وسط 12 قرار
52
00:02:17,430 –> 00:02:20,370
می دهم، خوب ممکن است کمی باشد. خاموش است اما من
53
00:02:20,370 –> 00:02:22,620
نمی توانم کاملاً تشخیص دهم و اینجاست که
54
00:02:22,620 –> 00:02:25,189
شما دوباره شروع به نگاه کردن به پیچیدگی
55
00:02:25,189 –> 00:02:29,150
می کنید، بنابراین دوباره اینجاست که ما از sy PI استفاده می کنیم
56
00:02:29,150 –> 00:02:32,670
تا فقط به بررسی
57
00:02:32,670 –> 00:02:39,480
انحراف انحراف داده های من و هرچه جلوتر
58
00:02:39,480 –> 00:02:42,239
رفتن آن می پردازیم. X در حال حاضر
59
00:02:42,239 –> 00:02:44,549
ما شروع به خونریزی در قلمرو بد
60
00:02:44,549 –> 00:02:48,000
می کنیم، شما یک بار دیگر می دانید که اگر در اینجا
61
00:02:48,000 –> 00:02:54,720
ده ده بسیار نزدیک به صفر بود، حتی
62
00:02:54,720 –> 00:02:57,000
اگر کمی
63
00:02:57,000 –> 00:02:59,010
بد نیست، به ما اطمینان می دهیم که داده های کاملی دریافت نمی کنید،
64
00:02:59,010 –> 00:03:03,349
بنابراین همیشه خیلی کم
65
00:03:03,349 –> 00:03:06,569
به صفر نزدیک می شود، اما همانطور که می توانید حدس بزنید
66
00:03:06,569 –> 00:03:09,139
اگر دوباره به چیزی حدود هفده حرکت کنم،
67
00:03:09,139 –> 00:03:12,209
می بینیم که بسیار دور است، بنابراین
68
00:03:12,209 –> 00:03:14,430
همان رویکرد می تواند با دوازدهم من اتفاق بیفتد،
69
00:03:14,430 –> 00:03:18,109
حالا مهم این است که
70
00:03:18,109 –> 00:03:20,909
ما فقط در حال صحبت کردن هستیم. در مورد چولگی به راست،
71
00:03:20,909 –> 00:03:23,819
ما فقط در مورد چگونگی جریان آن
72
00:03:23,819 –> 00:03:26,819
از چپ به راست صحبت می کنیم. رویکرد بعدی این است
73
00:03:26,819 –> 00:03:28,889
که می توانید از برخی
74
00:03:28,889 –> 00:03:31,799
آزمون های آماری استفاده کنید که در آن کشش نیز وجود دارد، بنابراین
75
00:03:31,799 –> 00:03:35,010
اگر دوباره فکر می کنید این
76
00:03:35,010 –> 00:03:37,139
صفحه افقی است، صفحه عمودی داده های ما، عمودی است.
77
00:03:37,139 –> 00:03:39,870
و من می روم این
78
00:03:39,870 –> 00:03:45,540
نامها را قصاب کنید، اما
79
00:03:45,540 –> 00:03:48,299
میدانم که کلمه و آزمایشهای Shapiro Wilk،
80
00:03:48,299 –> 00:03:50,549
هر کدام از اینها به
81
00:03:50,549 –> 00:03:53,879
طور مؤثر به دادهها با
82
00:03:53,879 –> 00:03:56,759
کشش و چولگی در تدبیر نگاه
83
00:03:56,759 –> 00:03:58,979
میکنند و تعیین میکنند که آیا دادههای شما
84
00:03:58,979 –> 00:04:01,439
عادی هستند یا خیر. آیا این کار با گفتن
85
00:04:01,439 –> 00:04:04,019
خوب است که اگر آن تست مهم نیست
86
00:04:04,019 –> 00:04:07,979
، اگر مقدار p زیر یک
87
00:04:07,979 –> 00:04:10,709
آستانه باشد، مهم نیست و
88
00:04:10,709 –> 00:04:13,169
اینها بسیار ساده هستند،
89
00:04:13,169 –> 00:04:17,488
بنابراین اگر بخواهم برخی از
90
00:04:17,488 –> 00:04:18,720
آن داده ها را باز کنم، بنابراین من آن را باز می کنم. با Shapiro Wilkes شروع کنید،
91
00:04:18,720 –> 00:04:21,659
بنابراین Shapiro Wilk دارای یک مقدار
92
00:04:21,659 –> 00:04:22,950
W و P
93
00:04:22,950 –> 00:04:26,520
است که هنگام
94
00:04:26,520 –> 00:04:31,400
کار با تابع برگردانده می شود، بنابراین آمار
95
00:04:31,400 –> 00:04:40,100
Shapiro Shapiro X را نشان می دهد و ما ادامه می دهیم و
96
00:04:40,100 –> 00:04:50,460
Shapiro W خواهد بود و
97
00:04:50,460 –> 00:04:58,110
سپس مقدار p برابر است با قالببندی
98
00:04:58,110 –> 0