در این مطلب، ویدئو اکسل 2010 آمار 91: رگرسیون خطی شماره 5: ضریب تعیین: خوبی برازش با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:18:03
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,060 –> 00:00:03,300
به ویدیوی شماره 91 آمار اکسل 2010 خوش آمدید
2
00:00:03,300 –> 00:00:05,759
سلام اگر می خواهید
3
00:00:05,759 –> 00:00:08,550
این workbook را برای فصل 14 دانلود کنید
4
00:00:08,550 –> 00:00:11,490
روی لینک زیر ویدیو کلیک کنید هی این
5
00:00:11,490 –> 00:00:15,269
ویدیو رگرسیون خطی ما است شماره 5 ما
6
00:00:15,269 –> 00:00:16,260
باید در مورد ضریب
7
00:00:16,260 –> 00:00:18,449
تعیین معیاری برای خوب
8
00:00:18,449 –> 00:00:22,490
بودن تناسب صحبت کنیم. از مقادیر مشاهده شده برای
9
00:00:22,490 –> 00:00:27,240
خط رگرسیون تخمینی ما گاهی اوقات
10
00:00:27,240 –> 00:00:29,550
یک تصویر هزاران کلمه را بیان می کند، حال
11
00:00:29,550 –> 00:00:32,969
در اینجا یک دسته از محاسبات وجود دارد که
12
00:00:32,969 –> 00:00:34,440
13
00:00:34,440 –> 00:00:36,480
به دلیل خطای مجموع
14
00:00:36,480 –> 00:00:38,340
مربعات ناشی از رگرسیون و مجموع
15
00:00:38,340 –> 00:00:42,059
مجموع مربعات، چیزی به نام مجموع مربعات ایجاد می کنیم. و خواهیم دید که وقتی
16
00:00:42,059 –> 00:00:45,480
مجموع مجذورهای
17
00:00:45,480 –> 00:00:49,800
رگرسیون را بر مجموع
18
00:00:49,800 –> 00:00:52,020
مجذورات کل تغییرات تقسیم می کنیم، اندازه ای
19
00:00:52,020 –> 00:00:56,010
به نام مجذور R یا ضریب
20
00:00:56,010 –> 00:00:57,980
تعیین به دست می آوریم، اکنون که
21
00:00:57,980 –> 00:01:02,190
R را مجذور محاسبه کرده ایم، دیدیم که چگونه این کار را انجام دهیم.
22
00:01:02,190 –> 00:01:04,670
در یک نمودار ما همچنین وقتی
23
00:01:04,670 –> 00:01:07,710
ضریب همبستگی را محاسبه
24
00:01:07,710 –> 00:01:09,810
کردیم وقتی این اندازه را مجذور کردیم در اینجا به دست
25
00:01:09,810 –> 00:01:11,760
آوردیم اما می خواهیم این کار را انجام دهیم تا به نوعی
26
00:01:11,760 –> 00:01:14,159
معنای آن را بفهمیم. و
27
00:01:14,159 –> 00:01:17,040
چرا اکنون منطقی است که این
28
00:01:17,040 –> 00:01:19,710
نموداری است که ما از
29
00:01:19,710 –> 00:01:22,830
طریق چند ویدیوی آخر، نقاط داده فردی خود را
30
00:01:22,830 –> 00:01:24,900
31
00:01:24,900 –> 00:01:29,729
32
00:01:29,729 –> 00:01:32,369
ترسیم کرده ایم.
33
00:01:32,369 –> 00:01:35,009
خواربارفروشی خاصی که ما
34
00:01:35,009 –> 00:01:36,630
این نمونه را گرفته ایم، نقاط داده ما هستند، بنابراین
35
00:01:36,630 –> 00:01:40,520
ما آنها را رسم کردیم، یک خط نوار X داریم یک
36
00:01:40,520 –> 00:01:44,189
خط نوار Y که به درستی ترسیم شده است که به ما کمک کرد
37
00:01:44,189 –> 00:01:48,210
تا ضریب همبستگی را بفهمیم،
38
00:01:48,210 –> 00:01:51,780
سپس با استفاده از خط روند افزودن، این خط را
39
00:01:51,780 –> 00:01:54,240
در اینجا داشتیم اگر ما سعی میکنیم
40
00:01:54,240 –> 00:01:57,119
میزان تناسب را بفهمیم که چقدر این
41
00:01:57,119 –> 00:02:01,079
خط برای تخمین
42
00:02:01,079 –> 00:02:03,689
چیزها با مقادیر واقعی مشاهده شده مطابقت دارد،
43
00:02:03,689 –> 00:02:07,170
خوب تصور کنید اگر همه این
44
00:02:07,170 –> 00:02:10,139
نشانگرها دقیقاً روی خط باشند، مدل
45
00:02:10,139 –> 00:02:11,210
46
00:02:11,210 –> 00:02:14,270
خط کاملاً با خوبی مطابقت دارد.
47
00:02:14,270 –> 00:02:17,000
تناسب در
48
00:02:17,000 –> 00:02:19,160
اندازه گیری ما عالی خواهد بود، این بدان معناست که ما یکی را دریافت می کنیم،
49
00:02:19,160 –> 00:02:22,670
اما ببینید اینجا چه اتفاقی می افتد، همه
50
00:02:22,670 –> 00:02:24,500
این نقاط دقیقاً روی خط نیستند،
51
00:02:24,500 –> 00:02:27,290
اکنون ما می خواهیم بین
52
00:02:27,290 –> 00:02:30,020
کل تنوع که از th است تمایز قائل شویم. e y-bar
53
00:02:30,020 –> 00:02:32,750
تا مقدار مشاهده شده خاص خط
54
00:02:32,750 –> 00:02:36,620
بکشید و سپس آن را به دو قسمت تقسیم کنید، این
55
00:02:36,620 –> 00:02:39,440
قسمت این نوار y و من در اینجا محاسبه کرده
56
00:02:39,440 –> 00:02:44,140
ام که میانگین میانگین مقادیر Y
57
00:02:44,140 –> 00:02:47,240
برای مقادیر X همانطور
58
00:02:47,240 –> 00:02:50,210
که در ویدیوی گذشته یاد گرفتیم پیش رفت. این شیب y
59
00:02:50,210 –> 00:02:52,550
و x از مقادیر مشاهده شده ما است
60
00:02:52,550 –> 00:02:53,690
و شیب خط
61
00:02:53,690 –> 00:02:55,250
ما وجود دارد و قطع y ما با استفاده از
62
00:02:55,250 –> 00:02:58,580
تابع وقفه درست است، اما این
63
00:02:58,580 –> 00:03:01,820
نوار Y بسیار قبل از شروع صحبت
64
00:03:01,820 –> 00:03:03,920
در مورد خطی با رگرسیون خطی ساده
65
00:03:03,920 –> 00:03:07,040
، نوار Y را به عنوان معیار داشتیم.
66
00:03:07,040 –> 00:03:09,530
این یک مقدار تخمینی است که ما
67
00:03:09,530 –> 00:03:11,270
گاهی اوقات برای پیشبینی درست از آن استفاده میکنیم،
68
00:03:11,270 –> 00:03:14,390
این یک مقدار است که برای همه
69
00:03:14,390 –> 00:03:16,580
مقادیر وجود دارد، بنابراین میتوانید از آن برای پیشبینی استفاده کنید،
70
00:03:16,580 –> 00:03:19,130
اما اکنون اجازه دهید یاد بگیرم چگونه
71
00:03:19,130 –> 00:03:20,870
این خط رگرسیون خطی ساده را انجام دهم و
72
00:03:20,870 –> 00:03:22,760
شیب را محاسبه کنم و رهگیری در حال حاضر
73
00:03:22,760 –> 00:03:25,340
ما یک مدل درست داریم و بنابراین آخرین ویدیو
74
00:03:25,340 –> 00:03:27,290
ما این مدل را ایجاد کردیم و سپس از آن
75
00:03:27,290 –> 00:03:30,050
برای پیش بینی استفاده کردیم بنابراین با توجه
76
00:03:30,050 –> 00:03:32,540
به دمای X
77
00:03:32,540 –> 00:03:35,060
توانستیم فروش سوپ مرغ را تخمین بزنیم.
78
00:03:35,060 –> 00:03:38,030
خوب این نوار Y است، بنابراین
79
00:03:38,030 –> 00:03:40,760
فاصله بین آنچه ممکن است برای پیشبینی استفاده کنیم
80
00:03:40,760 –> 00:03:43,400
و این نقطه داده،
81
00:03:43,400 –> 00:03:45,590
تغییرات کل است، اما توجه داشته باشید که
82
00:03:45,590 –> 00:03:47,870
تغییرات کل B را میتوان به دو
83
00:03:47,870 –> 00:03:51,020
بخش تقسیم کرد، بخشی که مدل توضیح میدهد، زیرا به
84
00:03:51,020 –> 00:03:53,120
یاد داشته باشید که این تغییر کل است.
85
00:03:53,120 –> 00:03:55,610
از جهاتی که این مدل توضیح میدهد
86
00:03:55,610 –> 00:03:57,860
که بسیاری از تغییرات کل اما
87
00:03:57,860 –> 00:04:00,710
این بخش کوچک اضافی در اینجا باقیمانده یا خطا نامیده میشود،
88
00:04:00,710 –> 00:04:05,360
این ایده این است که اگر
89
00:04:05,360 –> 00:04:07,400
همه آنها روی خط بودند، مدل
90
00:04:07,400 –> 00:04:08,720
عالی میشد اما اینطور نیستند.
91
00:04:08,720 –> 00:04:10,910
خطاهای کوچک اضافی،
92
00:04:10,910 –> 00:04:14,840
بنابراین از مجموع آن تنوع،
93
00:04:14,840 –> 00:04:17,600
مدل ما تا این حد توضیح میدهد،
94
00:04:17,600 –> 00:04:20,750
درست وجود دارد، این خطا وجود دارد، حالا بیایید
95
00:04:20,750 –> 00:04:22,639
به فرمولهایمان نگاهی بیندازیم.
96
00:04:22,639 –> 00:04:25,099
97
00:04:25,099 –> 00:04:27,770
98
00:04:27,770 –> 00:04:29,569
نمودار در اینجا به این صورت است که چگونه میخواهیم
99
00:04:29,569 –> 00:04:31,249
مجموع
100
00:04:31,249 –> 00:04:33,830
مربعهای ناشی از خطا را محاسبه کنیم که همه این
101
00:04:33,830 –> 00:04:35,960
بخشهای کوچک در اینجا هستند.
102
00:04:35,960 –> 00:04:39,050
103
00:04:39,050 –> 00:04:43,009
Y را پیش بینی کرد
104
00:04:43,009 –> 00:04:46,340
و نگاه کنید که
105
00:04:46,340 –> 00:04:50,090
همانجا Y مشاهده شده وجود دارد، اگر آن نقطه درست
106
00:04:50,090 –> 00:04:52,430
روی خط پیش بینی شود، وقتی
107
00:04:52,430 –> 00:04:54,139
آنها را کم کنید، آن فاصله را به دست می آورید،
108
00:04:54,139 –> 00:04:55,639
بنابراین ما همه
109
00:04:55,639 –> 00:04:57,469
مربع های هر یک از آنها را می گیریم و آدام این است.
110
00:04:57,469 –> 00:04:59,240
به عنوان
111
00:04:59,240 –> 00:05:03,259
مجموع مربع به دلیل خطا در اینجا نامیده می شود مجموع
112
00:05:03,259 –> 00:05:05,270
مربعات ناشی از رگرسیون که
113
00:05:05,270 –> 00:05:08,240
به آن قسمت کوچک نارنجی مربوط می شود، بنابراین
114
00:05:08,240 –> 00:05:09,979
در اینجا چه کنیم، مقدار پیش بینی شده را
115
00:05:09,979 –> 00:05:13,460
منهای y میله می گیریم تا اگر بتوانیم
116
00:05:13,460 –> 00:05:15,710
دقیقاً به آن اشاره کنیم مقدار پیشبینیشده روی خط
117
00:05:15,710 –> 00:05:19,819
و تفریق نوار Y که به ما
118
00:05:19,819 –> 00:05:23,870
این فاصله را میدهد در این SS
119
00:05:23,870 –> 00:05:26,629
مجموع مجذورهای
120
00:05:26,629 –> 00:05:30,080
رگرسیون ما همان قسمت
121
00:05:30,080 –> 00:05:32,509
توضیحدادهشده تغییرات کل است، زیرا مدل ما در اینجا
122
00:05:32,509 –> 00:05:34,939
این مقدار زیاد را توضیح میدهد، اما نه این مقدار کمی را توضیح میدهد.
123
00:05:34,939 –> 00:05:39,050
خطا درست SSE SS خوب هستند، همانطور
124
00:05:39,050 –> 00:05:40,580
که می توانید به صورت بصری تصور کنید وقتی
125
00:05:40,580 –> 00:05:41,930
اینها را با هم جمع کنید چه تغییراتی را به دست می آورید.
126
00:05:41,930 –> 00:05:43,550
127
00:05:43,550 –> 00:05:45,469
128
00:05:45,469 –> 00:05:50,240
129
00:05:50,240 –> 00:05:53,899
سلام مجموع مجموع مجذورها را همه
130
00:05:53,899 –> 00:05:56,839
انحرافات از میانگین را صدا کنید وقتی SSR
131
00:05:56,839 –> 00:06:00,919
و SSE را اضافه می کنیم SST را دریافت می کنیم اکنون از نظر فنی
132
00:06:00,919 –> 00:06:04,550
در اینجا نحوه محاسبه SST به صورت بصری است
133
00:06:04,550 –> 00:06:06,050
134
00:06:06,050 –> 00:06:07,819
135
00:06:07,819 –> 00:06:09,589
.
136
00:06:09,589 –> 00:06:12,289
در حالی که در اینجا بسیار بالاست خاص خود را می گیریم و
137
00:06:12,289 –> 00:06:15,949
نوار Y را کم می کنیم تا این نوار منهای y
138
00:06:15,949 –> 00:06:18,649
کل تغییر را به ما بدهد به این
139
00:06:18,649 –> 00:06:21,620
معنی که فاصله از نوار y
140
00:06:21,620 –> 00:06:24,469
تا Y خاص بسیار خوب اکنون
141
00:06:24,469 –> 00:06:26,439
آنچه در مورد این رابطه بسیار مهم است
142
00:06:26,439 –> 00:06:30,529
درست است. اینجا چیزی است که بسیار
143
00:06:30,529 –> 00:06:33,190
مهم است زیرا بیایید در مورد SSE فکر
144
00:06:33,190 –> 00:06:36,490
کنیم اگر همه این
145
00:06:36,490 –> 00:06:39,340
نشانگرها خط هستند، پس رنگ آبی چقدر
146
00:06:39,340 –> 00:06:40,780
فاصله خط آبی را
147
00:06:40,780 –> 00:06:44,530
در اینجا و اینجا و اینجا درست می کند،
148
00:06:44,530 –> 00:06:46,539
همه آنهایی که در زیر هستند یک خط دارند که همینطور بالا
149
00:06:46,539 –> 00:06:49,870
می رود. که همه صفر باشند، پس چه
150
00:06:49,870 –> 00:06:53,440
معنی می دهد که اگر این صفر بود، این
151
00:06:53,440 –> 00:06:57,099
دو چیز با هم برابر می شدند و بنابراین ما
152
00:06:57,099 –> 00:06:59,110
این یک قدم را جلوتر می گذاریم و تقسیم را انجام می دهیم
153
00:06:59,110 –> 00:07:02,470
این همه تغییرات برخی
154
00:07:02,470 –> 00:07:05,259
از مربع های کل است. انحراف
155
00:07:05,259 –> 00:07:08,470
از میانگین اگر SSR خود را بگیریم و
156
00:07:08,470 –> 00:07:12,460
آن را بر این تقسیم کنیم اگر SSE صفر باشد، این
157
00:07:12,460 –> 00:07:15,550
برابر است با پیش بینی کامل همه
158
00:07:15,550 –> 00:07:18,520
نشانگرها روی خط تخمینی ما قرار دارند،
159
00:07:18,520 –> 00:07:21,819
بنابراین اندازه ما به نام ضریب
160
00:07:21,819 –> 00:07:23,770
تعیین SSR تقسیم
161
00:07:23,770 –> 00:07:28,630
بر s st هرچه نزدیکتر است. این است که شرط بندی
162
00:07:28,630 –> 00:07:33,150
بهتر است خوب بودن تناسب درست باشد،
163
00:07:33,150 –> 00:07:36,449
همچنین قبلاً دیدیم که چگونه اگر همبستگی را در نظر بگیریم
164
00:07:36,449 –> 00:07:40,030
و آن را مربع کنیم، به چیزی به
165
00:07:40,030 –> 00:07:41,770
نام مربع R می رسیم که
166
00:07:41,770 –> 00:07:44,380
دقیقاً برابر با این است که چرا ما
167
00:07:44,380 –> 00:07:47,400
آن را در اینجا انجام می دهیم زیرا کمک می کند برای مشاهده
168
00:07:47,400 –> 00:07:51,370
بصری ایده پشت این خوب
169
00:07:51,370 –> 00:07:53,349
بودن تناسب R مربع یا ضریب
170
00:07:53,349 –> 00:07:55,509
تعیین خوب است، بیایید جلو برویم
171
00:07:55,509 –> 00:08:01,090
و محاسبات خود را به خوبی انجام دهیم، بنابراین ما
172
00:08:01,090 –> 00:08:02,680
جلو رفتیم و شیب و
173
00:08:02,680 –> 00:08:05,259
قطع را محاسبه کردیم، ابتدا باید تمام
174
00:08:05,259 –> 00:08:07,030
مقادیر پیش بینی شده خود را بدست آوریم.
175
00:08:07,030 –> 00:08:10,440
مقدار پیشبینیشده را میگیرم، من
176
00:08:10,440 –> 00:08:12,729
y-intercept را میگیرم و آن را
177
00:08:12,729 –> 00:08:18,819
با کلید f4 به اضافه شیب قفل میکنم، باید
178
00:08:18,819 –> 00:08:22,120
آن را با کلید f4 قفل کنم.
179
00:08:22,120 –> 00:08:26,380
180
00:08:26,380 –> 00:08:28,930
برای مقایسه
181
00:08:28,930 –> 00:08:32,500
Y پیشبینی شده با Y واقعی مشاهده شده، پایین آمد و
182
00:08:32,500 –> 00:08:35,078
من بلافاصله این را کپی میکنم و
183
00:08:35,078 –> 00:08:37,270
میخواهم بدون قالببندی نقطه را پر
184
00:08:37,270 –> 00:08:39,669
کنم آیا میخواهم آن قالب را حفظ
185
00:08:39,669 –> 00:08:41,409
کنم، میخواهم علامتگذاری کنم این همان
186
00:08:41,409 –> 00:08:43,049
چیزی است که
187
00:08:43,049 –> 00:08:47,130
نمودا