در این مطلب، ویدئو تحلیل عاملی با پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:26
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,880 –> 00:00:03,040
سلام نام من دارن توماس است و
2
00:00:03,040 –> 00:00:04,799
من مدیر تکنیک های تحقیق آموزشی هستم
3
00:00:04,799 –> 00:00:06,720
در این ویدیو می
4
00:00:06,720 –> 00:00:08,960
خواهیم به نحوه انجام یا نحوه
5
00:00:08,960 –> 00:00:12,480
تجزیه و تحلیل عاملی با پایتون نگاهی بیندازیم، پس بیایید همین
6
00:00:12,480 –> 00:00:15,519
حالا که با پایتون سروکار داریم، ادامه دهیم و شروع کنیم.
7
00:00:15,519 –> 00:00:17,039
با
8
00:00:17,039 –> 00:00:18,800
تجزیه و تحلیل عاملی،
9
00:00:18,800 –> 00:00:20,480
ما قصد
10
00:00:20,480 –> 00:00:22,800
نداریم تمام آمارهای واقعی
11
00:00:22,800 –> 00:00:24,400
پشت آن را در نظر بگیریم،
12
00:00:24,400 –> 00:00:26,160
اما
13
00:00:26,160 –> 00:00:28,160
زمانی که در حال انجام یا انجام یک
14
00:00:28,160 –> 00:00:30,480
تحلیل عاملی با برخی از دادهها هستید، آن
15
00:00:30,480 –> 00:00:32,320
را تا حد امکان ساده نگه داریم. متغیرها را
16
00:00:32,320 –> 00:00:33,920
متراکم کنید و آنها را به متغیرهای کمتری فشرده کنید،
17
00:00:33,920 –> 00:00:36,000
این
18
00:00:36,000 –> 00:00:38,320
یک اصطلاح
19
00:00:38,320 –> 00:00:39,680
تکنیک کاهش ابعاد ابعادی است که شما سعی می
20
00:00:39,680 –> 00:00:41,520
کنید تعداد متغیرها
21
00:00:41,520 –> 00:00:43,440
را کاهش دهید، مشابه تقسیم بندی است که در آن
22
00:00:43,440 –> 00:00:45,680
سعی می کنید با هم جمع کنید،
23
00:00:45,680 –> 00:00:48,320
شاید افرادی را که از آنها داده ها را جمع آوری می کنید، می شناسید.
24
00:00:48,320 –> 00:00:50,800
تحلیل عاملی بیشتر برای آزمایش
25
00:00:50,800 –> 00:00:52,800
26
00:00:52,800 –> 00:00:55,280
سازههای نظری ایدهآلهای نظری در روانسنجی است، در حالی که وقتی
27
00:00:55,280 –> 00:00:57,280
با تقسیمبندی سروکار
28
00:00:57,280 –> 00:00:59,600
دارید، بر تلاش برای یافتن
29
00:00:59,600 –> 00:01:01,199
چگونگی با تجزیه و تحلیل عاملی، افراد را به
30
00:01:01,199 –> 00:01:02,960
گروههای خاصی بر اساس آنچه ممکن است از نظر من و مرکز مشترک داشته باشند، به گروههای خاصی تقسیم
31
00:01:02,960 –> 00:01:04,640
32
00:01:04,640 –> 00:01:06,960
33
00:01:06,960 –> 00:01:08,479
کنید، اگر بخواهید، اگر خیلی فنی است، بیشتر بر روی تلاش برای یافتن
34
00:01:08,479 –> 00:01:10,400
متغیرهایی متمرکز شدهاید که کوواریانس مشابهی دارند.
35
00:01:10,400 –> 00:01:12,400
برای
36
00:01:12,400 –> 00:01:13,040
37
00:01:13,040 –> 00:01:14,560
شما تقریباً به همین سادگی است که من احتمالاً می
38
00:01:14,560 –> 00:01:16,400
توانم آن را در کمتر از
39
00:01:16,400 –> 00:01:17,439
یک دقیقه
40
00:01:17,439 –> 00:01:19,280
انجام دهم، بنابراین کاری که ما در اینجا انجام می دهیم این
41
00:01:19,280 –> 00:01:20,560
است که مجموعه ای از داده ها به نام بیوشیمیست را می گیریم
42
00:01:20,560 –> 00:01:23,680
این از مجموعه داده های pi است،
43
00:01:23,680 –> 00:01:25,040
ببخشید
44
00:01:25,040 –> 00:01:27,439
بیوشیمیست درست در اینجا و ما قصد
45
00:01:27,439 –> 00:01:29,439
داریم یک مدل دو عاملی
46
00:01:29,439 –> 00:01:31,280
بسازیم، به عبارت دیگر، ما متغیرهای زیادی را
47
00:01:31,280 –> 00:01:34,240
در حدود پنج میگیریم و با استفاده از
48
00:01:34,240 –> 00:01:36,560
تجزیه و تحلیل آماری
49
00:01:36,560 –> 00:01:39,360
، آنها را به دو عامل دو عاملی ترکیب
50
00:01:39,360 –> 00:01:40,960
میکنیم به جای پنج متغیر که میخواهیم کاهش دهیم.
51
00:01:40,960 –> 00:01:42,799
کمی و دوباره این فقط
52
00:01:42,799 –> 00:01:44,720
برای اهداف نمایشی است که
53
00:01:44,720 –> 00:01:46,000
هدف ما در اینجا
54
00:01:46,000 –> 00:01:48,000
این است، بنابراین ماژول هایی که قرار است استفاده کنیم
55
00:01:48,000 –> 00:01:50,000
می توانید آنها را در اینجا ببینید،
56
00:01:50,000 –> 00:01:51,520
ما قرار است چیزهایی را از
57
00:01:51,520 –> 00:01:54,479
پانداها و مجموعه داده های pi وارد کنیم.
58
00:01:54,479 –> 00:01:56,640
تجزیه و تحلیل عاملی
59
00:01:56,640 –> 00:01:58,640
ستاره این ویدیو است و ما قصد داریم با matplotlib یک تصویرسازی انجام دهیم،
60
00:01:58,640 –> 00:02:02,079
61
00:02:02,079 –> 00:02:04,079
پس چرا جلوتر برویم و ببینیم چه چیزی
62
00:02:04,079 –> 00:02:06,479
می توانیم در اینجا بیاموزیم،
63
00:02:06,479 –> 00:02:08,080
بنابراین ابتدا باید داده های خود را آماده کنیم،
64
00:02:08,080 –> 00:02:09,119
65
00:02:09,119 –> 00:02:10,479
بنابراین اجازه دهید شما را از طریق این خطوط راهنمایی کنم
66
00:02:10,479 –> 00:02:12,480
از کد همینجا در خط شماره یک
67
00:02:12,480 –> 00:02:13,680
ما فقط با بیوشیمیست مجموعه دادههایمان تماس میگیریم
68
00:02:13,680 –> 00:02:15,360
که
69
00:02:15,360 –> 00:02:17,200
خط شماره دو منحصر به فرد برای ویدیو
70
00:02:17,200 –> 00:02:18,959
است، ممکن است کاری نباشد که شما همیشه انجام دهید،
71
00:02:18,959 –> 00:02:21,440
اما هدف نهایی من در اینجا این است که
72
00:02:21,440 –> 00:02:23,040
تصویرسازی را انجام
73
00:02:23,040 –> 00:02:24,800
دهم نه فقط
74
00:02:24,800 –> 00:02:27,040
صرفاً برای ایجاد دو عامل مختلف، این دو عامل را از هم جدا کنید یا نه،
75
00:02:27,040 –> 00:02:29,680
بنابراین برای
76
00:02:29,680 –> 00:02:31,440
اهداف تجسم نمیخواستم اندازه نمونه من
77
00:02:31,440 –> 00:02:34,480
خیلی بزرگتر از 250 باشد، زیرا پس از
78
00:02:34,480 –> 00:02:36,319
آن مرحله طرح واقعاً درهم و برهم شد
79
00:02:36,319 –> 00:02:38,480
و دیدن دوباره چیزها دشوار بود،
80
00:02:38,480 –> 00:02:40,000
احتمالاً نخواهید دید. این کار را در میدان
81
00:02:40,000 –> 00:02:41,440
واقعی در دنیای واقعی انجام دهید،
82
00:02:41,440 –> 00:02:43,360
بنابراین این همان چیزی است که در خط دو اتفاق می افتد
83
00:02:43,360 –> 00:02:44,319
84
00:02:44,319 –> 00:02:45,440
و
85
00:02:45,440 –> 00:02:48,160
بنابراین در خط سه
86
00:02:48,160 –> 00:02:49,440
، متغیرها را جدا می کنم و در واقع
87
00:02:49,440 –> 00:02:51,440
از آن برای تجزیه و تحلیل عاملی خود استفاده می کنم، شما می توانید ببینید
88
00:02:51,440 –> 00:02:53,280
که تنها چهار مورد از آنها وجود دارد. این نیست
89
00:02:53,280 –> 00:02:55,840
یک مطالعه پیچیده و سنگین، شما واقعاً
90
00:02:55,840 –> 00:02:57,280
می خواهید از تحلیل عاملی استفاده کنید، وقتی
91
00:02:57,280 –> 00:02:58,959
صدها
92
00:02:58,959 –> 00:03:00,959
متغیر یا هر چیز دیگری می دانید و می خواهید
93
00:03:00,959 –> 00:03:02,800
سعی کنید آنها را کاهش دهید، اما ما فقط
94
00:03:02,800 –> 00:03:04,159
در اینجا تمرین می کنیم، به همین دلیل است که این کار را انجام
95
00:03:04,159 –> 00:03:06,080
دادیم و البته در خط چهار
96
00:03:06,080 –> 00:03:08,239
ما میخواهیم محصول نهایی
97
00:03:08,239 –> 00:03:11,680
را خیلی خوب صدا کنیم، بنابراین این همان چیزی است که ما دریافت کردیم
98
00:03:11,680 –> 00:03:13,120
و بنابراین میتوانید در اینجا ببینید که پنج متغیر وجود دارد،
99
00:03:13,120 –> 00:03:14,480
توجه کنید که چگونه در وسط
100
00:03:14,480 –> 00:03:16,319
ما um را دریافت کردیم،
101
00:03:16,319 –> 00:03:17,680
میدانید که جنسیت
102
00:03:17,680 –> 00:03:20,000
آنها زن یا مرد و همچنین um آنها هستند.
103
00:03:20,000 –> 00:03:22,080
وضعیت تاهل مجرد یا متاهل
104
00:03:22,080 –> 00:03:24,159
اکنون تجزیه و تحلیل عاملی فقط می تواند
105
00:03:24,159 –> 00:03:26,640
متغیرهای پیوسته را مدیریت کند، به همین دلیل است که در
106
00:03:26,640 –> 00:03:28,319
خط سه مجموعه داده دیگری
107
00:03:28,319 –> 00:03:31,200
به نام x ایجاد کردم که در آن می توانید ببینید که
108
00:03:31,200 –> 00:03:33,120
وضعیت زن و تاهل
109
00:03:33,120 –> 00:03:35,599
حذف شده اند، به همین دلیل من این کار را انجام دادم و بنابراین
110
00:03:35,599 –> 00:03:37,280
اگر نگاه کنید. در x
111
00:03:37,280 –> 00:03:39,840
دقیقاً در
112
00:03:41,120 –> 00:03:42,879
اینجا می توانید ببینید که دو
113
00:03:42,879 –> 00:03:45,200
متغیر طبقه بندی اکنون از بین رفته اند و
114
00:03:45,200 –> 00:03:46,720
این چیزی است که اگر می
115
00:03:46,720 –> 00:03:48,560
خواهید جزئیات
116
00:03:48,560 –> 00:03:50,239
این متغیرهای مختلف را بدانید،
117
00:03:50,239 –> 00:03:52,000
من اطلاعاتی را که من اطلاعات دارم را در
118
00:03:52,000 –> 00:03:54,159
اینجا قرار
119
00:03:54,159 –> 00:03:55,680
می دهم.
120
00:03:55,680 –> 00:03:58,480
فقط میتوانید از یک کاما در دادههای بیوشیمیست تایپ کنید
121
00:03:58,480 –> 00:04:01,360
و سپس نشان دهید که زیرخط
122
00:04:01,360 –> 00:04:02,560
برابر است و شما میتوانید
123
00:04:02,560 –> 00:04:05,360
جزئیات پشت این
124
00:04:05,360 –> 00:04:07,040
متغیرها را یاد بگیرید.
125
00:04:07,040 –> 00:04:08,799
126
00:04:08,799 –> 00:04:10,720
127
00:04:10,720 –> 00:04:12,799
یادگیری بدون نظارت در نظر گرفته می شود، زیرا هیچ متغیر وابسته ای وجود ندارد،
128
00:04:12,799 –> 00:04:14,799
ما فقط سعی می
129
00:04:14,799 –> 00:04:16,399
کنیم تعداد
130
00:04:16,399 –> 00:04:18,160
متغیرهای شما را کاهش دهیم تا
131
00:04:18,160 –> 00:04:19,600
بتوانیم بدانیم که
132
00:04:19,600 –> 00:04:21,759
تجزیه و تحلیل بیشتری انجام دهید، بنابراین بسیاری از اوقات
133
00:04:21,759 –> 00:04:24,479
ممکن است تجزیه و تحلیل عاملی برای تأیید
134
00:04:24,479 –> 00:04:26,880
شما باشد که شما می دانید اجتماعی متفاوتی دارید. یا ببخشید
135
00:04:26,880 –> 00:04:28,800
ساختارهایی که ممکن است
136
00:04:28,800 –> 00:04:31,120
برای تجزیه و تحلیل اضافی ایجاد کنید، مانند ساختن
137
00:04:31,120 –> 00:04:33,680
مقیاسهای اوه، اگر دوباره بخواهید این
138
00:04:33,680 –> 00:04:35,759
بیشتر وارد روانسنجی میشود
139
00:04:35,759 –> 00:04:38,960
و اوم همچنین برای این کار است و با انجام این کار
140
00:04:38,960 –> 00:04:41,360
، البته میتوانید
141
00:04:41,360 –> 00:04:43,840
142
00:04:43,840 –> 00:04:46,320
تحلیل مقعدی پیشرفتهتری را ادامه دهید، بنابراین بیایید بگوییم شما حدود 200
143
00:04:46,320 –> 00:04:48,960
متغیر دارید که ممکن است
144
00:04:48,960 –> 00:04:51,040
قدرت پردازشی زیادی برای رایانه شما داشته باشند، بنابراین اگر
145
00:04:51,040 –> 00:04:53,040
بتوانید آن را به 15 کاهش دهید و در عین حال
146
00:04:53,040 –> 00:04:55,040
بسیاری از متغیرها را حفظ کنید،
147
00:04:55,040 –> 00:04:57,199
میتوانید o تجزیه و تحلیل بسیار پیچیده تر
148
00:04:57,199 –> 00:05:00,160
در حالی که بیشتر اطلاعات اصلی uh
149
00:05:00,160 –> 00:05:02,320
را در داده ها
150
00:05:02,320 –> 00:05:04,479
نگه می دارید، بنابراین اجازه دهید من ادامه دهم و این را به شما نشان دهم
151
00:05:04,479 –> 00:05:06,080
اوه این اشتباه است،
152
00:05:06,080 –> 00:05:09,199
اجازه دهید من ادامه دهم و این را به شما نشان دهم،
153
00:05:09,199 –> 00:05:10,400
بنابراین
154
00:05:10,400 –> 00:05:12,320
در این خط اول می خواهیم بگویید
155
00:05:12,320 –> 00:05:14,479
ما به پایتون می گوییم چند مؤلفه
156
00:05:14,479 –> 00:05:16,080
می خواهیم بسازیم یا اگر می خواهید چند عامل ایجاد
157
00:05:16,080 –> 00:05:18,000
کنید تا بتوانید هر تعداد که می
158
00:05:18,000 –> 00:05:21,120
خواهید بسازید و اساساً
159
00:05:21,120 –> 00:05:22,880
می دانید که تفسیر نهایی
160
00:05:22,880 –> 00:05:24,880
به شما بستگی دارد که چقدر از واریانس را می
161
00:05:24,880 –> 00:05:26,160
خواهید ایجاد کنید.
162
00:05:26,160 –> 00:05:28,000
توضیح اساساً این است که چه چیزی بر
163
00:05:28,000 –> 00:05:29,600
تعداد مؤلفههایی که قرار است استفاده کنید
164
00:05:29,600 –> 00:05:31,520
یا چند عامل را میخواهید تعیین میکند،
165
00:05:31,520 –> 00:05:33,600
بنابراین من آنقدر متغیر برای
166
00:05:33,600 –> 00:05:35,759
شروع ندارم، بنابراین من فقط دو تا را انتخاب میکنم.
167
00:05:35,759 –> 00:05:37,360
به عبارت دیگر،
168
00:05:37,360 –> 00:05:38,800
وقتی کارم تمام شد، فقط دو جزء یا
169
00:05:38,800 –> 00:05:40,639
دو عامل داشته باشم و
170
00:05:40,639 –> 00:05:42,639
دلیل دیگر اینکه من فقط دو عامل را انجام خواهم داد این
171
00:05:42,639 –> 00:05:44,800
است که میخواهم بتوانم
172
00:05:44,800 –> 00:05:48,479
این را ترسیم کنم و بنابراین،
173
00:05:48,479 –> 00:05:50,560
هر کدام از عوامل یا عوامل هر جزء از هر
174
00:05:50,560 –> 00:05:52,880
کلمه ای که دوست دارید استفاده کنید، یک
175
00:05:52,880 –> 00:05:54,720
بعد در یک g است raph بنابراین اگر از دو فراتر بروم
176
00:05:54,720 –> 00:05:56,560
نمی توانم آن را در یک
177
00:05:56,560 –> 00:05:58,880
فضای دوبعدی رسم کنم
178
00:05:58,880 –> 00:06:00,720
اکنون در خط شماره دو ما در واقع
179
00:06:00,720 –> 00:06:02,319
مدل خود را در اینجا قرار
180
00:06:02,319 –> 00:06:03,120
181
00:06:03,120 –> 00:06:05,440
می دهیم بنابراین دو فاکتور خود را اینجا می گیریم c
182
00:06:05,440 –> 00:06:06,800
guy را درست در اینجا و آن را برای
183
00:06:06,800 –> 00:06:08,319
تبدیل قرار می دهیم x
184
00:06:08,319 –> 00:06:09,600
و این همان کاری است که ما در اینجا انجام می دهیم
185
00:06:09,600 –> 00:06:11,360
به یاد داشته باشید تبدیل x همه متغیرهای ما
186
00:06:11,360 –> 00:06:13,680
است که پیوسته بودند و سپس
187
00:06:13,680 –> 00:06:15,280
در خط سه من فقط آنچه را دارم چاپ می
188
00:06:15,280 –> 00:06:17,199
کنم بنابراین این را اجرا می کنم
189
00:06:17,199 –> 00:06:19,039
و بنابراین می توانید اینجا ببینید که من
190
00:06:19,039 –> 00:06:20,400
این اعداد را اینجا دارم.
191
00:06:20,400 –> 00:06:22,560
پس از تبدیل که
192
00:06:22,560 –> 00:06:24,960
دوباره آمار به نوعی پیچیده است،
193
00:06:24,960 –> 00:06:27,120
ما این اعداد را داریم که
194
00:06:27,120 –> 00:06:29,199
اساساً چهار متغیر را در این
195
00:06:29,199 –> 00:06:30,720
دو متغیر یا اگر بخواهید این دو عامل را
196
00:06:30,720 –> 00:06:33,360
می گیرد و بنابراین هر یک از این ردیف
197
00:06:33,360 –> 00:06:35,039
های داده نشان دهنده یکی از نقاط داده
198
00:06:35,039 –> 00:06:37,520
در من است.
199
00:06:37,520 –> 00:06:40,639
مجموعه دادههای واقعی، بنابراین اگر بخواهید 250 ردیف از این ردیفها
200
00:06:40,639 –> 00:06:42,319
وجود دارد و هر کدام از این ردیفها
201
00:0