در این مطلب، ویدئو پاندای پایتون برای تجزیه و تحلیل داده های املاک و مستغلات | #26 (Zillow API #4) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:09
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:03,149
سلام دنیا به بیست و ششمین ویدیوی کانال من خوش آمدید که در
2
00:00:03,149 –> 00:00:05,279
آن هوش مصنوعی خود را
3
00:00:05,279 –> 00:00:07,980
به نام
4
00:00:07,980 –> 00:00:11,099
5
00:00:11,099 –> 00:00:12,570
6
00:00:12,570 –> 00:00:17,190
7
00:00:17,190 –> 00:00:21,029
Shane می سازم.
8
00:00:21,029 –> 00:00:24,660
ملک اجاره ای من بیرون است و به طور
9
00:00:24,660 –> 00:00:27,060
مستقل Zestimate و فوت مربع
10
00:00:27,060 –> 00:00:33,960
هر یک را دریافت کردم و آن را در این اکسل ذخیره کردم، بسیار خوب،
11
00:00:33,960 –> 00:00:36,180
بنابراین و فقط برای نشان دادن این
12
00:00:36,180 –> 00:00:39,059
لپ تاپ، حتی مایکروسافت روی آن نیست، بنابراین همانطور
13
00:00:39,059 –> 00:00:40,710
که می بینید اکثر ویژگی ها را بیان می کند.
14
00:00:40,710 –> 00:00:42,750
غیرفعال هستند زیرا فعال نشده است
15
00:00:42,750 –> 00:00:45,809
و بنابراین من
16
00:00:45,809 –> 00:00:48,690
از زمانی که نظامی هستم برای استفاده از مایکروسافت در خانه
17
00:00:48,690 –> 00:00:50,489
18
00:00:50,489 –> 00:00:53,309
بسیار تنبل شدهام، تخفیف میگیریم من خیلی تنبل بودم که این کار را انجام دهم، بنابراین
19
00:00:53,309 –> 00:00:56,460
توانستیم از آدرسهایی استفاده کنیم که قیمت ها
20
00:00:56,460 –> 00:00:58,940
و فوت مربع مستقیماً از Zillow،
21
00:00:58,940 –> 00:01:02,399
بنابراین در این ویدیو ما از یک
22
00:01:02,399 –> 00:01:05,400
کتابخانه قدرتمند به نام پانداها برای انجام
23
00:01:05,400 –> 00:01:08,070
تجزیه و تحلیل داده های بسیار ابتدایی در
24
00:01:08,070 –> 00:01:09,810
محله من استفاده می کنیم، جایی که املاک اجاره ای من
25
00:01:09,810 –> 00:01:12,240
با استفاده از این برگه اکسل که به سادگی
26
00:01:12,240 –> 00:01:15,540
دارای سه ستون است. قیمتها
27
00:01:15,540 –> 00:01:18,360
و فوت مربع را بررسی کنید، بسیار خوب، من
28
00:01:18,360 –> 00:01:23,520
از این موارد خارج میشوم، بنابراین دادههایی که استفاده میکنیم مربوط به
29
00:01:23,520 –> 00:01:26,280
5 اکتبر است، زیرا
30
00:01:26,280 –> 00:01:28,140
هنوز آن را بهروزرسانی نکردهام، زمانی که
31
00:01:28,140 –> 00:01:31,590
برای اولین بار آن ویدیو را انجام دادم، برخی از آدرسها را حذف کردم.
32
00:01:31,590 –> 00:01:33,540
چون برخی از خطاها وجود داشت
33
00:01:33,540 –> 00:01:36,509
و آنها دادههایی را که
34
00:01:36,509 –> 00:01:38,610
میخواهم به شما نشان دهم منحرف میکردند، بنابراین برای این ویدیو
35
00:01:38,610 –> 00:01:40,439
ما در واقع با کد شروع میکنیم بسیار
36
00:01:40,439 –> 00:01:45,329
خوب، من این تابع به نام
37
00:01:45,329 –> 00:01:48,210
تست محله پانداها را دارم و ما شروع میکنیم.
38
00:01:48,210 –> 00:01:51,990
با ایجاد یک قاب داده با
39
00:01:51,990 –> 00:01:54,180
خواندن اکسل و گفتن اینکه
40
00:01:54,180 –> 00:01:59,610
ستون اول ایندکس خواهد بود،
41
00:01:59,610 –> 00:02:01,320
بنابراین اگر پاندا نصب نکردهاید، به
42
00:02:01,320 –> 00:02:04,229
خط فرمان خود بروید و pip
43
00:02:04,229 –> 00:02:07,890
install pandas را تایپ کنید و سپس pandaها را بهعنوان
44
00:02:07,890 –> 00:02:11,819
PD وارد کنید بسیار خوب. ما اینجا این کار را انجام دادهایم،
45
00:02:11,819 –> 00:02:14,450
بنابراین میخواهیم یک چارچوب داده
46
00:02:14,450 –> 00:02:18,569
با استفاده از PD ایجاد کنیم، به طوری که نشان میدهد که پانداها هستند
47
00:02:18,569 –> 00:02:21,990
به عنوان peedee peedee خواندن اکسل،
48
00:02:21,990 –> 00:02:26,130
ما آن فهرست اکسل را که من به
49
00:02:26,130 –> 00:02:27,810
شما نشان دادم میگیریم و سپس میخواهیم بگوییم
50
00:02:27,810 –> 00:02:31,730
این که ستون شاخص صفر است، بنابراین
51
00:02:31,730 –> 00:02:36,000
پانداهایی که می رویم ایندکس خودش را ایجاد میکند
52
00:02:36,000 –> 00:02:40,980
و با نامگذاری
53
00:02:40,980 –> 00:02:42,810
ردیفهای شما برای شما شروع میکند، من نمیخواهم که
54
00:02:42,810 –> 00:02:45,239
هر آدرسی اولین ستون باشد، بنابراین
55
00:02:45,239 –> 00:02:46,890
این چیزی است که این ستون ایندکس برابر با
56
00:02:46,890 –> 00:02:51,270
صفر است، خوب است، بنابراین ابتدا ما
57
00:02:51,270 –> 00:02:54,510
میخواهیم شکل فرم داده به ما می گوید
58
00:02:54,510 –> 00:02:58,260
که چند سطر و ستون داریم، پس
59
00:02:58,260 –> 00:03:06,570
بیایید آن را بررسی کنیم و از آنجایی که من
60
00:03:06,570 –> 00:03:10,040
ضبط می کنم مدتی طول می کشد
61
00:03:14,330 –> 00:03:16,580
و این به ما می گوید چند سطر و
62
00:03:16,580 –> 00:03:19,580
ستون داریم، بنابراین ما 535 سطر و دو
63
00:03:19,580 –> 00:03:22,220
ستون داریم که اینطور نیست. دقیقاً درست است زیرا
64
00:03:22,220 –> 00:03:25,820
در برنامه نویسی اکثر
65
00:03:25,820 –> 00:03:28,850
زبان های برنامه نویسی با شروع با صفر شمارش می کنند، بنابراین
66
00:03:28,850 –> 00:03:31,780
این در واقع دارای 536 ردیف و 3 ستون است
67
00:03:31,780 –> 00:03:34,550
که می توانید از اکسل به خاطر بسپارید
68
00:03:34,550 –> 00:03:37,880
که به شما نشان داده شده است، بنابراین این اولین
69
00:03:37,880 –> 00:03:39,620
تابعی است که در اینجا داریم، بنابراین من می خواهم
70
00:03:39,620 –> 00:03:42,650
در مورد آن نظر بدهم و سپس ما از آن
71
00:03:42,650 –> 00:03:45,230
استفاده خواهیم کرد میدانید در مرحله بعد
72
00:03:45,230 –> 00:03:47,720
با استفاده از این روش توصیفشده وارد تجزیه و تحلیل دادهها میشویم
73
00:03:47,720 –> 00:03:51,590
، بنابراین بیایید در این مورد نظر
74
00:03:51,590 –> 00:04:00,830
75
00:04:00,830 –> 00:04:03,620
بدهیم و دوباره بررسی کنیم
76
00:04:03,620 –> 00:04:07,760
که چه چیزی دارد.
77
00:04:07,760 –> 00:04:10,250
ستون قیمت ها و ستون فوت مربع
78
00:04:10,250 –> 00:04:13,640
که تعداد آن 535 است که قبلاً
79
00:04:13,640 –> 00:04:16,820
به ما گفته بود، بنابراین البته در هر ستون میانگین 535 وجود دارد
80
00:04:16,820 –> 00:04:19,548
و
81
00:04:19,548 –> 00:04:24,080
بعداً در مورد انحراف استاندارد از
82
00:04:24,080 –> 00:04:27,200
میانگین به سمت راست بحث خواهیم کرد، بنابراین اگر
83
00:04:27,200 –> 00:04:28,940
به آمار عادت ندارید، ممکن است این مورد
84
00:04:28,940 –> 00:04:31,310
منطقی نیست اما اساساً به ما می گوید که
85
00:04:31,310 –> 00:04:33,830
انحراف استاندارد از هر چیزی که
86
00:04:33,830 –> 00:04:37,370
در داخل میانگین نیست 33000 دلار یا 310 فوت مربع است
87
00:04:37,370 –> 00:04:41,770
که حداقل 0 فوت مربع در
88
00:04:41,770 –> 00:04:44,000
75180 است، بنابراین این به من می گوید که من در
89
00:04:44,000 –> 00:04:45,919
جایی خطا دارم زیرا هیچ خانه ای وجود ندارد
90
00:04:45,919 –> 00:04:48,760
که 75000 ارزش داشته باشد. 0 فوت مربع
91
00:04:48,760 –> 00:04:53,810
سه آستانه 25 55 50 و 75
92
00:04:53,810 –> 00:04:56,540
درصد و سپس حداکثر، بنابراین در
93
00:04:56,540 –> 00:05:00,830
خانواده ما در 5 اکتبر، ما یک خانه
94
00:05:00,830 –> 00:05:02,540
سیصد و هشتاد و شش هزار
95
00:05:02,540 –> 00:05:05,120
دلاری داشتیم و آن سه هزار و
96
00:05:05,120 –> 00:05:08,570
یکصد و بیست فوت مربع بود، بنابراین ما می توانیم آن
97
00:05:08,570 –> 00:05:11,240
را استخراج کنیم. دادههای فردی از
98
00:05:11,240 –> 00:05:13,700
این به عنوان مثال، ما میتوانیم میانگین
99
00:05:13,700 –> 00:05:15,830
قیمتها و میانگین فوت مربع
100
00:05:15,830 –> 00:05:18,530
محلهام را به دست آوریم، سپس میتوانیم آنها را
101
00:05:18,530 –> 00:05:21,530
رشتههایی بسازیم و برخی از عبارات را به ما بدهیم، بنابراین
102
00:05:21,530 –> 00:05:22,910
بیایید بررسی کنیم که من هستم خوب است که
103
00:05:22,910 –> 00:05:25,810
این را توضیح می دهیم
104
00:05:26,479 –> 00:05:29,719
و سپس به ما می گوییم
105
00:05:29,719 –> 00:05:32,599
که میانگین قیمت و میانگین
106
00:05:32,599 –> 00:05:36,219
فوت مربع برای محله ما چقدر است،
107
00:05:44,199 –> 00:05:46,719
بنابراین میانگین قیمت برای محله من
108
00:05:46,719 –> 00:05:48,879
دویست و پنجاه و دو هزار دلار
109
00:05:48,879 –> 00:05:52,949
و 777 93 سنت است،
110
00:05:52,949 –> 00:05:56,169
خوب این داده ها بود به عنوان پنج اکتبر،
111
00:05:56,169 –> 00:05:57,460
بنابراین میانگین فوت مربع برای
112
00:05:57,460 –> 00:05:59,710
محله من دو هزار و هشت است و
113
00:05:59,710 –> 00:06:01,779
این به این دلیل است که اگر
114
00:06:01,779 –> 00:06:05,860
آنچه را که اخیراً نشان دادیم خوب به خاطر داشته باشید، آن را گرد کردم،
115
00:06:05,860 –> 00:06:07,360
بنابراین خوب است بدانید اما
116
00:06:07,360 –> 00:06:10,870
اینها فقط رشته هایی هستند که من اینجا درست کردم، بنابراین برداشتم
117
00:06:10,870 –> 00:06:13,749
میانگین قیمت از قاب داده من
118
00:06:13,749 –> 00:06:16,839
آن را دو جا گرد کردم زیرا همه چیز
119
00:06:16,839 –> 00:06:21,339
در پانداها شناور است زیرا می دانید
120
00:06:21,339 –> 00:06:22,749
بسته به کاری که انجام می دهید
121
00:06:22,749 –> 00:06:24,520
دقت فوق العاده ای می خواهید ما به آن دقت نیاز
122
00:06:24,520 –> 00:06:26,770
نداریم در اینجا ما همین کار را برای
123
00:06:26,770 –> 00:06:29,169
میانگین فوت مربع خود انجام دادیم. فوت مربع ها را استخراج
124
00:06:29,169 –> 00:06:32,770
کردیم و سپس گرد کردیم و سپس
125
00:06:32,770 –> 00:06:36,310
آنها را رشته هایی درست کردیم و باید
126
00:06:36,310 –> 00:06:38,169
آنها را رشته هایی