در این مطلب، ویدئو پلات توزیع دریابورن | آموزش تجسم داده Python Seaborn برای مبتدیان با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:16:07
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:02,159
سلام به ویدیوی بعدی خوش آمدید
2
00:00:02,159 –> 00:00:04,830
و در این ویدیو به شما نشان خواهم داد
3
00:00:04,830 –> 00:00:08,099
که چگونه می توانید
4
00:00:08,099 –> 00:00:11,910
نمودارهای توزیع را با استفاده از کتابخانه Seabourn تولید کنید
5
00:00:11,910 –> 00:00:14,929
تا به برخی از عملکردهای توزیع نگاه کنید
6
00:00:14,929 –> 00:00:19,460
و در نهایت چگونه می توانیم
7
00:00:19,460 –> 00:00:22,289
احتمال برخی از آنها را مطابقت دهیم.
8
00:00:22,289 –> 00:00:24,330
توزیعهای احتمال مانند گاما
9
00:00:24,330 –> 00:00:27,830
در بتا که بیشتر به سمت
10
00:00:27,830 –> 00:00:31,050
ترسیم توزیعهای احتمالی است
11
00:00:31,050 –> 00:00:34,320
که خواهیم دید، پس بیایید
12
00:00:34,320 –> 00:00:36,750
ببینیم چگونه میتوانیم به آن دست پیدا کنیم، بنابراین اول از
13
00:00:36,750 –> 00:00:39,360
همه، ما این
14
00:00:39,360 –> 00:00:42,350
سه کتابخانه Seabourn را به عنوان SN وارد خواهیم کرد.
15
00:00:42,350 –> 00:00:47,670
pandavas pd & numpy به عنوان NP و قبل از
16
00:00:47,670 –> 00:00:49,940
اینکه جلوتر بروم، شاید کاری که می توانم انجام دهم این است
17
00:00:49,940 –> 00:00:55,530
که فونت را با ctrl افزایش دهم + اینها
18
00:00:55,530 –> 00:00:58,379
موارد قبلی هستند که
19
00:00:58,379 –> 00:01:01,379
قبلاً به شما نشان داده بودند بسیار خوب، فکر می کنم این باید به
20
00:01:01,379 –> 00:01:04,709
اندازه کافی خوب باشد پس بیایید این را اجرا کنیم
21
00:01:04,709 –> 00:01:08,189
تا نقطه فروش V فروش نقطهای برابر با PD
22
00:01:08,189 –> 00:01:11,130
نقطه خواندن زیرخط محوری است، اگر میخواهید قبل از من ندیدهاید، اکنون
23
00:01:11,130 –> 00:01:14,970
اولین برگه را با فایل XLS تور فروش وارد میکنیم.
24
00:01:14,970 –> 00:01:18,750
25
00:01:18,750 –> 00:01:21,900
26
00:01:21,900 –> 00:01:25,979
ویدیوهای ous سپس sales not head آنچه
27
00:01:25,979 –> 00:01:30,000
نشان می دهد اساساً بسیار نزدیک به
28
00:01:30,000 –> 00:01:33,150
مجموعه داده های واقعی است که دارای
29
00:01:33,150 –> 00:01:35,340
ستون های زیادی است مانند شناسه
30
00:01:35,340 –> 00:01:38,280
سفارش تاریخ سفارش اولویت تخفیف فروش
31
00:01:38,280 –> 00:01:41,189
نام مشتری و غیره
32
00:01:41,189 –> 00:01:44,310
تا ما بتوانیم تجزیه و تحلیل خوبی
33
00:01:44,310 –> 00:01:47,880
روی این مجموعه داده انجام دهید و می توانید
34
00:01:47,880 –> 00:01:50,030
پیوند مجموعه داده ها را در توضیحات پیدا کنید،
35
00:01:50,030 –> 00:01:54,720
بنابراین وقتی این کار را انجام دادیم، کاری که می توانیم
36
00:01:54,720 –> 00:01:57,930
انجام دهیم این است که یک نمودار توزیع بر روی
37
00:01:57,930 –> 00:02:01,680
ستون های عددی تولید کنیم که مانند میزان فروش یا
38
00:02:01,680 –> 00:02:05,520
مقدار سفارش است. یا سود و
39
00:02:05,520 –> 00:02:09,479
به ما نشان می دهد که
40
00:02:09,479 –> 00:02:12,209
بیشتر مقادیر در کجا قرار دارند یا
41
00:02:12,209 –> 00:02:13,849
توزیع داده ها چگونه است،
42
00:02:13,849 –> 00:02:16,579
بنابراین بیایید آن را در عمل ببینیم و سپس
43
00:02:16,579 –> 00:02:17,959
می توانیم الگوی خود را درک کنیم،
44
00:02:17,959 –> 00:02:19,969
بنابراین اولین نموداری که به
45
00:02:19,969 –> 00:02:22,790
نمایش خواهیم گذاشت این است که بگوییم در مقادیر فروش،
46
00:02:22,790 –> 00:02:25,549
بنابراین من فقط به اینجا
47
00:02:25,549 –> 00:02:32,719
میآیم و طرح آزمایشی شروع SNL است و ما به سادگی
48
00:02:32,719 –> 00:02:35,030
یک پارامتر را مینویسیم که sales است که
49
00:02:35,030 –> 00:02:37,549
شی مجموعه داده T است و نام متغیر
50
00:02:37,549 –> 00:02:40,219
sales بسیار خوب است اگر این را اجرا کنید
51
00:02:40,219 –> 00:02:42,260
، ما رفتن به تولید نموداری
52
00:02:42,260 –> 00:02:45,169
مانند این که در آن می بینید که بیشتر
53
00:02:45,169 –> 00:02:49,810
مقادیر متمرکز شده اند که نزدیک به
54
00:02:49,810 –> 00:02:52,909
صفر است نه دقیقاً صفر بلکه نزدیک به
55
00:02:52,909 –> 00:02:54,829
صفر و سپس این مقدار خاص است، اما
56
00:02:54,829 –> 00:02:57,680
از آنجایی که اندازه سطل اندازه بن بسیار است
57
00:02:57,680 –> 00:03:00,109
که نشان می دهد فروش در برخی موارد است.
58
00:03:00,109 –> 00:03:03,439
تا 80000 بالا می رود و این نشان
59
00:03:03,439 –> 00:03:06,549
می دهد که یک توزیع اریب
60
00:03:06,549 –> 00:03:10,099
درست است به طور مشابه اگر می خواهید
61
00:03:10,099 –> 00:03:13,639
مانند هر متغیر دیگری رسم کنید، به سادگی
62
00:03:13,639 –> 00:03:17,090
این نمودار را به عنوان اکنون شروع کنید و بگویید یک
63
00:03:17,090 –> 00:03:20,509
سود رد فروش را نشان می دهد و این نشان می دهد
64
00:03:20,509 –> 00:03:26,689
سرمایه قبل از حدس می زنم. شروع فروش
65
00:03:26,689 –> 00:03:29,079
66
00:03:29,590 –> 00:03:35,299
درست چای خوب است، بنابراین اگر می بینید
67
00:03:35,299 –> 00:03:37,069
این توزیع نسبتاً متفاوتی
68
00:03:37,069 –> 00:03:40,489
نسبت به این یکی است، بنابراین در این مورد
69
00:03:40,489 –> 00:03:43,220
فروش وجود دارد که از صفر شروع می
70
00:03:43,220 –> 00:03:45,409
شود هیچ چیز زیر صفر به صفر نمی رسد،
71
00:03:45,409 –> 00:03:49,359
اما در صورت سود آن حتی
72
00:03:49,359 –> 00:03:52,669
به زیر صفر و در موارد شدید
73
00:03:52,669 –> 00:03:56,599
حتی تا 10000 می رسد، بنابراین تصویر بسیار
74
00:03:56,599 –> 00:04:00,439
خوبی در مورد مجموعه داده های شما در
75
00:04:00,439 –> 00:04:02,060
دو طرف مثبت و منفی نشان می دهد
76
00:04:02,060 –> 00:04:04,759
و حتی در این مورد اگر
77
00:04:04,759 –> 00:04:08,419
بیشتر مشاهدات یا مشاهده را مشاهده کنید سود در یک خط است
78
00:04:08,419 –> 00:04:13,219
که احتمالاً صدها است یا می
79
00:04:13,219 –> 00:04:15,829
دانید دو رقمی است، بنابراین آنجاست
80
00:04:15,829 –> 00:04:18,440
که می توانید توزیع داده ها را ببینم،
81
00:04:18,440 –> 00:04:20,570
اما راه های مختلفی وجود دارد
82
00:04:20,570 –> 00:04:25,010
که می توانید این نمودار را سفارشی کنید و
83
00:04:25,010 –> 00:04:26,510
ببینیم آنها به خوبی عمل می
84
00:04:26,510 –> 00:04:27,830
کنند اولین چیزی که
85
00:04:27,830 –> 00:04:30,650
احتمالاً ممکن است بخواهید خلاص شدن از شر
86
00:04:30,650 –> 00:04:35,449
این شکل خاص است که
87
00:04:35,449 –> 00:04:38,780
بر سر توزیع قدرت ها به وجود می آید، بنابراین
88
00:04:38,780 –> 00:04:42,590
کاری که می توانید انجام دهید این است که به سادگی بگویید
89
00:04:42,590 –> 00:04:46,639
SN L شروع فاصله نقطه d T است که
90
00:04:46,639 –> 00:04:49,970
اشتباهی است که من زودتر از شروع فروش سود کردم.
91
00:04:49,970 –> 00:04:54,259
KDE برابر با نادرست KDE است یا چیزی نیست جز
92
00:04:54,259 –> 00:04:56,120
تخمین چگالی هسته که
93
00:04:56,120 –> 00:04:57,919
این نمودار را بر اساس
94
00:04:57,919 –> 00:05:01,610
چگالی داده ها تولید می کند و نموداری را به شما نشان می دهد
95
00:05:01,610 –> 00:05:04,550
که در
96
00:05:04,550 –> 00:05:07,699
صورت عدم نیاز به این نمودار احتمالاً به آن نیاز دارید، اما اگر به
97
00:05:07,699 –> 00:05:10,940
آن نیاز ندارید به نوار نیاز دارید و شما از نظر
98
00:05:10,940 –> 00:05:14,419
شکل خوب هستید، در این صورت می
99
00:05:14,419 –> 00:05:17,240
توانید یک پارامتر متفاوت را به طور کلی تنظیم کنید،
100
00:05:17,240 –> 00:05:20,599
بنابراین کاری که می توانید انجام دهید این است که در نگاه خیره به KDE
101
00:05:20,599 –> 00:05:23,719
بتوانید Hist را بگویید که چیزی نیست جز
102
00:05:23,719 –> 00:05:26,900
هیستوگرام برابر با false است، بنابراین شما چه چیزی
103
00:05:26,900 –> 00:05:32,509
باقی می ماند. با فقط شکل و
104
00:05:32,509 –> 00:05:35,599
هیستوگرام وجود ندارد، بنابراین اینها برخی
105
00:05:35,599 –> 00:05:38,000
از سفارشیسازیهایی هستند که بر اساس نیازهای شما
106
00:05:38,000 –> 00:05:40,759
در مورد نمایش دادههایی که
107
00:05:40,759 –> 00:05:43,789
میخواهید در یک گزارش یا در ارائه ما انجام دهید
108
00:05:43,789 –> 00:05:45,770
که اکنون برای کاوش دادهها آماده میشوید،
109
00:05:45,770 –> 00:05:48,050
هستند.
110
00:05:48,050 –> 00:05:51,830
یک پارامتر جالب دیگر، بنابراین اگر من
111
00:05:51,830 –> 00:05:54,710
فقط این را کپی کنم و بیایم اینجا
112
00:05:54,710 –> 00:06:03,080
که rug ru Chi برابر با true است
113
00:06:03,080 –> 00:06:06,139
و بر اساس تعداد نقاط داده ای
114
00:06:06,139 –> 00:06:09,440
که در آن سطل دارید،
115
00:06:09,440 –> 00:06:11,599
غلظت آن مجموعه داده را نشان می دهد و سپس
116
00:06:11,599 –> 00:06:14,900
چند داده را نشان می دهد. نقاطی که نزدیک
117
00:06:14,900 –> 00:06:17,569
به این مقادیر شدید در سمت چپ
118
00:06:17,569 –> 00:06:20,210
و در سمت راست دارید، بنابراین همراه با
119
00:06:20,210 –> 00:06:23,539
شکل، تمرکز خواننده را نشان می دهد،
120
00:06:23,539 –> 00:06:25,330
بنابراین گاهی اوقات یک نمایش بسیار معنی دار
121
00:06:25,330 –> 00:06:28,250
برای نشان دادن نحوه
122
00:06:28,250 –> 00:06:30,560
شناسایی محل تمرکز است، بنابراین
123
00:06:30,560 –> 00:06:32,659
احتمالاً می توانید میخواهید برای درک
124
00:06:32,659 –> 00:06:35,229
بهتر دادهها از اینجا به اینجا
125
00:06:35,229 –> 00:06:38,270
وقفه داشته باشید، همچنین میتوانید
126
00:06:38,270 –> 00:06:41,630
با binها بازی کنید، بنابراین
127
00:06:41,630 –> 00:06:45,830
فقط آن را کپی کنید و آن را در اینجا بچسبانید و بگویید
128
00:06:45,830 –> 00:06:49,610
بیایید بگوییم که در این مورد bins برابر با 100
129
00:06:49,610 –> 00:06:53,390
است. آن را نشان خواهد داد آیا می
130
00:06:53,390 –> 00:06:55,670
دانید یک تجسم را به روشی متفاوت ایجاد کنید،
131
00:06:55,670 –> 00:06:57,650
اما از آنجایی که این یک مقدار فوق العاده
132
00:06:57,650 –> 00:06:59,510
است که ممکن است نتوانید تغییرات زیادی را مشاهده کنید،
133
00:06:59,510 –> 00:07:02,810
اما کاری که من انجام خواهم داد این است که اگر نشان داده شود
134
00:07:02,810 –> 00:07:05,450
، فقط هیست را حذف می کنم.
135
00:07:05,450 –> 00:07:09,470
اطلاعات بد است، بنابراین این یک RAM گیر کرده است
136
00:07:09,470 –> 00:07:14,020
و احتمالاً باعث شده است که KDE برابر نادرست باشد
137
00:07:14,020 –> 00:07:16,790
فقط برای دیدن تغییر در هیستوگرام، بنابراین
138
00:07:16,790 –> 00:07:20,840
اگر من bin ها را ندارم، یک bin خودکار
139
00:07:20,840 –> 00:07:24,560
وجود دارد، بنابراین اگر مشاهده کنید قدرت در
140
00:07:24,560 –> 00:07:28,280
مقایسه با اندازه bin دستی بسیار ضخیم است.
141
00:07:28,280 –> 00:07:30,860
که من مشخص کردم، اما
142
00:07:30,860 –> 00:07:33,170
فکر می کنم اگر
143
00:07:33,170 –> 00:07:35,660
فرض کنیم می خواهیم فقط
144
00:07:35,660 –> 00:07:39,470
داده هایی را که برای یک
145
00:07:39,470 –> 00:07:42,650
دسته خاص از مقادیر یا یک
146
00:07:42,650 –> 00:07:45,890
منطقه خاص است، درک کنیم، بنابراین شاید در اینجا
147
00:07:45,890 –> 00:07:49,100
بتوانیم بگوییم منطقه شروع
148
00:07:49,100 –> 00:07:59,450
برابر با غرب است. بسیار خوب، بنابراین
149
00:07:59,450 –> 00:08:02,680
دادهها را با مقادیر کمی متفاوت به ما میدهد،
150
00:08:02,680 –> 00:08:05,570
بنابراین همانطور که میبینید میتوانید آن را به
151
00:08:05,570 –> 00:08:07,730
همان ا