در این مطلب، ویدئو تجزیه و تحلیل سبد بازار در پایتون|نحوه پیاده سازی تحلیل سبد بازار در پایتون|الگوریتم apriori با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:14:26
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,120 –> 00:00:01,709
خوش آمدید
2
00:00:01,709 –> 00:00:03,720
دوستان علم داده اینجا آمده است و من یک
3
00:00:03,720 –> 00:00:05,970
دانشمند داده در این ویدیوی خاص
4
00:00:05,970 –> 00:00:08,039
هستم، من قصد دارم شما را در
5
00:00:08,039 –> 00:00:10,650
اجرای عملی
6
00:00:10,650 –> 00:00:13,080
تحلیل سبد بازار در پایتون راهنمایی کنم، بنابراین این
7
00:00:13,080 –> 00:00:15,179
الگوریتم خاص اساساً
8
00:00:15,179 –> 00:00:18,150
برای توصیه در سناریوی خرده فروشی استفاده می شود.
9
00:00:18,150 –> 00:00:20,609
منظور من از آن این است که هر گونه جزئیات در مورد
10
00:00:20,609 –> 00:00:23,310
شما آنلاین یا آفلاین است، اگر مجبور
11
00:00:23,310 –> 00:00:25,500
باشیم فروش متقابل انجام دهیم یا
12
00:00:25,500 –> 00:00:27,869
چیزی را به کسی توصیه کنیم، پس این
13
00:00:27,869 –> 00:00:30,029
الگوریتم خاص مفید است، برای
14
00:00:30,029 –> 00:00:31,769
مثال اگر شخصی در حال خرید یک بسته تراشه است،
15
00:00:31,769 –> 00:00:34,559
پس از معامله تاریخی
16
00:00:34,559 –> 00:00:37,050
ما بدانید که افرادی که
17
00:00:37,050 –> 00:00:39,469
بسته چیپس می خرند احتمالاً
18
00:00:39,469 –> 00:00:42,120
سس مایونز یا سس یا چیزهایی از این
19
00:00:42,120 –> 00:00:44,610
دست می خرند، بنابراین ممکن است کسی که
20
00:00:44,610 –> 00:00:46,649
یک بسته چیپس خریده است ما بتوانیم به راحتی
21
00:00:46,649 –> 00:00:48,840
آنها را به راحتی یا سس یا چیزهایی از این قبیل به آنها توصیه کنیم،
22
00:00:48,840 –> 00:00:51,090
بنابراین چگونه می توان آن را
23
00:00:51,090 –> 00:00:52,559
به کار برد. چیزی در پایتون
24
00:00:52,559 –> 00:00:55,500
بیایید گام به گام شما را ببینیم خوب است، بنابراین
25
00:00:55,500 –> 00:00:56,969
در اولین بلوک کاری که من اینجا انجام می
26
00:00:56,969 –> 00:00:59,340
دهم این است که سعی می کنم برخی
27
00:00:59,340 –> 00:01:02,129
از بسته هایی را وارد کنم به این بستهها نیاز
28
00:01:02,129 –> 00:01:04,650
دارم پانداهای بیحس و دو
29
00:01:04,650 –> 00:01:07,740
بسته مهم در اینجا یک میلیلیتر الگوهای بدون نقطه گسترش میدهند،
30
00:01:07,740 –> 00:01:11,070
بنابراین اگر
31
00:01:11,070 –> 00:01:12,990
در حال حاضر در پایتون
32
00:01:12,990 –> 00:01:15,180
ندارید، باید این بسته را نصب کنید، بنابراین من
33
00:01:15,180 –> 00:01:17,009
به طور پیشینی از این بسته خاص وارد میکنم.
34
00:01:17,009 –> 00:01:19,740
و بسته دیگری که من
35
00:01:19,740 –> 00:01:23,159
وارد میکنم قوانین ارتباطی از ml است
36
00:01:23,159 –> 00:01:25,140
که الگوهای مکرر را گسترش نمیدهد، بنابراین این
37
00:01:25,140 –> 00:01:26,970
بسته دیگری است که باید آن را نصب
38
00:01:26,970 –> 00:01:29,369
کنید، اگر
39
00:01:29,369 –> 00:01:31,500
این بسته را همراه خود ندارید، خوب میدانید که اگر این بسته را همراه خود ندارید، پس
40
00:01:31,500 –> 00:01:34,110
این بستهای است که ما در این مورد استفاده خواهیم کرد. تجزیه
41
00:01:34,110 –> 00:01:37,140
و تحلیل یا در این پیاده سازی خوب حرکت
42
00:01:37,140 –> 00:01:38,939
رو به جلو آنچه در مرحله بعد انجام می دهم این است که
43
00:01:38,939 –> 00:01:42,509
من در حال خواندن یک فایل از این مکان خاص هستم،
44
00:01:42,509 –> 00:01:45,210
بنابراین این
45
00:01:45,210 –> 00:01:47,399
مکان چیست، اگر به این URL خاص در این URL بروید یک فایل اکسل در این مکان وجود دارد.
46
00:01:47,399 –> 00:01:50,040
47
00:01:50,040 –> 00:01:53,700
دادههای خردهفروشی آنلاین داشته باشید، خوب
48
00:01:53,700 –> 00:01:56,009
آن دادههای خردهفروشی
49
00:01:56,009 –> 00:01:58,530
خاص، دادههای تراکنش خاصی
50
00:01:58,530 –> 00:02:01,439
که با استفاده از زیرخط خواندن نقطه PD میخوانم، خوب است
51
00:02:01,439 –> 00:02:05,009
و من آن چارچوب داده را به عنوان
52
00:02:05,009 –> 00:02:07,049
دادههای خردهفروشیام میخوانم، بنابراین میدانم
53
00:02:07,049 –> 00:02:08,970
wingly این خط را نظر داد زیرا
54
00:02:08,970 –> 00:02:11,250
خواندن آن مدتی طول میکشد، من قبلاً
55
00:02:11,250 –> 00:02:13,950
این دادهها را خواندهام و اگر این دادهها را اجرا کنم،
56
00:02:13,950 –> 00:02:15,840
همانطور که میبینید به نظر میرسد این دادهها
57
00:02:15,840 –> 00:02:18,210
خوب به نظر میرسند، بنابراین این دادهها
58
00:02:18,210 –> 00:02:20,400
اساساً دادههای خردهفروشی آنلاین شما هستند که در آن
59
00:02:20,400 –> 00:02:22,590
ما یک معکوس داریم. شماره ما این
60
00:02:22,590 –> 00:02:24,330
کد بالا را داریم توضیحات
61
00:02:24,330 –> 00:02:26,580
محصول را داریم مقدار داریم
62
00:02:26,580 –> 00:02:28,530
تاریخ قیمت واحد فاکتور
63
00:02:28,530 –> 00:02:30,990
شناسه مشتری و کشور را داریم، بنابراین اینگونه است که
64
00:02:30,990 –> 00:02:33,540
دادههای خردهفروشی آنلاین به این صورت است که اکنون
65
00:02:33,540 –> 00:02:35,550
تجزیه و تحلیل انجمن او را در این مورد اجرا میکنیم.
66
00:02:35,550 –> 00:02:38,960
دادههای خاص خوب پیش میروم
67
00:02:38,960 –> 00:02:41,760
من در اینجا آمادهسازی دادهها را انجام میدهم،
68
00:02:41,760 –> 00:02:43,440
بنابراین اولین کاری که اینجا انجام میدهم این است که من
69
00:02:43,440 –> 00:02:45,540
فقط فضای
70
00:02:45,540 –> 00:02:47,240
ستون توضیحات را حذف میکنم همانطور که میتوانید
71
00:02:47,240 –> 00:02:50,070
ستون توضیحات را مشاهده کنید آیا
72
00:02:50,070 –> 00:02:52,200
برخی از کاراکترهای یک جمله
73
00:02:52,200 –> 00:02:53,970
را میشناسید، بنابراین آنجا این احتمال
74
00:02:53,970 –> 00:02:57,450
وجود دارد که در اینجا قبل از
75
00:02:57,450 –> 00:02:59,970
جمله و بعد از جمله فاصله وجود داشته باشد، بنابراین
76
00:02:59,970 –> 00:03:01,590
کاری که من در این خط انجام می دهم،
77
00:03:01,590 –> 00:03:04,380
فقط این فاصله را حذف می کنم تا
78
00:03:04,380 –> 00:03:06,600
فقط محصول توصیف شود. Ption وجود دارد، من
79
00:03:06,600 –> 00:03:08,030
80
00:03:08,030 –> 00:03:10,470
فاکتور را نیز زیر مجموعه میکنم و
81
00:03:10,470 –> 00:03:13,380
تمام NS را از فاکتور حذف میکنم، بنابراین اگر
82
00:03:13,380 –> 00:03:15,840
فاکتورهایی وجود دارد که na
83
00:03:15,840 –> 00:03:18,540
وجود دارد، اگر شماره فاکتوری وجود ندارد، من
84
00:03:18,540 –> 00:03:21,950
آن سوابق را حذف میکنم، خوب و همچنین
85
00:03:21,950 –> 00:03:25,730
در اینجا چه میکنم. آیا من فقط
86
00:03:25,730 –> 00:03:28,200
شماره فاکتور را به
87
00:03:28,200 –> 00:03:30,300
تاریخچه تایپ تبدیل می کنم این مورد نیاز است زیرا وقتی
88
00:03:30,300 –> 00:03:32,370
تجزیه و تحلیل را اجرا می کنیم
89
00:03:32,370 –> 00:03:34,140
الگوریتم عدد معکوس را به عنوان یک
90
00:03:34,140 –> 00:03:37,560
نوع داده رشته ای درک می کند خوب در خط بعدی
91
00:03:37,560 –> 00:03:38,790
کاری که من در اینجا انجام می دهم این است که فقط
92
00:03:38,790 –> 00:03:41,970
نوع اعتبار را حذف می کنم. فاکتور
93
00:03:41,970 –> 00:03:43,590
پس از کجا بدانم که یک نوع اعتباری از
94
00:03:43,590 –> 00:03:46,410
فاکتورها است، من فقط یک کلمه کلیدی خاص
95
00:03:46,410 –> 00:03:48,959
یا یک الفبای خاص C را می بینم و سپس
96
00:03:48,959 –> 00:03:50,760
متوجه می شوم که این یک معکوس اعتبار است
97
00:03:50,760 –> 00:03:53,100
و از این رو از تحلیل من در
98
00:03:53,100 –> 00:03:56,000
حال حاضر در حال حذف آن
99
00:03:56,000 –> 00:03:59,640
تراکنش های اعتباری یا فاکتورها هستم. بعد از انجام تمام
100
00:03:59,640 –> 00:04:02,310
این پاکسازی دادهها، آنچه من
101
00:04:02,310 –> 00:04:04,530
دارم دادههای پاکی است که به نظر
102
00:04:04,530 –> 00:04:08,610
میرسد از این دادههای پاک، چیزی که
103
00:04:08,610 –> 00:04:10,739
من در اینجا میبینم این است که
104
00:04:10,739 –> 00:04:12,959
تعداد مقدار یا تعداد رکورد برای dif چقدر است.
105
00:04:12,959 –> 00:04:15,239
کشورهای دیگر همانطور که می بینید
106
00:04:15,239 –> 00:04:17,488
آخرین ستون در اینجا کشور است، بنابراین من فقط
107
00:04:17,488 –> 00:04:19,709
می خواهم ببینم کدام کشور چند
108
00:04:19,709 –> 00:04:20,548
رکورد دارد،
109
00:04:20,548 –> 00:04:23,220
بنابراین بریتانیا بالاترین رکورد را دارد،
110
00:04:23,220 –> 00:04:25,710
سپس آلمان می آید و سپس فرانسه می آید، بنابراین
111
00:04:25,710 –> 00:04:27,810
اندازه داده ها بسیار زیاد است، بنابراین
112
00:04:27,810 –> 00:04:30,000
بررسی کنید که چه مقدار است. اندازه دادهها در اینجا،
113
00:04:30,000 –> 00:04:35,940
بنابراین اگر میگویم دادههای خردهفروشی من به شکل 2 دلار است،
114
00:04:35,940 –> 00:04:38,760
باید اندازه دادههایم را به من بدهد،
115
00:04:38,760 –> 00:04:41,639
بنابراین اندازه دادههای من 532 K است که
116
00:04:41,639 –> 00:04:44,700
به این معنی است که 532 K رکورد در دادههای من از
117
00:04:44,700 –> 00:04:47,700
آن پنج رکورد 32k تا میتوانید ببینید
118
00:04:47,700 –> 00:04:51,630
چه زمانی ارزش ponts 487 k فقط uke cots
119
00:04:51,630 –> 00:04:54,690
است و بقیه کشورهای دیگر هستند، بنابراین
120
00:04:54,690 –> 00:04:56,610
کاری که در مرحله بعدی انجام می دهم این است که
121
00:04:56,610 –> 00:04:58,770
فقط داده های یک کشور
122
00:04:58,770 –> 00:05:01,800
را فیلتر می کنم اگر می توانید اینجا را ببینید من می گویم
123
00:05:01,800 –> 00:05:04,139
کشور داده خرده فروشی من برابر است به آلمان،
124
00:05:04,139 –> 00:05:06,630
پس چرا این کار را انجام میدهم این است که
125
00:05:06,630 –> 00:05:09,030
نمیخواهم آنالیز را برای تمام ترانساکسلهای 550 K
126
00:05:09,030 –> 00:05:11,700
نزدیک به تراکنشهای 550 K انجام
127
00:05:11,700 –> 00:05:14,639
دهم، کاری که میخواهم انجام دهم این است که میخواهم تجزیه و تحلیل من
128
00:05:14,639 –> 00:05:16,710
برای هدف نمایش سریعتر اجرا شود
129
00:05:16,710 –> 00:05:19,470
و از این رو در حال اجرا هستم. کشور
130
00:05:19,470 –> 00:05:22,560
آلمان فقط خوب است، بنابراین کاری که من اینجا انجام می دهم این است
131
00:05:22,560 –> 00:05:25,500
که همه چیز را می گیرم تراکنش آلمان،
132
00:05:25,500 –> 00:05:27,360
سپس بر اساس شماره فاکتور
133
00:05:27,360 –> 00:05:31,710
و توضیحات گروه بندی می کنم و فقط مقداری را جمع می کنم،
134
00:05:31,710 –> 00:05:34,740
بنابراین کل این کد چه
135
00:05:34,740 –> 00:05:37,110
کاری انجام می دهد این است که سبدی از تراکنش ها را به من می
136
00:05:37,110 –> 00:05:39,030
دهد، بنابراین این سبد
137
00:05:39,030 –> 00:05:40,800
تراکنش چگونه به نظر می رسد.
138
00:05:40,800 –> 00:05:43,440
این عدد معکوس بنابراین از
139
00:05:43,440 –> 00:05:45,570
دادههای اصلی از این فایل اکسل که
140
00:05:45,570 –> 00:05:48,120
اکنون وارد کردهایم، من یک
141
00:05:48,120 –> 00:05:51,150
داده سبد دارم که با آن سبد خود تماس میگیرم، بنابراین
142
00:05:51,150 –> 00:05:52,890
چگونه دادههای سبد به نظر میرسد این است
143
00:05:52,890 –> 00:05:55,200
که یک عدد معکوس به عنوان کلید خواهد داشت و اینها
144
00:05:55,200 –> 00:05:57,060
هستند نام محصولات ده رنگ
145
00:05:57,060 –> 00:05:59,550
فضای پسر 10 10 رنگی 40 بادکنک همه
146
00:05:59,550 –> 00:06:02,669
این موارد نام محصولات است بنابراین
147
00:06:02,669 –> 00:06:05,639
اگر مقدار اینجا 0 باشد به این معنی است که
148
00:06:05,639 –> 00:06:07,680
کالا در این
149
00:06:07,680 –> 00:06:10,289
فاکتور وجود نداشته است و اگر یک عدد مثبت
150
00:06:10,289 –> 00:06:12,960
در اینجا داشته باشیم به عنوان مثال 1 2 3 4 5 6 هر چیزی
151
00:06:12,960 –> 00:06:16,410
که به این معنی است که محصول بخشی از
152
00:06:16,410 –> 00:06:18,960
این معکوس بوده است، همانطور که
153
00:06:18,960 –> 00:06:22,229
در اینجا میبینید، مجموع بر روی مقدار انجام میشود،
154
00:06:22,229 –> 00:06:24,630
بنابراین من میگویم گروه بر اساس
155
00:06:24,630 –> 00:06:26,460
عدد معکوس و توضیحات و مقداری بر روی
156
00:06:26,460 –> 00:06:30,000
کمیت، پس چه خواهیم کرد. ببینید در اینجا
157
00:06:30,000 –> 00:06:31,470
همه رکوردها این صفحه را دریافت نمی کنند
158
00:06:31,470 –> 00:06:34,139
اگر آن را به CSV صادر کنیم و ببینیم که
159
00:06:34,139 –> 00:06:36,090
برخی از اعداد را در اینجا خواهیم دید برخی از
160
00:06:36,090 –> 00:06:37,890
مقادیر 0 و برخی از مقادیر اعداد خواهند بود
161
00:06:37,890 –> 00:06:40,740
اعداد به این معنی که آن محصولات خاص
162
00:06:40,740 –> 00:06:41,660
بخشی هستند
163
00:06:41,660 –> 00:06:44,540
که معکوس اوکی هستند و صفر به معنای این
164
00:06:44,540 –> 00:06:46,670
خاص است. محصول بخشی از
165
00:06:46,670 –> 00:06:48,560
این بیماری نیست که من انجام می دهم،
166
00:06:48,560 –> 00:06:50,630
من فقط یک سبدی از تراکنش ها ایجاد می کنم، بسیار
167
00:06:50,630 –> 00:06:53,840
خوب، به مرحله بعدی
168
00:06:53,840 –> 00:06:56,090
می روم.
169
00:06:56,090 –> 00:06:59,450
170
00:06:59,450 –> 00:07:02,660
کمتر
171
00:07:02,660 –> 00:07:05,240
از 0 تا 0 هستند و همه اعدادی
172
00:07:05,240 –> 00:07:07,220
که بزرگتر از 1 به 1 هستند، پس چرا من این
173
00:07:07,220 –> 00:07:10,970
کار را انجام می دهم این است که می خواهم این قاب داده یا
174
00:07:10,970 –> 00:07:14,330
این داده فقط 0 و 1 شود زیرا
175
00:07:14,330 –> 00:07:16,760
این همان چیزی ا