در این مطلب، ویدئو آموزش Pyspark برای مبتدیان | آپاچی اسپارک با پایتون | Intellipaat با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:35:10
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:14,969
یک حزب اسپارک یکی از
2
00:00:14,969 –> 00:00:16,500
پرکاربردترین فریم ورکها برای
3
00:00:16,500 –> 00:00:18,660
مدیریت و کار با دادههای بزرگ است
4
00:00:18,660 –> 00:00:21,510
، از سوی دیگر پایتون یکی از
5
00:00:21,510 –> 00:00:23,670
پرکاربردترین زبانهای برنامهنویسی برای
6
00:00:23,670 –> 00:00:26,039
یادگیری ماشینی تجزیه و تحلیل دادهها است و
7
00:00:26,039 –> 00:00:29,460
خیلی بیشتر از این، چرا آنها را با هم استفاده نکنیم.
8
00:00:29,460 –> 00:00:32,130
جایی است که پایتون با جرقه که به عنوان پارک ادویه نیز شناخته میشود
9
00:00:32,130 –> 00:00:34,250
وارد تصویر میشود،
10
00:00:34,250 –> 00:00:37,170
پس سلام و خوش آمدید بچهها، من Ethel
11
00:00:37,170 –> 00:00:39,570
از اینتل جدا هستم و امروز اینجا هستیم
12
00:00:39,570 –> 00:00:42,960
با آموزش درخواستی در مورد PI spa، بنابراین
13
00:00:42,960 –> 00:00:44,760
بدون تأخیر بیشتر، اجازه دهید
14
00:00:44,760 –> 00:00:46,559
سریعاً به دستور کار برویم.
15
00:00:46,559 –> 00:00:48,660
جلسه امروز آموزش PI spark برای
16
00:00:48,660 –> 00:00:51,079
مبتدیان،
17
00:00:57,440 –> 00:01:00,060
بنابراین من این جلسه را با
18
00:01:00,060 –> 00:01:02,220
معرفی مختصری از PI spark شروع
19
00:01:02,220 –> 00:01:04,170
می کنم و در مورد مواردی مانند ادویه آب
20
00:01:04,170 –> 00:01:06,630
پارک Wi-Fi spark water مزایای مختلف آن را مورد بحث قرار می دهیم
21
00:01:06,630 –> 00:01:08,940
و پس از اتمام کار آن
22
00:01:08,940 –> 00:01:11,370
را نشان خواهم داد. شما می دانید که چگونه برخی از غول های بزرگ فناوری
23
00:01:11,370 –> 00:01:13,530
در بازار در حال حاضر از اسپارک pi
24
00:01:13,530 –> 00:01:15,900
در توسعه خود استفاده می کنند تا آن زمان، زیرا
25
00:01:15,900 –> 00:01:17,729
شما بچه ها ایده درستی از چیستی
26
00:01:17,729 –> 00:01:20,729
جرقه PI دارید، بنابراین من
27
00:01:20,729 –> 00:01:22,890
به سمت i حرکت می کنم. قسمت nstallation که در آن
28
00:01:22,890 –> 00:01:25,110
به شما آموزش می دهم که PI spark را به
29
00:01:25,110 –> 00:01:27,330
خوبی روی دستگاه خود نصب کنید اگر می خواهید از این آموزش حداکثر استفاده را ببرید،
30
00:01:27,330 –> 00:01:28,590
31
00:01:28,590 –> 00:01:30,300
پیشنهاد می کنم مطمئن شوید که
32
00:01:30,300 –> 00:01:32,820
نسخه ی نمایشی را در کنار هم انجام می دهید به این
33
00:01:32,820 –> 00:01:34,500
ترتیب می توانیم یک جلسه تعاملی داشته باشیم
34
00:01:34,500 –> 00:01:36,660
و میتوانید شکهای خود را در
35
00:01:36,660 –> 00:01:38,580
بخش نظرات زیر مطرح کنید و ما سعی میکنیم
36
00:01:38,580 –> 00:01:42,000
در اولین فرصت به آنها پاسخ دهیم، بنابراین پس از
37
00:01:42,000 –> 00:01:43,290
38
00:01:43,290 –> 00:01:45,210
اتمام نصب، در نهایت این جلسه را با
39
00:01:45,210 –> 00:01:47,280
اصول جرقه پایان میدهیم، جایی که در
40
00:01:47,280 –> 00:01:50,040
مورد عفونت جرقه بحث خواهیم کرد.
41
00:01:50,040 –> 00:01:52,800
فایل های spark context spark rdd و فریم های داده و
42
00:01:52,800 –> 00:01:55,080
عمق نگران نباشید من مطمئن می شوم
43
00:01:55,080 –> 00:01:57,180
که یک نسخه آزمایشی مرتبط را تهیه می کنم که به
44
00:01:57,180 –> 00:01:59,910
شما ایده بهتری از این موضوعات می
45
00:01:59,910 –> 00:02:02,520
46
00:02:02,520 –> 00:02:06,350
47
00:02:07,549 –> 00:02:09,818
دهد. بیایید با اولین مبحث
48
00:02:09,818 –> 00:02:11,870
مقدمه ای برای paisa شروع کنیم،
49
00:02:11,870 –> 00:02:14,420
شما می دانید که میانگین دستمزد یک
50
00:02:14,420 –> 00:02:17,690
توسعه دهنده اسپارک آپاچی حدود 110000
51
00:02:17,690 –> 00:02:20,269
دلار در سال است، بنابراین شکی وجود ندارد
52
00:02:20,269 –> 00:02:24,260
که در حال حاضر
53
00:02:24,260 –> 00:02:25,489
وقتی صحبت از peyten b به میان می آید از اسپارک در صنعت استفاده زیادی می شود.
54
00:02:25,489 –> 00:02:27,890
به دلیل مجموعه کتابخانه ای غنی خود،
55
00:02:27,890 –> 00:02:30,019
امروزه توسط اکثر دانشمندان داده و
56
00:02:30,019 –> 00:02:33,319
کارشناسان تجزیه و تحلیل استفاده می شود، بنابراین
57
00:02:33,319 –> 00:02:35,780
ترکیب پایتون و
58
00:02:35,780 –> 00:02:38,209
اسپارک یک هدیه بزرگ به جامعه بود.
59
00:02:38,209 –> 00:02:40,730
60
00:02:40,730 –> 00:02:43,640
61
00:02:43,640 –> 00:02:46,340
برای JVM برای پردازش کلان داده های جرقه ای
62
00:02:46,340 –> 00:02:49,069
، بنابراین برای پشتیبانی از اسپارک با
63
00:02:49,069 –> 00:02:51,260
پایتون، پارک ادویه انتشار انجمن اسپارک آپاچی،
64
00:02:51,260 –> 00:02:54,549
65
00:02:54,790 –> 00:02:56,560
پس بچه ها نظر شما درباره کیک
66
00:02:56,560 –> 00:03:00,130
67
00:03:00,130 –> 00:03:02,350
ها
68
00:03:02,350 –> 00:03:04,270
چیست. برای
69
00:03:04,270 –> 00:03:06,160
مقابله با پایتون و همچنین
70
00:03:06,160 –> 00:03:08,800
جرقه درست از آنجایی که قبلاً به شما گفتم
71
00:03:08,800 –> 00:03:10,930
که پایتون یک زبان برنامه نویسی متن باز و قدرتمند
72
00:03:10,930 –> 00:03:12,790
سطح بالا و شی
73
00:03:12,790 –> 00:03:14,800
گرا است و بله از نظر
74
00:03:14,800 –> 00:03:16,990
نحو آن در مقایسه با سایر زبان ها استفاده و خواندن آن بسیار آسان تر است.
75
00:03:16,990 –> 00:03:18,670
76
00:03:18,670 –> 00:03:20,860
از طرف دیگر زبان برنامه نویسی Apache
77
00:03:20,860 –> 00:03:23,080
Spark یک
78
00:03:23,080 –> 00:03:25,180
موتور محاسباتی توزیع شده همه منظوره منبع باز است
79
00:03:25,180 –> 00:03:27,190
که برای فشار دادن و برخورد با حجم
80
00:03:27,190 –> 00:03:29,740
زیادی از داده ها استفاده می شود. o اینجا نقطه PI می آید،
81
00:03:29,740 –> 00:03:32,170
این یک همکاری Apache Spark است و
82
00:03:32,170 –> 00:03:35,050
Python یک API برای spark است که
83
00:03:35,050 –> 00:03:37,720
به راحتی با استفاده
84
00:03:37,720 –> 00:03:40,090
از کتابخانه ای به نام pi for j با RDD کار می کند، بنابراین اجازه دهید
85
00:03:40,090 –> 00:03:42,910
به شما بگویم که pi spark یک API است که در آن
86
00:03:42,910 –> 00:03:44,890
سادگی را با هم ادغام می کنید. پایتون با
87
00:03:44,890 –> 00:03:46,900
قدرت اسپارک آپاچی برای به دست
88
00:03:46,900 –> 00:03:49,540
آوردن کلان داده برای کسانی از شما که
89
00:03:49,540 –> 00:03:51,430
قبلاً با اسپارک و
90
00:03:51,430 –> 00:03:53,920
مفهوم rdd آشنا هستید، می
91
00:03:53,920 –> 00:03:56,440
توانید آن را به عنوان یک API پایتون برای اسپارک در نظر بگیرید
92
00:03:56,440 –> 00:03:59,380
که به راحتی با RDD ادغام می شود و با آن کار می کند.
93
00:03:59,380 –> 00:04:02,110
با استفاده از کتابخانه ای به نام pi forging the
94
00:04:02,110 –> 00:04:02,830
spice park
95
00:04:02,830 –> 00:04:05,890
، پوسته PI Spock را ارائه می دهد که
96
00:04:05,890 –> 00:04:08,350
API پایتون را به هسته اسپارک پیوند می دهد و
97
00:04:08,350 –> 00:04:12,070
زمینه جرقه را اولیه می کند، امیدوارم تا به
98
00:04:12,070 –> 00:04:13,930
حال شما بچه ها ایده مختصری از
99
00:04:13,930 –> 00:04:15,950
آنچه که pi spark است داشته
100
00:04:15,950 –> 00:04:17,910
101
00:04:17,910 –> 00:04:19,358
باشید،
102
00:04:19,358 –> 00:04:21,819
پس بیایید حرکت کنیم. اجازه دهید
103
00:04:21,819 –> 00:04:24,819
در مورد برخی از مزایای آن به شما بگویم، این
104
00:04:24,819 –> 00:04:26,500
به شما کمک می کند تا در مورد اینکه چرا
105
00:04:26,500 –> 00:04:28,030
باید از PAH ادویه استفاده کنید بیشتر بدانید،
106
00:04:28,030 –> 00:04:30,280
همانطور که در اینجا می بینیم ما دارای سرعت
107
00:04:30,280 –> 00:04:32,379
قدرتمند ذخیره سازی حافظه پنهان استقرار محاسبات در زمان واقعی
108
00:04:32,379 –> 00:04:35,710
و چند زبانه و غیره
109
00:04:35,710 –> 00:04:37,810
ما سرعت داریم، بنابراین وقتی آن را
110
00:04:37,810 –> 00:04:39,400
با پردازش دادههای سنتی در مقیاس بزرگ مقایسه
111
00:04:39,400 –> 00:04:41,319
میکنید، مطمئناً 100 برابر سریعتر
112
00:04:41,319 –> 00:04:44,949
از همه آنها از نظر
113
00:04:44,949 –> 00:04:47,259
حافظه پنهان
114
00:04:47,259 –> 00:04:49,270
قدرتمند است.
115
00:04:49,270 –> 00:04:52,360
116
00:04:52,360 –> 00:04:54,699
محاسبات به خوبی دادههای زیادی وجود دارد
117
00:04:54,699 –> 00:04:56,919
که باید در زمان واقعی پردازش شوند،
118
00:04:56,919 –> 00:04:59,229
اجازه دهید این واقعیت را به شما بگویم
119
00:04:59,229 –> 00:05:02,319
که میدانید در هر دقیقه حدود 48 ساعت
120
00:05:02,319 –> 00:05:04,870
ویدیویی که امروز در YouTube آپلود میشود،
121
00:05:04,870 –> 00:05:07,599
حدود 98 هزار توییت و
122
00:05:07,599 –> 00:05:10,599
بیش از 168 میلیون ایمیل دریافت میشود.
123
00:05:10,599 –> 00:05:13,990
این داده ها در هر دقیقه ارسال می شوند و این داده ها
124
00:05:13,990 –> 00:05:16,360
به صورت تکه تکه از
125
00:05:16,360 –> 00:05:18,819
منابع مختلف به دست می آیند و می توانند به
126
00:05:18,819 –> 00:05:21,909
اشکال مختلف مانند کلمات تصاویر اعداد و
127
00:05:21,909 –> 00:05:24,639
غیره بیایند، بنابراین توییتر نمونه بسیار خوبی از
128
00:05:24,639 –> 00:05:27,129
آنچه در زمان واقعی تولید می شود ما
129
00:05:27,129 –> 00:05:29,469
همچنین وب سایت هایی داریم که در آن آمار ارائه می شود. مانند
130
00:05:29,469 –> 00:05:32,259
تعداد بازدیدکنندگان صفحه و غیره
131
00:05:32,259 –> 00:05:34,719
که در زمان واقعی ایجاد
132
00:05:34,719 –> 00:05:36,550
می شوند، داده های زیادی وجود دارد و
133
00:05:36,550 –> 00:05:39,610
به شکل خام مفید نیستند که باید پردازش کنیم. آن
134
00:05:39,610 –> 00:05:42,039
را استخراج کنید و از آن استناد کنید تا
135
00:05:42,039 –> 00:05:45,219
برای ما مفیدتر شود، بنابراین
136
00:05:45,219 –> 00:05:46,960
اینجاست که پخش نقطه ای به
137
00:05:46,960 –> 00:05:49,599
تصویر کشیده می شود، در
138
00:05:49,599 –> 00:05:51,759
پردازش داده های بلادرنگ فوق العاده خوب است و بسیار
139
00:05:51,759 –> 00:05:55,029
مقیاس پذیر است و می تواند حجم عظیمی
140
00:05:55,029 –> 00:05:57,069
از داده ها را در زمان واقعی بدون پردازش کند. رد شدن از یک
141
00:05:57,069 –> 00:06:00,370
بیت من دوست دارم ویژگی بعدی که در اینجا میتوانیم ببینیم
142
00:06:00,370 –> 00:06:02,650
، استقرار است و شما میتوانید
143
00:06:02,650 –> 00:06:05,589
PI SPARC را از طریق Mrs مستقر کنید. Hadoop یا حتی
144
00:06:05,589 –> 00:06:08,490
از طریق spark zone cluster همه درست
145
00:06:08,490 –> 00:06:12,039
بعدی ما چند زبانه است و به سادگی به این
146
00:06:12,039 –> 00:06:14,139
معنی است که از چندین زبان
147
00:06:14,139 –> 00:06:17,139
مانند Python Java و Scala ما
148
00:06:17,139 –> 00:06:19,539
پشتیبانی می کند و اساساً پوسته و Scala را
149
00:06:19,539 –> 00:06:21,159
در Python ارائه می دهد که می توانید از
150
00:06:21,159 –> 00:06:23,349
طریق پوشه Ben هر دو Scala به آنها دسترسی داشته باشید. و
151
00:06:23,349 –> 00:06:26,969
همچنین Python خوب است
152
00:06:30,430 –> 00:06:33,190
، ممکن است یک سوال در ذهن شما ایجاد شود مانند
153
00:06:33,190 –> 00:06:35,500
وضعیت Underwood آیا من از Python استفاده کنم
154
00:06:35,500 –> 00:06:38,260
یا در چه سناریویی باید با
155
00:06:38,260 –> 00:06:42,610
Scala یا Java استفاده کنم یا همه چیز خوب است، اجازه دهید
156
00:06:42,610 –> 00:06:45,250
به شما بگویم پرکاربردترین
157
00:06:45,250 –> 00:06:47,770
زبان برنامه نویسی با spark a Python و
158
00:06:47,770 –> 00:06:50,680
Scala خیلی خوب است، بنابراین اگر می خواهید
159
00:06:50,680 –> 00:06:53,140
در این آموزش PI spark را یاد بگیرید،
160
00:06:53,140 –> 00:06:55,930
مهم است که بدانید چرا و
161
00:06:55,930 –> 00:06:58,780
چه زمانی از spark با پایتون به جای
162
00:06:58,780 –> 00:07:01,750
spark با اسکالا استفاده کنید، بنابراین اجازه دهید
163
00:07:01,750 –> 00:07:03,850
پایتون و اسپارک را با برخی پارامترها مقایسه
164
00:07:03,850 –> 00:07:05,890
کنم. تصمیم گیری برای شما واضح تر است
165
00:07:05,890 –> 00:07:08,190
166
00:07:08,530 –> 00:07:11,050
بنابراین اولین پارامترها سرعت عملکرد
167
00:07:11,050 –> 00:07:13,690
پایتون نسبتاً کندتر از
168
00:07:13,690 –> 00:07:15,940
اسکالا در هنگام استفاده با spud است اما
169
00:07:15,940 –> 00:07:17,950
برنامه نویسان می توانند کارهای بیشتری را با Python
170
00:07:17,950 –> 00:07:20,050
th انجام دهند. یک Scala به دلیل رابط آسانی
171
00:07:20,050 –> 00:07:23,230
که ارائه می دهد، از سوی دیگر
172
00:07:23,230 –> 00:07:25,870
SPARC در Scala نوشته شده است، بنابراین به خوبی با Scala ادغام می شود
173
00:07:25,870 –> 00:07:28,120
و آن را سریعتر
174
00:07:28,120 –> 00:07:32,110
از Python می کند، بنابراین در مرحله بعدی
175
00:07:32,110 –> 00:07:34,990
ما یادگیری Co Python است که به دلیل
176
00:07:34,990 –> 00:07:36,940
سینتکس آسان و یک زبان ساده شناخته شده است. زبان سطح بالا
177
00:07:36,940 –> 00:07:39,070
یادگیری را آسانتر میکند،
178
00:07:39,070 –> 00:07:42,190
در حالی که اسکالا دارای یک نحو آرکین است که
179
00:07:42,190 –> 00:07:44,110
یادگیری آن را سخت میکند، اما وقتی
180
00:07:44,110 –> 00:07:46,150
به آن دست پیدا کنید، میبینید که
181
00:07:46,150 –> 00:07:49,450
مزایای خاص خود را دارد، کتابخانه علوم دادهای که
182
00:07:49,450 –> 00:07:52,660
پایتون از آن پشتیبانی میکند. کتابخانههای
183
00:07:52,660 –> 00:07:53,860
علم دادههای چندگانه و یادگیری ماشین،
184
00:07:53,860 –> 00:07:57,040
اما از سوی دیگر محقق
185
00:07:57,040 –> 00:07:59,230
فاقد کتابخانه و ابزار علم داده مناسب است.
186
00:07:59,230 –> 00:08:01,720
187
00:08:01,720 –> 00:08:05,800
188
00:08:05,800 –> 00:08:08,530
189
00:08:08,530 –> 00:08:11,890
190
00:08:11,890 –> 00:08:14,830
191
00:08:14,830 –> 00:08:17,140
نحو اسکالای دستی و این واقعیت
192
00:08:17,140 –> 00:08:19,180
که آن خروجی پرمخاطب را تولید
193
00:08:19,180 –> 00:08:21,460
می کند به همین دلیل است که زبان پیچیده ای در نظر گرفته
194
00:08:21,460 –> 00:08:24,669
می شود، امیدوارم همه چیز
195
00:08:24,669 –> 00:08:27,180
برای شما واضح
196
00:08:27,610 –> 00:08:29,979
تر شود. قبل از اینکه عمیقتر به مفهوم PI Spock بپردازیم،
197
00:08:29,979 –> 00:08:32,140
اجازه دهید به شما بگویم که چگونه
198
00:08:32,140 –> 00:08:34,630
غولهای فناوری بزرگ مانند Yahoo TripAdvisor
199
00:08:34,630 –> 00:08:37,570
Alibaba و سایر شرکتهای بزرگ چندملیتی
200
00:08:37,570 –> 00:08:39,039
از اسپارک Pi برای آنها
201
00:08:39,039 –> 00:08:41,890
استفاده میکنند یاهو از اسپارک Apache برای
202
00:08:41,890 –> 00:08:43,750
قابلیتهای یادگیری ماشینی خود برای
203
00:08:43,750 –> 00:08:46,060
شخصیسازی اخبار و صفحات وب خود استفاده میکند.
204
00:08:46,060 –> 00:08:48,570
همچنین برای هدف قرار دادن تبلیغات و
205
00:08:48,570 –> 00:08:52,149
همچنین برای تبلیغات هدف از Python درخشنده استفاده می کنند
206
00:08:52,149 –> 00:08:55,209
تا بفهمند چه نوع
207
00:08:55,209 –> 00:08:57,630
کاربر خبری به خواندن و
208
00:08:57,630 –> 00:09:00,130
طبقه بندی اخبار علاقه مند است تا بفهمد
209
00:09:00,130 –> 00:09:02,709
که چه نوع کاربری علاقه مند به
210
00:09:02,709 –> 00:09:06,130
خواندن هر دسته از اخبار بعدی
211
00:09:06,130 –> 00:09:09,310
است Trip. Advisor well Trip Advisor از
212
00:09:09,310 –> 00:09:11,200
یک مکان مهمانی برای ارائه مشاوره به
213
00:09:11,200 –> 00:09:13,510
میلیون ها مسافر با مقایسه
214
00:09:13,510 –> 00:09:15,279
صدها وب سایت برای یافتن بهترین
215
00:09:15,279 –> 00:09:18,100
قیمت کل برای مشتری خود استفاده
216
00:09:18,100 –> 00:09:20,170
217
00:09:20,170 –> 00:09:22,360
218
00:09:22,360 –> 00:09:24,250
می کند.
219
00:09:24,250 –> 00:09:27,220
خوب است بیایید در مورد علی بابا بحث
220
00:09:27,220 –> 00:09:30,250
221
00:09:30,250 –> 00:09:32,410
222
00:09:32,410 –> 00:09:34,510
کنیم. بزرگترین پلتفرم تجارت الکترونیکی است و
223
00:09:34,510 –> 00:09:36,880
برخی از بزرگترین مشاغل جدا از هم در East Park
224
00:09:36,880 –> 00:09:38,860
در جهان را اجرا می کند تا
225
00:09:38,860 –> 00:09:40,779
صدها پتابایت داده را بر روی
226
00:09:40,779 –> 00:09:43,779
پلت فرم تجارت الکترونیک خود تجزیه و تحلیل کند، بنابراین حدس می زنم
227
00:09:43,779 –> 00:09:46,899
اکنون متوجه شده اید که پارک Pice چگونه در
228
00:09:46,899 –> 00:09:50,199
این زمینه استفاده می شود. این صنعت درست است، بنابراین
229
00:09:50,199 –> 00:09:53,680
قبل از اینکه به عنوان هر کسی شکی تا اینجا ادامه دهم،
230
00:09:53,680 –> 00:09:56,320
اگر بله، لطفاً آن را به
231
00:09:56,320 –> 00:09:57,940
بخش نظرات زیر اضافه کنید و ما سعی
232
00:09:57,940 –> 00:10:01,230
خواهیم کرد در اولین فرصت به آنها پاسخ دهیم،
233
00:10:03,600 –> 00:10:06,209
بنابراین اگر شما یک بیننده موبایل
234
00:10:06,209 –> 00:10:07,860
هستید، لپ تاپ خود را آماده کنید. زیرا اکنون ما
235
00:10:07,860 –> 00:10:10,259
به قسمت نصب ادامه می
236
00:10:10,259 –> 00:10:12,769
دهیم، بنابراین اجازه دهید PI spark را در سیستم شما نصب
237
00:10:12,769 –> 00:10:14,699
کنیم تا آن را واقعی نگه داریم،
238
00:10:14,699 –> 00:10:17,130
فقط در صورتی که گیر کرده اید،
239
00:10:17,130 –> 00:10:18,839
مرجع نصب بسیاری را
240
00:10:18,839 –> 00:10:20,610
در اینترنت پیدا خواهید کرد که می توانید ادامه دهید
241
00:10:20,610 –> 00:10:24,420
و به آنها مراجعه کنید. و نصب شوید پس بچه ها
242
00:10:24,420 –> 00:10:26,009
در این آموزش من به شما
243
00:10:26,009 –> 00:10:27,779
یاد می دهم که چگونه می توانید PI spark را
244
00:10:27,779 –> 00:10:30,930
روی دستگاه ویندوز خود نصب کنید، اگر
245
00:10:30,930 –> 00:10:33,149
کاربر لینوکس ما هستید یا شناسه ایمیل خود را در زیر
246
00:10:33,149 –> 00:10:35,130
می دانید و مرحله نصب را
247
00:10:35,130 –> 00:10:36,779
برای شما ارسال می کنم که فقط می توانید دنبال کنید. آن و
248
00:10:36,779 –> 00:10:38,720
249
00:10:38,720 –> 00:10:41,600
قبل از اینکه واقعاً
250
00:10:41,600 –> 00:10:43,460
قسمت نصب را ادامه دهیم، آن را روی دستگاه خود نصب کنید،
251
00:10:43,460 –> 00:10:45,710
برای نصب pi spark پیش نیازهایی لازم است
252
00:10:45,710 –> 00:10:48,470
که باید بدانید، بنابراین به عنوان
253
00:10:48,470 –> 00:10:50,330
بخشی از پیش نیاز باید
254
00:10:50,330 –> 00:10:51,890
نوت بوک ژاپن را روی دستگاه خود نصب
255
00:10:51,890 –> 00:10:55,310
کرده باشید و باید یک نسخه به روز داشته باشید. نسخه
256
00:10:55,310 –> 00:10:59,660
جاوا بسیار خوب است، بنابراین بیایید فقط
257
00:10:59,660 –> 00:11:03,650
google.com را باز کنیم و فقط
258
00:11:03,650 –> 00:11:06,100
مسیر دانلود Pais را به
259
00:11:06,100 –> 00:11:08,290
خوبی جستجو کنیم. من فرض میکنم که شما
260
00:11:08,290 –> 00:11:09,880
پیش نیازی برای این
261
00:11:09,880 –> 00:11:12,880
جلسه نصب کردهاید، بنابراین بیایید در ادامه مطلب
262
00:11:12,880 –> 00:11:15,459
263
00:11:15,459 –> 00:11:18,490
اسپارک را دانلود کنیم، فقط آن را در گوگل دانلود کنید، اولین لینک Spark را دانلود
264
00:11:18,490 –> 00:11:20,709
کنید. که ما به عنوان آپاچی درخشان دریافت می کنیم
265
00:11:20,709 –> 00:11:23,529
فقط روی آن کلیک کنید و
266
00:11:23,529 –> 00:11:25,329
شما را به وب سایت اسپارک آپاچی هدایت می کند
267
00:11:25,329 –> 00:11:27,670
268
00:11:27,670 –> 00:11:30,340
همانطور که در اینجا می بینید انتشار اسپارک
269
00:11:30,340 –> 00:11:33,400
2.4 در نوامبر است و بسیار
270
00:11:33,400 –> 00:11:36,400
اخیر است و نوع بسته ای که من انتخاب می کنم از
271
00:11:36,400 –> 00:11:38,980
قبل است. ساخته شده برای Apache Hadoop
272
00:11:38,980 –> 00:11:41,830
2.7 و نسخه های بعدی شما گزینه های دیگری را
273
00:11:41,830 –> 00:11:44,730
در اینجا در دسترس دارید،
274
00:11:45,500 –> 00:11:47,630
بنابراین من از پیش ساخته شده برای Apache
275
00:11:47,630 –> 00:11:49,250
Hadoop 2.7 و نسخه های جدیدتر انتخاب می کنم
276
00:11:49,250 –> 00:11:52,340
و در نهایت چه کاری انجام خواهم داد. فقط
277
00:11:52,340 –> 00:11:55,160
روی لینک دانلود در اینجا کلیک می کنم،
278
00:11:55,160 –> 00:11:57,200
من را به صفحه دیگری هدایت می کنم، جایی که
279
00:11:57,200 –> 00:11:59,780
می توانم اینجا را ببینم که یک پیوند آینه ای
280
00:11:59,780 –> 00:12:01,940
برای من است، فقط روی آن کلیک می کنم و
281
00:12:01,940 –> 00:12:04,280
دانلود من شروع می شود، فکر می کنم یک
282
00:12:04,280 –> 00:12:08,510
فایل بسیار بزرگ است، بنابراین چشم، ممکن است،
283
00:12:08,510 –> 00:12:10,190
بله، این یک فایل بسیار بزرگ است، فقط
284
00:12:10,190 –> 00:12:11,690
مطمئن شوید که اتصال اینترنت بسیار خوبی
285
00:12:11,690 –> 00:12:13,790
دارید اگر فعلاً آن را دانلود می کنید، این
286
00:12:13,790 –> 00:12:15,710
را لغو می کنم زیرا قبلاً
287
00:12:15,710 –> 00:12:18,020
این فایل را دانلود کرده ام، بنابراین اجازه دهید آن را لغو کنیم،
288
00:12:18,020 –> 00:12:19,880
اجازه دهید فقط به شما نشان دهم کجا
289
00:12:19,880 –> 00:12:25,270
دانلود کردم من این فایل را دارم
290
00:12:25,270 –> 00:12:31,370
spa 2.4 benhaddou 2.7 خیلی خوب فقط
291
00:12:31,370 –> 00:12:35,770
آن را از حالت فشرده خارج کنید فایل ها را استخراج کنید
292
00:12:36,670 –> 00:12:39,750
حالا شروع می کنیم
293
00:12:39,750 –> 00:12:43,400
فقط مبارزه را شروع می
294
00:12:43,790 –> 00:12:48,559
کنیم. فایل هایی که استخراج کردم.
295
00:12:48,559 –> 00:12:53,470
296
00:12:54,860 –> 00:12:58,460
آن را ذخیره کنید
297
00:12:58,460 –> 00:13:01,640
فقط CMD خود را باز کنید
298
00:13:01,640 –> 00:13:03,700
299
00:13:04,500 –> 00:13:06,720
تا قدم بعدی ما ویرایش
300
00:13:06,720 –> 00:13:08,550
متغیر محیطی ما باشد، بنابراین بیایید
301
00:13:08,550 –> 00:13:10,290
با استفاده از دستور set X یک متغیر محیطی ایجاد
302
00:13:10,290 –> 00:13:12,800
303
00:13:18,509 –> 00:13:22,139
کنیم اولین متغیر من Park underscore
304
00:13:22,139 –> 00:13:24,590
home است
305
00:13:24,590 –> 00:13:27,590
و بعد از آن
306
00:13:27,590 –> 00:13:30,910
مسیر جرقه خود را با
307
00:13:32,240 –> 00:13:41,319
این کار مشخص می کنم. تی این قسمتی است که اجازه دهید آن را
308
00:13:43,420 –> 00:13:47,680
بچسبانیم در مرحله بعد، من به متغیر محیطی دیگری
309
00:13:47,680 –> 00:13:51,300
به عنوان Hadoop در زیر Scavo نیاز دارم،
310
00:13:52,949 –> 00:13:56,399
سپس دوباره مسیر فایل را مشخص کنید
311
00:13:56,399 –> 00:13:57,929
که Tonto
312
00:13:57,929 –> 00:14:01,470
اکنون انجام شده است، زیرا من می خواهم پوسته PI Spock و نوت بوک Jupiter خود را راه اندازی کنم،
313
00:14:01,470 –> 00:14:03,389
بنابراین
314
00:14:03,389 –> 00:14:05,429
باید دو پارامتر دیگر را تعریف کنم.
315
00:14:05,429 –> 00:14:08,399
در اینجا PI spark driver پایتون و PI Spock
316
00:14:08,399 –> 00:14:11,429
درایور Python OPDs بسیار خوب است، این
317
00:14:11,429 –> 00:14:13,319
به من کمک می کند تا پوسته و تراشه PI Spock را
318
00:14:13,319 –> 00:14:17,869
در یک نوت بوک باز کنم، بنابراین من sedex
319
00:14:18,230 –> 00:14:23,170
توسط underscore درایور جرقه را زیر
320
00:14:25,600 –> 00:14:31,779
خط باتوم می نویسم و
321
00:14:33,480 –> 00:14:38,660
ه وارد می کنم و پارامتر بعدی من این است statics
322
00:14:38,660 –> 00:14:41,660
323
00:14:41,690 –> 00:14:47,310
vice Park underscore evil underscore
324
00:14:47,310 –> 00:14:55,520
peyten underscore OPDs نوت بوک ما
325
00:14:57,400 –> 00:15:01,990
را وارد کنید خیلی خوب اجازه دهید
326
00:15:01,990 –> 00:15:05,050
این ترمینال را ببندیم حالا بیایید یک خط فرمان جدید باز کنیم
327
00:15:05,050 –> 00:15:07,660
اکنون اولین وظیفه
328
00:15:07,660 –> 00:15:09,720
من این است که به این پوشه bin تغییر
329
00:15:09,720 –> 00:15:13,060
مسیر دهم، بنابراین این مسیر است، اجازه دهید
330
00:15:13,060 –> 00:15:17,980
آن را کپی کنیم. پرش به فضای سی دی دایرکتوری D من
331
00:15:17,980 –> 00:15:21,930
میخواهم تا زمانی که
332
00:15:21,930 –> 00:15:25,130
مسیر من وجود داشته باشد،
333
00:15:25,130 –> 00:15:28,680
قدم بعدی
334
00:15:28,680 –> 00:15:31,200
من اجرای اسپارک با دستور PI
335
00:15:31,200 –> 00:15:33,620
spark
336
00:15:39,220 –> 00:15:43,089
I’ll خواهد بود. از یک پارامتر اصلی برای تنظیم
337
00:15:43,089 –> 00:15:45,720
گره پوشانده شده استفاده کنید
338
00:15:46,270 –> 00:15:49,930
و از آنجایی که من میخواهم دوره آزمایشی محلی را
339
00:15:49,930 –> 00:15:53,130
بگذرانم، بنابراین،
340
00:15:53,130 –> 00:15:56,500
ارتش محلی Niko را که نیاز دارم را مشخص میکنم و به سمت پایین میروم
341
00:15:56,500 –> 00:15:58,839
تا چه کاری انجام دهد، در اینجا
342
00:15:58,839 –> 00:16:02,200
نوت بوک مشتری در میزبان محلی من باز شود. از آنجایی
343
00:16:02,200 –> 00:16:04,209
که ما با موفقیت pi spark را
344
00:16:04,209 –> 00:16:06,640
بر روی دستگاه خود نصب کرده ایم، اگر با کفشی روبرو هستید، با
345
00:16:06,640 –> 00:16:08,380
346
00:16:08,380 –> 00:16:10,540
پیغام خطایی که دریافت کرده اید، در زیر آمده است و من سعی می کنم
347
00:16:10,540 –> 00:16:14,459
آن را برای شما حل کنم، بسیار خوب، بنابراین فعلا فقط
348
00:16:14,459 –> 00:16:17,890
روی انتخاب جدید پایتون 3 کلیک کنید و آن را انتخاب کنید.
349
00:16:17,890 –> 00:16:20,110
برگه ما را باز می کند
350
00:16:20,110 –> 00:16:22,060
که در آن می توانید PI spark یا Holly خود را بنویسید،
351
00:16:22,060 –> 00:16:26,290
بنابراین این نوت بوک Geppetto
352
00:16:26,290 –> 00:16:28,6