در این مطلب، ویدئو TechBytes: استفاده از R و Python با Vantage | قسمت 1. بررسی اجمالی با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:15:50
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,510 –> 00:00:08,100
[موسیقی]
2
00:00:10,139 –> 00:00:12,330
سلام و به نسخه دیگری از
3
00:00:12,330 –> 00:00:14,879
بایت های فناوری teradata خوش آمدید، نام من تیم
4
00:00:14,879 –> 00:00:16,139
میلر است و من در دفتر فناوری و نوآوری او در امور خیریه کار می کنم،
5
00:00:16,139 –> 00:00:18,689
امروز
6
00:00:18,689 –> 00:00:20,039
می خواهیم در مورد اینکه چگونه
7
00:00:20,039 –> 00:00:21,720
پلت فرم Vantage خود تارا از R در
8
00:00:21,720 –> 00:00:23,310
زبان های پایتون پشتیبانی می کند صحبت کنیم. علم و
9
00:00:23,310 –> 00:00:25,380
تجزیه و تحلیل داده این اولین مورد از مجموعه
10
00:00:25,380 –> 00:00:26,880
پنج قسمتی بایت های فناوری در این
11
00:00:26,880 –> 00:00:28,559
زمینه است و
12
00:00:28,559 –> 00:00:30,239
نمای کلی از تمام قابلیت ها و
13
00:00:30,239 –> 00:00:32,009
پلت فرم برتر داده تارا را برای n
14
00:00:32,009 –> 00:00:34,320
پایتون ما
15
00:00:34,320 –> 00:00:36,960
به شما ارائه می دهد. یک معمار تحلیلی
16
00:00:36,960 –> 00:00:38,430
و سازمان توسعه محصول روز تارا
17
00:00:38,430 –> 00:00:41,370
ابتدا اجازه دهید در مورد
18
00:00:41,370 –> 00:00:42,750
مفروضات مطرح شده در مورد
19
00:00:42,750 –> 00:00:44,790
محتوای این بایت فناوری و همچنین
20
00:00:44,790 –> 00:00:46,260
نکات کلیدی صحبت کنیم، امیدواریم همه شنوندگان
21
00:00:46,260 –> 00:00:48,540
از آنجا خارج شوند و ابتدا باید
22
00:00:48,540 –> 00:00:50,130
درک خوبی از هر یک از R داشته باشید. یا
23
00:00:50,130 –> 00:00:52,650
زبان پایتون در حالت ایدهآل هر دو در مرحله دوم
24
00:00:52,650 –> 00:00:53,730
باید پلتفرم مزیت تاریخ تارا را درک کنید،
25
00:00:53,730 –> 00:00:55,530
لطفاً
26
00:00:55,530 –> 00:00:57,300
قسمت بایت فناوری مرحله بعدی در موسسه خیریه تجزیه و تحلیل
27
00:00:57,300 –> 00:00:59,010
را پیشاپیش ببینید. سن برای همکارم
28
00:00:59,010 –> 00:01:00,870
راب آرمسترانگ اگر هنوز در
29
00:01:00,870 –> 00:01:03,239
معرض Vantage قرار نگرفتهاید، نکات
30
00:01:03,239 –> 00:01:04,259
کلیدی این بایت فناوری شامل
31
00:01:04,259 –> 00:01:06,329
درک انگیزه پشت
32
00:01:06,329 –> 00:01:08,479
دادههای تارا Vantage R و Python
33
00:01:08,479 –> 00:01:10,439
ادغام سه راه برای
34
00:01:10,439 –> 00:01:12,360
استفاده در Python on Vantage و دو
35
00:01:12,360 –> 00:01:14,250
روش Vantage است. عملکرد و
36
00:01:14,250 –> 00:01:16,110
مقیاسپذیری را فراهم میکند تا شما را به مسیری برای
37
00:01:16,110 –> 00:01:18,810
درک تولید برساند که پایتون ما
38
00:01:18,810 –> 00:01:20,430
میتواند به صورت خارجی یا مستقیم روی
39
00:01:20,430 –> 00:01:21,870
پلتفرم Vantage کار کند و
40
00:01:21,870 –> 00:01:23,930
مزایا و معایبی برای هر رویکرد وجود دارد و
41
00:01:23,930 –> 00:01:26,190
در نهایت اینکه کتابخانههای Vantage برای
42
00:01:26,190 –> 00:01:27,869
Iron Python از بهترین منبع باز استفاده میکنند.
43
00:01:27,869 –> 00:01:30,659
44
00:01:30,659 –> 00:01:32,340
سه دلیل مهم برای استفاده از R
45
00:01:32,340 –> 00:01:34,409
در پایتون با Vantage،
46
00:01:34,409 –> 00:01:36,270
مقیاسپذیری عملکرد و عملیاتیسازی است،
47
00:01:36,270 –> 00:01:38,580
اگرچه پذیرش هر دو زبان در
48
00:01:38,580 –> 00:01:40,049
جامعه علم داده خیرهکننده است،
49
00:01:40,049 –> 00:01:42,360
آنها بدون مشکل نیستند.
50
00:01:42,360 –> 00:01:44,520
51
00:01:44,520 –> 00:01:45,720
سربار بودن یک
52
00:01:45,720 –> 00:01:48,030
زبان تفسیری تحلیل پیچیده ای
53
00:01:48,030 –> 00:01:50,189
n مجموعه دادههای بزرگ میتوانند بسیار کند یا
54
00:01:50,189 –> 00:01:52,260
اصلاً اجرا نشوند به همین دلیل است و در بسیاری از
55
00:01:52,260 –> 00:01:54,720
مواقع، فرآیندهای کاری تحلیلی r و پایتون
56
00:01:54,720 –> 00:01:57,110
میتواند بسیار دشوار باشد
57
00:01:57,110 –> 00:01:59,100
تارا تیت با بسیاری از مشتریان
58
00:01:59,100 –> 00:02:00,840
بر روی این نگرانیها کار کرده است. دو نمونه از این قبیل را
59
00:02:00,840 –> 00:02:02,939
در اینجا در خردهفروشی مشاهده میکنید. و دارویی که
60
00:02:02,939 –> 00:02:04,439
واقعاً این اظهارات را نشان می دهد که من
61
00:02:04,439 –> 00:02:06,810
فقط به
62
00:02:06,810 –> 00:02:08,639
این دلایل و همچنین دلایل دیگر گفتم که بسیاری از
63
00:02:08,639 –> 00:02:10,649
تیم های تحلیلی با قرار دادن
64
00:02:10,649 –> 00:02:12,120
این حجم های کاری پیچیده در تولید تلاش می کنند
65
00:02:12,120 –> 00:02:15,130
همانطور که به صراحت توسط جیمز تیلور بیان شده است
66
00:02:15,130 –> 00:02:17,440
زیرا اغلب اوقات
67
00:02:17,440 –> 00:02:18,910
پایتون به بیرون نگاه نمی کند. وقتی
68
00:02:18,910 –> 00:02:20,290
صحبت از هوش فراگیر داده با پلتفرم Vantage به میان می آید
69
00:02:20,290 –> 00:02:22,870
70
00:02:22,870 –> 00:02:24,190
Teradata پایه و اساس
71
00:02:24,190 –> 00:02:26,260
عملکرد و مقیاس پذیری مورد نیاز برای
72
00:02:26,260 –> 00:02:29,560
عملیاتی کردن تجزیه و تحلیل خود را فراهم می کند،
73
00:02:29,560 –> 00:02:30,730
سه راه وجود دارد که
74
00:02:30,730 –> 00:02:32,260
برنامه نویسان پایتون می توانند از
75
00:02:32,260 –> 00:02:34,300
پلت فرم Vantage داده های خود در دو
76
00:02:34,300 –> 00:02:36,190
سناریو اول زبان استفاده کنند. مفسرها و
77
00:02:36,190 –> 00:02:37,600
بستهها بر اساس مزیت کلاینت اجرا میشوند که
78
00:02:37,600 –> 00:02:40,570
ما به آنها اکسپرت کاربر میگوییم ience
79
00:02:40,570 –> 00:02:43,660
1 و تجربه کاربر 2 و سایر
80
00:02:43,660 –> 00:02:45,310
مفسرها و بسته های زبان
81
00:02:45,310 –> 00:02:47,110
مستقیماً روی پلت فرم Vantage اجرا می شوند.
82
00:02:47,110 –> 00:02:49,660
این تجربه کاربری 3
83
00:02:49,660 –> 00:02:53,530
84
00:02:53,530 –> 00:02:56,230
85
00:02:56,230 –> 00:02:57,850
است. امروز با
86
00:02:57,850 –> 00:02:59,980
teradata یا دیگر پلتفرمهای پایگاه داده در
87
00:02:59,980 –> 00:03:01,210
این مورد، ما در حال برقراری
88
00:03:01,210 –> 00:03:03,130
ارتباط از پایتون خود از طریق ODBC
89
00:03:03,130 –> 00:03:05,770
یا JDBC هستیم و جداول یا بخشهایی از
90
00:03:05,770 –> 00:03:07,510
جداول را به چارچوب داده پاندا منتقل میکنیم تا مزیتهای
91
00:03:07,510 –> 00:03:10,300
این تجربه کاربری این
92
00:03:10,300 –> 00:03:12,010
باشد که همه کتابخانهها و
93
00:03:12,010 –> 00:03:13,510
توابع نصب بسته ممکن
94
00:03:13,510 –> 00:03:15,190
یکپارچه است، این
95
00:03:15,190 –> 00:03:16,990
محیطی است که اکثر دانشمندان داده
96
00:03:16,990 –> 00:03:19,480
با آن آشنا هستند و
97
00:03:19,480 –> 00:03:21,070
کدنویسی و اشکال زدایی آن از جنبه منفی ساده تر است،
98
00:03:21,070 –> 00:03:23,620
اگرچه انتقال داده ها نیاز به
99
00:03:23,620 –> 00:03:25,270
قدرت پردازش محدود
100
00:03:25,270 –> 00:03:27,490
به مشتری یا سرور دارد،
101
00:03:27,490 –> 00:03:28,810
و در یک کمبود کلی پردازش موازی وجود ندارد. از نظر
102
00:03:28,810 –> 00:03:31,690
مقیاس پذیری برای مجموعه داده های بزرگ مناسب نیست
103
00:03:31,690 –> 00:03:33,930
و در نهایت به راحتی در کاربر قابل
104
00:03:33,930 –> 00:03:35,870
عملیاتی نمی باشد
105
00:03:35,870 –> 00:03:38,180
همچنین با
106
00:03:38,180 –> 00:03:39,769
وضعیت موجود، مفسرها و بستههای زبان
107
00:03:39,769 –> 00:03:41,569
108
00:03:41,569 –> 00:03:43,599
در سرور Kleiner متصل به طور جداگانه از مزیت خارج میشوند،
109
00:03:43,599 –> 00:03:45,620
همچنین یکی از دو بسته
110
00:03:45,620 –> 00:03:47,030
در همان سرور کلاینر
111
00:03:47,030 –> 00:03:49,670
برای Python که یک بسته خیریه @ml است
112
00:03:49,670 –> 00:03:51,530
و برای ما بسته TD plier نصب شده است.
113
00:03:51,530 –> 00:03:53,810
این بستهها در
114
00:03:53,810 –> 00:03:56,120
تجزیه و تحلیل پایگاه داده از طریق رابطهای پایتون ما به
115
00:03:56,120 –> 00:03:57,470
توابع تحلیلی Vantage ارائه میدهند که به
116
00:03:57,470 –> 00:03:59,239
طور خودکار دنبالهای را ایجاد میکنند که
117
00:03:59,239 –> 00:04:01,489
Vantage را فراخوانی میکند
118
00:04:01,489 –> 00:04:03,489
توابع موتور گراف ما
119
00:04:03,489 –> 00:04:05,629
120
00:04:05,629 –> 00:04:07,519
121
00:04:07,519 –> 00:04:10,250
را فراخوانی میکند.
122
00:04:10,250 –> 00:04:12,110
رویکرد یا اینکه این
123
00:04:12,110 –> 00:04:14,299
کتابخانهها رابطهای پایتون را
124
00:04:14,299 –> 00:04:16,519
برای تجزیه و تحلیل مزیت مقیاسپذیر موازی به شما میدهند
125
00:04:16,519 –> 00:04:18,680
، دنباله بهطور خودکار
126
00:04:18,680 –> 00:04:20,389
برای شما ایجاد میشود، زیرا در حال حاضر در
127
00:04:20,389 –> 00:04:22,610
محیط تولید شما قرار دارد،
128
00:04:22,610 –> 00:04:25,190
از جنبه منفی، عملیاتیسازی مسیر آسانتری
129
00:04:25,190 –> 00:04:26,330
دارد،
130
00:04:26,330 –> 00:04:28,160
وقتی آن را با آن مقایسه میکنید، تعداد محدودی تجزیه و تحلیل وجود دارد. باز کردن
131
00:04:28,160 –> 00:04:30,289
s بستههای ource و اشکالزدایی ممکن است
132
00:04:30,289 –> 00:04:34,220
در تجربه کاربر سوم و نهایی کمی پیچیدهتر
133
00:04:34,220 –> 00:04:35,960
باشد،
134
00:04:35,960 –> 00:04:37,669
مفسرهای زبان و
135
00:04:37,669 –> 00:04:39,830
بستههای الحاقی R یا Python مربوطه بر روی
136
00:04:39,830 –> 00:04:42,410
هر گره موتور دنبالهای جدید نصب میشوند و
137
00:04:42,410 –> 00:04:44,450
تجزیه و تحلیل پایگاه داده از طریق اسکریپتهای پایتون ما
138
00:04:44,450 –> 00:04:45,950
که از طریق دنباله و دنباله فراخوانی میشوند، ارائه میشوند.
139
00:04:45,950 –> 00:04:47,750
اجرای بر روی هر واحد موازی سازی
140
00:04:47,750 –> 00:04:49,880
در این مورد،
141
00:04:49,880 –> 00:04:51,860
موازی سازی آزمون تحلیلی به محل داده ها بستگی دارد
142
00:04:51,860 –> 00:04:53,870
که شما موازی سازی خارج از جعبه را برای
143
00:04:53,870 –> 00:04:55,550
عملیات های مبتنی بر جاده مانند
144
00:04:55,550 –> 00:04:57,979
امتیازدهی مدل یا عملیات مبتنی بر پارتیشن
145
00:04:57,979 –> 00:05:00,169
مانند ساخت همزمان بسیاری از
146
00:05:00,169 –> 00:05:03,050
مدل ها بر اساس یک پارتیشن داده برای
147
00:05:03,050 –> 00:05:05,090
با این حال،
148
00:05:05,090 –> 00:05:07,010
برنامهنویس باید اسکریپتهای خود را به سبک MapReduce کدنویسی کند،
149
00:05:07,010 –> 00:05:08,840
زیرا همانطور که میبینید
150
00:05:08,840 –> 00:05:10,550
، مجموعههای نتایج متعددی
151
00:05:10,550 –> 00:05:12,349
از پلتفرم Vantage
152
00:05:12,349 –> 00:05:15,050
از هر واحد موازی در
153
00:05:15,050 –> 00:05:16,970
طرف حرفهای در حال پخش هستند، شما پردازش موازی برای
154
00:05:16,970 –> 00:05:18,800
امتیازدهی و عملیات اسکالر دریافت میکنید.
155
00:05:18,800 –> 00:05:21,139
همچنین توانایی ساخت همزمان بسیاری از
156
00:05:21,139 –> 00:05:23,360
مدل ها، تمامی کتابخانه ها و توابع این
157
00:05:23,360 –> 00:05:25,250
امکان وجود دارد زیرا بستهها بخشی
158
00:05:25,250 –> 00:05:27,050
مستقیماً روی گرههای موتور بعدی نصب میشوند
159
00:05:27,050 –> 00:05:28,550
و به شما امکان
160
00:05:28,550 –> 00:05:30,919
عملیاتیسازی وصله اضافی در زبانهای جانبی منفی را
161
00:05:30,919 –> 00:05:32,720
میدهد و کتابخانههایی باید
162
00:05:32,720 –> 00:05:34,250
روی هر گره نصب شوند.
163
00:05:34,250 –> 00:05:35,930
164
00:05:35,930 –> 00:05:38,060
165
00:05:38,060 –> 00:05:41,379
166
00:05:41,379 –> 00:05:44,060
برای خلاصه کردن، باید به زبان S کد کنید تا در اینجا سه تجربه کاربری را خلاصه کنیم، اج
167
00:05:44,060 –> 00:05:47,360
زه دهید کمی عم
168
00:05:47,360 –> 00:05:49,099
قتر به تجربه کاربری شماره دو و ش
169
00:05:49,099 –> 00:05:50,229
اره سه که
170
00:05:50,229 –> 00:05:52,669
ا تجربه کاربری شماره دو شروع میشود، زم
171
00:05:52,669 –> 00:05:55,189
نی که arne python در سیستمهای مشتری Teradata Vantage اجرا میشود، ان
172
00:05:55,189 –> 00:05:58,939
ردست TD به صو
173
00:05:58,939 –> 00:06:01,069
ت رایگان در دسترس است. کتابخانه ای برای
174
00:06:01,069 –> 00:06:02,870
Vantage که دنباله ای
175
00:06:02,870 –> 00:06:04,909
برای اتصال به و انتقال پردازش به
176
00:06:04,909 –> 00:06:06,979
پلتفرم ter data Vantage فراهم می کند که می توانید
177
00:06:06,979 –> 00:06:09,050
از IDE مورد علاقه خود برای دسترسی به
178
00:06:09,050 –> 00:06:10,669
Vantage استفاده کنید که استودیوی ما
179
00:06:10,669 –> 00:06:13,219
علامت گذاری خط فرمان یا حتی Jupiter
180
00:06:13,219 –> 00:06:15,469
کدهای کاربر نهایی در آن است. ما با استفاده از
181
00:06:15,469 –> 00:06:18,020
رابطهای دروغگوی عمیق، همراه
182
00:06:18,020 –> 00:06:19,940
با درایور دنباله teradata برای o ما کار میکند
183
00:06:19,940 –> 00:06:23,389
r care data ODBC حاوی رابطهایی
184
00:06:23,389 –> 00:06:24,919
برای مدیریت اتصال و مخاطبین
185
00:06:24,919 –> 00:06:26,780
و همچنین مدیریت داده است و
186
00:06:26,780 –> 00:06:28,909
صدها مورد از یادگیری ماشینی Vantage و
187
00:06:28,909 –> 00:06:31,099
هزاران کارکرد موتور دنبالهدار جدید را به نمایش میگذارد،
188
00:06:31,099 –> 00:06:34,490
زیرا انبر TD رابط ما با استفاده از انبر D از
189
00:06:34,490 –> 00:06:37,159
چارچوب داده و قراردادهای D انبردست پیروی میکند.
190
00:06:37,159 –> 00:06:38,870
تابع Tibble برای
191
00:06:38,870 –> 00:06:40,789
ایجاد یک قاب داده هنری مجازی
192
00:06:40,789 –> 00:06:42,409
که به یک جدول یا نمایی در
193
00:06:42,409 –> 00:06:45,020
موتور دنبالهدار جدید اشاره میکند، افعال دروغگوی عمیق را
194
00:06:45,020 –> 00:06:47,479
برای قاب دادههای مورد استفاده ادغام میکند، از جمله
195
00:06:47,479 –> 00:06:49,969
روشهای پایه مانند انتخاب تغییر نام فیلتر
196
00:06:49,969 –> 00:06:52,729
جهش تبدیل تبدیل مرتب کردن گروه توسط و
197
00:06:52,729 –> 00:06:55,190
خلاصه عبارات ما
198
00:06:55,190 –> 00:06:56,810
که نگاشت به SQL به
199
00:06:56,810 –> 00:06:58,969
دسته های زیر تقسیم می شود عملگرها و
200
00:06:58,969 –> 00:07:00,979
توابع ریاضی مقایسه منطقی عملگرها
201
00:07:00,979 –> 00:07:03,379
توابع تبدیل توابع کاراکتر توابع
202
00:07:03,379 –> 00:07:05,300
جمع توابع توابع پنجره شده
203
00:07:05,300 –> 00:07:08,810
توابع بیت نتایج ذخیره می شوند
204
00:07:08,810 –> 00:07:10,430
مزایای جداول موقتی که
205
00:07:10,430 –> 00:07:12,110
با پاک شدن
206
00:07:12,110 –> 00:07:15,650
مخاطبین جلسه پاک می شوند.
207
00:07:15,650 –> 00:07:17,360
کتابخانه الحاقی پایتون برای
208
00:07:17,360 –> 00:07:18,979
Vantage که همچنین به عنوان دنبالهای عمل میکند
209
00:07:18,979 –> 00:07:20,330
تا به دادهها متصل شود و پردازش را تحت فشار قرار دهد.
210
00:07:20,330 –> 00:07:22,550
211
00:07:22,550 –> 00:07:24,919
212
00:07:24,919 –> 00:07:27,199
213
00:07:27,199 –> 00:07:29,120
214
00:07:29,120 –> 00:07:32,300
215
00:07:32,300 –> 00:07:34,699
216
00:07:34,699 –> 00:07:36,919
Teradata ml دادههای خود را
217
00:07:36,919 –> 00:07:39,440
218
00:07:39,440 –> 00:07:41,060
219
00:07:41,060 –> 00:07:42,770
220
00:07:42,770 –> 00:07:45,110
221
00:07:45,110 –> 00:07:47,270
222
00:07:47,270 –> 00:07:49,460
223
00:07:49,460 –> 00:07:52,250
واسط میکند. پاندای
224
00:07:52,250 –> 00:07:54,380
دیتا فریم و قراردادهای کیمیاگری دنباله دار
225
00:07:54,380 –> 00:07:56,450
با ارائه یک فریم داده
226
00:07:56,450 –> 00:07:58,300
Teradata که تقلید از فریم داده پاندا است
227
00:07:58,300 –> 00:08:00,740
، از مجموع ها و اپراتورهای روش های کیمیاگ