در این مطلب، ویدئو Python for Finance: The Quantitative Developer Certificate – سعید آمین با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:47:41
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:03,360 –> 00:00:05,839
و به عنوان بخشی از دوره
2
00:00:05,839 –> 00:00:07,680
qdc ما تعدادی زبان مختلف را آموزش می دهیم،
3
00:00:07,680 –> 00:00:10,000
بنابراین kdb نیز برای
4
00:00:10,000 –> 00:00:13,120
تجارت با فرکانس بالا و داده های بازار
5
00:00:13,120 –> 00:00:15,200
وجود دارد، همچنین c plus نیز وجود دارد،
6
00:00:15,200 –> 00:00:17,440
اما یکی از دوره های دیگر در
7
00:00:17,440 –> 00:00:20,160
qdc که من تدریس می کنم، در پایتون است.
8
00:00:20,160 –> 00:00:21,760
من اساساً در مورد اینکه چرا
9
00:00:21,760 –> 00:00:23,760
پایتون برای امور مالی خوب است با
10
00:00:23,760 –> 00:00:25,439
شما صحبت خواهم کرد و همچنین چند مثال برای کدنویسی به شما ارائه خواهم کرد،
11
00:00:25,439 –> 00:00:26,480
12
00:00:26,480 –> 00:00:27,680
بنابراین از این
13
00:00:27,680 –> 00:00:31,840
نوت بوک jupyter اساسا برای ارائه
14
00:00:34,000 –> 00:00:36,320
15
00:00:37,040 –> 00:00:41,040
خوب استفاده خواهم کرد.
16
00:00:42,800 –> 00:00:47,200
همینطور بسیار خوب پس پایتون پایتون برای امور مالی
17
00:00:47,200 –> 00:00:48,879
فقط قبل از شروع یک جرعه چای
18
00:00:48,879 –> 00:00:51,520
19
00:00:54,079 –> 00:00:56,640
بنوشید تا همیشه مدت طولانی صحبت کنم
20
00:00:56,640 –> 00:00:58,079
آنها در واقع چیزی نمی نوشند
21
00:00:58,079 –> 00:01:00,719
بنابراین من به طور دوره ای فقط
22
00:01:00,719 –> 00:01:02,879
برای یک توقف کوتاه قطع می کنم در طول
23
00:01:02,879 –> 00:01:04,720
دوره،
24
00:01:04,720 –> 00:01:07,360
پس فقط کمی درباره من، بنابراین من
25
00:01:07,360 –> 00:01:09,680
15 سال را در FX گذراندم، در برادران lehman شروع کردم
26
00:01:09,680 –> 00:01:12,320
که متأسفانه دیگر وجود نداشت و
27
00:01:12,320 –> 00:01:13,840
بعدها دیگر به عنوان مدیر اجرایی
28
00:01:13,840 –> 00:01:15,280
نبودم و در حال توسعه
29
00:01:15,280 –> 00:01:17,280
تجارت سیستماتیک بودم. استراتژیها اساساً
30
00:01:17,280 –> 00:01:19,439
تمام حرفهی من است y در fx
31
00:01:19,439 –> 00:01:21,280
um من تعدادی کتابخانه متن باز مختلف دارم
32
00:01:21,280 –> 00:01:22,400
که
33
00:01:22,400 –> 00:01:25,040
در github برای امور مالی بسیار محبوب هستند، بنابراین
34
00:01:25,040 –> 00:01:26,880
مارکت پی برای استراتژی های معاملاتی تست برگشتی بوده است
35
00:01:26,880 –> 00:01:28,560
و در این دوره ما
36
00:01:28,560 –> 00:01:31,040
در واقع از این داده fin کاملاً گسترده
37
00:01:31,040 –> 00:01:33,439
برای دانلود داده استفاده می کنیم و همچنین
38
00:01:33,439 –> 00:01:36,400
نمودار pi برای انجام تجسمسازیها،
39
00:01:36,400 –> 00:01:38,240
من همچنین کمی
40
00:01:38,240 –> 00:01:39,119
در
41
00:01:39,119 –> 00:01:41,439
مورد تجزیه و تحلیل هزینه تراکنشها کار کردهام و
42
00:01:41,439 –> 00:01:44,880
همچنین یکی از بنیانگذاران tvs um
43
00:01:44,880 –> 00:01:47,040
یکی از حامیان دوره آموزشی هستم و
44
00:01:47,040 –> 00:01:48,560
در حال حاضر من بسیاری از
45
00:01:48,560 –> 00:01:50,240
کارهای مشاورهام را از طریق ماکرو نشانه انجام میدهم
46
00:01:50,240 –> 00:01:51,680
47
00:01:51,680 –> 00:01:54,079
و تعدادی از کتابهایی که در
48
00:01:54,079 –> 00:01:57,200
آنها مشارکت کردهام نیز در زیر وجود دارد،
49
00:01:57,200 –> 00:01:59,680
بنابراین طرح کلی جلسه امروز چیست
50
00:01:59,680 –> 00:02:02,240
، حدس میزنم که نکته کلیدی این است که چرا
51
00:02:02,240 –> 00:02:03,920
چرا میخواهیم از پایتون استفاده کنیم تجزیه
52
00:02:03,920 –> 00:02:06,240
و تحلیل بازارها این نکته کلیدی است و ما
53
00:02:06,240 –> 00:02:08,318
همچنین برخی از کتابخانه های مفید پایتون
54
00:02:08,318 –> 00:02:10,080
برای تجزیه و تحلیل مالی را مورد بحث قرار
55
00:02:10,080 –> 00:02:12,640
خواهیم داد و اگر کمی زمان به پایان برسد،
56
00:02:12,640 –> 00:02:14,319
ممکن است بتوانیم همزمان چند دمو را
57
00:02:14,319 –> 00:02:18,000
نیز در پایتون انجام دهیم.
58
00:02:18,000 –> 00:02:19,760
پس چرا ما چرا می خواهیم اگر از
59
00:02:19,760 –> 00:02:21,840
پایتون برای تجزیه و تحلیل بازارها استفاده کنید،
60
00:02:21,840 –> 00:02:23,520
اساساً اهداف تضاد دارند،
61
00:02:23,520 –> 00:02:25,360
زیرا ما میخواهیم موارد را خیلی
62
00:02:25,360 –> 00:02:27,120
سریع محاسبه کنیم، میخواهیم به سرعت روی پردازندههای مرکزی خود اجرا
63
00:02:27,120 –> 00:02:29,280
کنیم، اما در عین حال میخواهیم
64
00:02:29,280 –> 00:02:31,200
65
00:02:31,200 –> 00:02:32,720
زمانی که ما کد مینویسیم، یک زمان توسعه سریع نیز وجود داشته باشد.
66
00:02:32,720 –> 00:02:35,440
خیلی سریع نباید فقط
67
00:02:35,440 –> 00:02:38,160
به سرعتی که ما اجرا می کنیم اشاره داشته باشد همچنین
68
00:02:38,160 –> 00:02:39,840
به سرعت ما نیز می تواند کد را بنویسد،
69
00:02:39,840 –> 00:02:40,640
70
00:02:40,640 –> 00:02:41,680
بنابراین
71
00:02:41,680 –> 00:02:43,599
در مقایسه با پایتون چیزی مانند c
72
00:02:43,599 –> 00:02:45,120
plus plus واضح است که بسیار
73
00:02:45,120 –> 00:02:47,599
سریع خواهد بود، که هیچ
74
00:02:47,599 –> 00:02:49,519
شکی در این نیست. درصد c به علاوه
75
00:02:49,519 –> 00:02:50,879
پلاس معمولاً بسیار سریعتر از پایتون است،
76
00:02:50,879 –> 00:02:52,400
77
00:02:52,400 –> 00:02:54,319
اما در مقایسه با زبان های دیگری مانند r و کتابخانه های آماری زیادی وجود دارد، ممکن است کمی زمان بیشتری برای
78
00:02:54,319 –> 00:02:57,280
نوشتن یک سیستم بزرگ در c به علاوه پلاس
79
00:02:57,280 –> 00:02:59,920
80
00:02:59,920 –> 00:03:02,640
از شما
81
00:03:02,640 –> 00:03:04,640
ببرد.
82
00:03:04,640 –> 00:03:06,800
احتمالاً تا حدودی از مشکل سرعت نیز رنج می برد
83
00:03:06,800 –> 00:03:08,480
و
84
00:03:08,480 –> 00:03:10,959
همچنین واقعاً برای سیستم های بزرگ مناسب نیست
85
00:03:10,959 –> 00:03:11,760
um
86
00:03:11,760 –> 00:03:14,000
julia که یک زبان جدیدتر است و
87
00:03:14,000 –> 00:03:15,760
احتمالاً سریعتر است یا هنوز هم وجود دارد
88
00:03:15,760 –> 00:03:17,680
کمی در مورد آن بحث شده است،
89
00:03:17,680 –> 00:03:18,879
اما هنوز به
90
00:03:18,879 –> 00:03:20,720
اندازه پایتون کتابخانههای پشتیبانی ندارد
91
00:03:20,720 –> 00:03:22,560
و اگر از جولیا استفاده میکنید،
92
00:03:22,560 –> 00:03:24,319
احتمالاً در نهایت به
93
00:03:24,319 –> 00:03:26,640
کتابخانههای پایتون زیر آن تکیه خواهید
94
00:03:26,640 –> 00:03:30,560
کرد، اما kdb um نیز وجود دارد می تواند
95
00:03:30,560 –> 00:03:33,280
برای تست استراتژی های معاملاتی مورد استفاده قرار گیرد، اما
96
00:03:33,280 –> 00:03:34,959
استفاده از آن برای برخی از
97
00:03:34,959 –> 00:03:36,879
وظایف دیگر نیز دشوار است، بنابراین بسیار تخصصی است،
98
00:03:36,879 –> 00:03:38,319
اساساً یادگیری آن چیز خوبی است،
99
00:03:38,319 –> 00:03:41,360
اما بر روی
100
00:03:41,360 –> 00:03:44,080
داده های تیک فرکانس بالا متمرکز شده است و تجزیه و تحلیل
101
00:03:44,080 –> 00:03:47,040
آن um وجود دارد. همچنین روشی برای استفاده از q
102
00:03:47,040 –> 00:03:49,040
با پایتون، به طوری که در واقع مانند یک
103
00:03:49,040 –> 00:03:50,959
ترکیب خوب است، مخصوصاً
104
00:03:50,959 –> 00:03:53,920
وقتی صحبت از تجسم ها می شود،
105
00:03:53,920 –> 00:03:55,680
بنابراین اساساً می توانید پایتون را
106
00:03:55,680 –> 00:03:58,319
به عنوان یک سازش در
107
00:03:58,319 –> 00:04:00,959
نظر بگیرید.
108
00:04:00,959 –> 00:04:02,720
در عین
109
00:04:02,720 –> 00:04:04,159
حال مسلماً به سرعت
110
00:04:04,159 –> 00:04:06,560
چیزی مانند جاوا یا c نیست
111
00:04:06,560 –> 00:04:08,480
و میتوانید از آن برای مهندسی
112
00:04:08,480 –> 00:04:10,720
سیستمهای بزرگ استفاده کنید و همچنین از برنامهنویسی شی گرا پشتیبانی میکند.
113
00:04:10,720 –> 00:04:13,680
114
00:04:13,680 –> 00:04:15,360
کتابخانههای زیادی در دسترس است. e برای بازی با دیتا
115
00:04:15,360 –> 00:04:16,798
پایتون، بعداً در مورد برخی از آنها صحبت خواهیم کرد
116
00:04:16,798 –> 00:04:18,399
117
00:04:18,399 –> 00:04:20,320
و همچنین می تواند به ما کمک کند تا
118
00:04:20,320 –> 00:04:21,759
کدهای نوشته شده به زبان های مختلف را به هم پیوند دهیم و بچسبانیم
119
00:04:21,759 –> 00:04:24,240
تا بتوانیم کدهای نوشته شده با
120
00:04:24,240 –> 00:04:26,560
c به علاوه به علاوه می توانیم با q نیز کار کنیم.
121
00:04:26,560 –> 00:04:28,960
پایتون، بنابراین
122
00:04:28,960 –> 00:04:30,880
اساساً پل خوبی بین
123
00:04:30,880 –> 00:04:33,280
زبانهای دیگر است و من میتوانم استدلال کنم که
124
00:04:33,280 –> 00:04:34,479
محاسبات همیشه ارزانتر میشود،
125
00:04:34,479 –> 00:04:36,639
مخصوصاً با ابر um و
126
00:04:36,639 –> 00:04:38,160
انواع نکات و ترفندهایی وجود دارد
127
00:04:38,160 –> 00:04:39,919
که میتوانید از پایتون برای سرعت
128
00:04:39,919 –> 00:04:42,080
بخشیدن به آن استفاده کنید. خوب کدام مربوط است،
129
00:04:42,080 –> 00:04:45,360
فکر می کنم اگر می خواهید آن را سریعتر
130
00:04:45,520 –> 00:04:46,240
131
00:04:46,240 –> 00:04:47,840
کنید، گام بعدی این است که در مورد برخی از
132
00:04:47,840 –> 00:04:49,759
کتابخانه های مفیدی که برای
133
00:04:49,759 –> 00:04:52,160
علم داده و پایتون داریم صحبت کنید، بنابراین بدیهی است که
134
00:04:52,160 –> 00:04:53,600
شما زبان اصلی پایتون را دارید و
135
00:04:53,600 –> 00:04:55,759
پایتون استاندارد را دارید. کتابخانههایی
136
00:04:55,759 –> 00:04:57,680
که با هر نوع پایتون ارائه میشوند،
137
00:04:57,680 –> 00:04:59,199
اما تعداد زیادی از
138
00:04:59,199 –> 00:05:00,880
کتابخانههای شخص ثالث وجود دارد که مردم خیلی چیزها
139
00:05:00,880 –> 00:05:03,919
را نوشتهاند، واضح است که برخی از ذهن من،
140
00:05:03,919 –> 00:05:05,600
اما برخی از محبوبترین چیزها مانند
141
00:05:05,600 –> 00:05:07,840
پانداها و غیره n و ما به زودی
142
00:05:07,840 –> 00:05:09,600
کمی بیشتر در مورد آنها صحبت خواهیم
143
00:05:09,600 –> 00:05:11,520
کرد،
144
00:05:11,520 –> 00:05:13,600
بنابراین کتابخانه های اصلی برای علم داده چیست،
145
00:05:13,600 –> 00:05:15,520
اساساً
146
00:05:15,520 –> 00:05:18,080
کتابخانه های اصلی از پشته علمی تشکیل شده اند،
147
00:05:18,080 –> 00:05:21,120
اول از همه شما محیط ipython دارید
148
00:05:21,120 –> 00:05:23,759
، کنسول تعاملی برای
149
00:05:23,759 –> 00:05:26,080
پایتون که اساساً اکنون بخشی از مشتری است.
150
00:05:26,080 –> 00:05:27,600
این در واقع یک دفترچه یادداشت مشتری است
151
00:05:27,600 –> 00:05:30,400
که من در حال حاضر
152
00:05:30,400 –> 00:05:32,000
از آن استفاده میکنم، البته در این نوع قالبهای اسلاید،
153
00:05:32,000 –> 00:05:33,120
154
00:05:33,120 –> 00:05:34,639
پس احتمالاً کتابخانه کلیدی را داریم
155
00:05:34,639 –> 00:05:37,039
که میتوانم بگویم برای علم دادهای که
156
00:05:37,039 –> 00:05:39,199
بیحس میشود، بنابراین این قابلیت پشتیبانی برای انجام
157
00:05:39,199 –> 00:05:41,680
عملیات روی آن را اضافه میکند. چیزهایی مانند بردارها و
158
00:05:41,680 –> 00:05:44,160
ماتریس ها و اساساً
159
00:05:44,160 –> 00:05:45,759
آرایه های n بعدی و این بسیار سریعتر از
160
00:05:45,759 –> 00:05:48,800
استفاده از حلقه های for برای انجام
161
00:05:48,800 –> 00:05:51,120
عملیات حسابی در پانداهای پایتون است که
162
00:05:51,120 –> 00:05:52,479
احتمالاً کتابخانه ای است که من در نهایت بیشترین استفاده را می کنم،
163
00:05:52,479 –> 00:05:54,880
بنابراین این کتابخانه ای برای
164
00:05:54,880 –> 00:05:56,400
تجزیه و تحلیل سری های زمانی و این در واقع
165
00:05:56,400 –> 00:05:57,600
از کار
166
00:05:57,600 –> 00:06:00,000
در akr که توسط Wesley Mckinney
167
00:06:00,000 –> 00:06:01,600
که در جامعه پایتون کاملاً شناخته شده است انجام شد،
168
00:06:01,600 –> 00:06:03,199
169
00:06:03,199 –> 00:06:05,120
بسیاری از عملیات های رایج
170
00:06:05,120 –> 00:06:07,520
مانند انجام یک ردیف کردن
171
00:06:07,520 –> 00:06:09,360
پیوستن سری های زمانی و انواع کلی
172
00:06:09,360 –> 00:06:11,120
محاسبات، بنابراین به یاد دارم زمانی که در lehman بودم،
173
00:06:11,120 –> 00:06:14,160
بنابراین این حدود 2006 2007 بود.
174
00:06:14,160 –> 00:06:15,520
به یاد دارم که هشت سال را صرف نوشتن
175
00:06:15,520 –> 00:06:17,520
کتابخانه سری های زمانی خودم در جاوا کردم و
176
00:06:17,520 –> 00:06:19,120
زمان زیادی طول کشید،
177
00:06:19,120 –> 00:06:21,199
اما اکنون اساساً هرگز رویای آن را نمی بینم.
178
00:06:21,199 –> 00:06:22,720
نوشتن زمان خودم csi چون شما
179
00:06:22,720 –> 00:06:24,000
در حال حاضر پوند دارید که واقعاً
180
00:06:24,000 –> 00:06:26,000
جامع است و تقریباً
181
00:06:26,000 –> 00:06:28,000
تمام کارهایی را که می خواهید انجام می دهد، همچنین به
182
00:06:28,000 –> 00:06:30,240
طرز گیج کننده ای که
183
00:06:30,240 –> 00:06:31,360
همان نام پشته است
184
00:06:31,360 –> 00:06:33,520
و عملیاتی برای
185
00:06:33,520 –> 00:06:36,400
تجزیه و تحلیل عددی و بهینه سازی دارد و من
186
00:06:36,400 –> 00:06:39,280
از آن استفاده کردم به عنوان مثال برای جا دادن um مانند
187
00:06:39,280 –> 00:06:41,840
پی دی اف و مواردی از این قبیل و همچنین
188
00:06:41,840 –> 00:06:43,600
ساده که تنها موردی
189
00:06:43,600 –> 00:06:45,120
است که در اینجا استفاده نکرده ام برای انجام
190
00:06:45,120 –> 00:06:47,600
عملیات ریاضی نمادین است، بنابراین اگر
191
00:06:47,600 –> 00:06:49,520
می خواهید مانند ادغام نمادین
192
00:06:49,520 –> 00:06:52,000
و مواردی مانند آن را انجام دهید. همه این
193
00:06:52,000 –> 00:06:54,240
کتابخانه ها اساساً ستون فقرات
194
00:06:54,240 –> 00:06:57,199
علم داده در پایتون هستند، بنابراین
195
00:06:57,199 –> 00:06:59,120
اگر علم داده و پایتون را انجام دهید،
196
00:06:59,120 –> 00:07:00,720
قطعاً از یکی از این
197
00:07:00,720 –> 00:07:05,440
کتابخانه ها استفاده کرده اید. شغل شماست،
198
00:07:05,840 –> 00:07:07,520
بنابراین یکی از چیزهای کلیدی که من همیشه در
199
00:07:07,520 –> 00:07:09,440
مورد علم داده می گویم، فقط در مورد
200
00:07:09,440 –> 00:07:11,039
تجزیه و تحلیل و به دست آوردن نتایج
201
00:07:11,039 –> 00:07:13,599
نیست، بلکه ارائه نتایج نیز هست
202
00:07:13,599 –> 00:07:15,840
و بنابراین بخشی از مسئله این است که شما
203
00:07:15,840 –> 00:07:18,479
به یک جلسه مشتری بروید یا به جلسه خود بروید. رئیس
204
00:07:18,479 –> 00:07:19,919
آنها احتمالاً نمی خواهند
205
00:07:19,919 –> 00:07:22,560
صدها صفحه از
206
00:07:22,560 –> 00:07:24,400
جدول ام را ببینند، اساساً من دوست ندارم ببینم
207
00:07:24,400 –> 00:07:26,319
که یا آنچه همه ما دوست داریم ببینیم،
208
00:07:26,319 –> 00:07:28,639
تجسم های خوبی است که اساساً سعی می کنیم
209
00:07:28,639 –> 00:07:31,680
و آنچه را که انجام داده ایم به نوعی نشان دهیم و ارائه کنیم.
210
00:07:31,680 –> 00:07:34,000
منسجم و به روشی آسان برای
211
00:07:34,000 –> 00:07:36,400
درک، بنابراین تجسم
212
00:07:36,400 –> 00:07:38,160
کاری است که میتوانید با پایتون بسیار مؤثر انجام دهید
213
00:07:38,160 –> 00:07:40,560
214
00:07:40,560 –> 00:07:42,240
و از نظر کتابخانههای تجسم نیز انتخابهای زیادی وجود دارد
215
00:07:42,240 –> 00:07:44,800
216
00:07:44,800 –> 00:07:46,720
و این در واقع فقط یک لیست کوچک است، من
217
00:07:46,720 –> 00:07:47,680
فکر میکنم احتمالاً
218
00:07:47,680 –> 00:07:50,080
در واقع چیزهای بیشتری وجود دارد. از آنچه که من لیست کرده ام،
219
00:07:50,080 –> 00:07:52,479
بنابراین یک به یک که
220
00:07:52,479 –> 00:07:54,000
قبلاً کاملاً محبوب بود، فکر می کنم احتمالاً محبوب تر از
221
00:07:54,000 –> 00:07:56,560
بوکه بود و این یک کتابخانه مبتنی بر جاوا اسکریپت است.
222
00:07:56,560 –> 00:07:58,639
بنابراین اساساً می توانید
223
00:07:58,639 –> 00:08:00,800
نمودارهای تعاملی ایجاد کنید که ذخیره می شوند. d
224
00:08:00,800 –> 00:08:03,039
در فایلهای html احتمالاً معروفترین
225
00:08:03,039 –> 00:08:04,400
226
00:08:04,400 –> 00:08:07,520
کتابخانههای تجسمی matplotlib
227
00:08:07,520 –> 00:08:09,199
است. اگر میخواهید کاری کاملاً تخصصی انجام دهید، میتوانم
228
00:08:09,199 –> 00:08:10,879
بگویم برخی از نحو ممکن
229
00:08:10,879 –> 00:08:12,400
است بسیار پیچیده باشد،
230
00:08:12,400 –> 00:08:15,039
اما در
231
00:08:15,039 –> 00:08:16,560
واقع کاملاً تخصصی است. یک کتابخانه منعطف و
232
00:08:16,560 –> 00:08:19,360
من میتوانم بگویم که اکثر مردم از آن استفاده میکنند،
233
00:08:19,360 –> 00:08:20,400
234
00:08:20,400 –> 00:08:22,240
کتابخانه تجسمی انتخابی من احتمالاً
235
00:08:22,240 –> 00:08:25,120
در حال حاضر به درستی است و
236
00:08:25,120 –> 00:08:26,960
امکان اشتراکگذاری نمودارها را نیز در وب
237
00:08:26,960 –> 00:08:28,639
یا در یک محیط خصوصی فراهم میکند، اما
238
00:08:28,639 –> 00:08:30,479
نکته کلیدی این روزها است. در چند
239
00:08:30,479 –> 00:08:32,320
سال گذشته آنها تغییر کرده اند، بنابراین شما همچنین می توانید
240
00:08:32,320 –> 00:08:34,159
بدون نیاز به اشتراک گذاری نمودارهای خود از آن به صورت آفلاین استفاده
241
00:08:34,159 –> 00:08:35,919
کنید. ام
242
00:08:35,919 –> 00:08:38,000
، همچنین برای بسیاری از زبان
243
00:08:38,000 –> 00:08:39,760
ها مانند r و matlab در دسترس است، فکر می کنم آنها
244
00:08:39,760 –> 00:08:42,320
همچنین دارای یک بسته بندی جاوا هستند،
245
00:08:42,320 –> 00:08:44,000
بنابراین واقعاً شبیه به آن است. یک
246
00:08:44,000 –> 00:08:47,440
کتابخانه متقابل پلتفرم خوب
247
00:08:47,440 –> 00:08:50,160
این پی که یک
248
00:08:50,160 –> 00:08:52,080
کتابخانه بسیار تخصصی است و واقعاً به
249
00:08:52,080 –> 00:08:53,440
اندازه بسیاری از مواردی که در مورد آنها صحبت کردم کاملاً بالغ
250
00:08:53,440 –> 00:08:56,800
نیست، بنابراین این
251
00:08:56,800 –> 00:08:59,680
پلتفرم gpu را تسریع کرده است.
252
00:08:59,680 –> 00:09:02,240
ترسیم نمودار تسریع شده در آن نیز وجود دارد، اما این pi
253
00:09:02,240 –> 00:09:03,600
به طور خاص برای آن طراحی شده است، بنابراین اگر
254
00:09:03,600 –> 00:09:05,279
می خواهید چنین طرحی داشته باشید، احتمالا میلیون ها و
255
00:09:05,279 –> 00:09:07,279
میلیون ها نقطه
256
00:09:07,279 –> 00:09:09,920
matplotlib روی شما خراب می شود، اما
257
00:09:09,920 –> 00:09:12,160
پس از آن این چیزی است که می توانید استفاده کنید،
258
00:09:12,160 –> 00:09:14,320
اما من آن را پیدا کردم.
259
00:09:14,320 –> 00:09:16,399
استفاده در عمل بسیار دشوارتر است
260
00:09:16,399 –> 00:09:17,760
و اگر واقعا نمی توانید تصمیم بگیرید که از کدام
261
00:09:17,760 –> 00:09:20,160
کتابخانه استفاده کنید، نمودار uh chartpi است که
262
00:09:20,160 –> 00:09:21,600
من نوشته ام و در نهایت یک
263
00:09:21,600 –> 00:09:23,600
لفاف در بالای بوکه
264
00:09:23,600 –> 00:09:25,600
و به ویژه لفاف بر روی
265
00:09:25,600 –> 00:09:27,760
matplotlib است و اینها را رسم کنید. بنابراین
266
00:09:27,760 –> 00:09:29,440
به شما این امکان را می دهد که
267
00:09:29,440 –> 00:09:31,519
فقط با تغییر یک کلمه کلیدی به سرعت بین plotly و matplotlib تغییر دهید،
268
00:09:31,519 –> 00:09:32,880
269
00:09:32,880 –> 00:09:34,480
بنابراین سعی کردم درک Api را نیز کمی
270
00:09:34,480 –> 00:09:37,120
ساده تر کنم، بنابراین
271
00:09:37,120 –> 00:09:38,880
معمولاً این روزها از نمودار pi
272
00:09:38,880 –> 00:09:42,080
در بالای نمودار یا استفاده می کنم. گاهی
273
00:09:42,080 –> 00:09:44,240
اوقات گاهی اوقات من در یک طرح هستم حال و هوای
274
00:09:44,240 –> 00:09:45,920
دیگر من در مورد طرح خود نگران هستم.
275
00:09:45,920 –> 00:09:48,480
رونق فقط به تحلیلی بستگی دارد
276
00:09:48,480 –> 00:09:52,080
که من در تمرین
277
00:09:52,080 –> 00:09:53,839
یادگیری ماشین انجام
278
00:09:53,839 –> 00:09:56,560
می دهم. شما h
279
00:09:56,560 –> 00:09:58,720
کتابخانههای مختلف زیادی برای
280
00:09:58,720 –> 00:10:01,680
یادگیری ماشین و آمار وجود دارد، بنابراین یک
281
00:10:01,680 –> 00:10:03,680
tsa از راه دور وجود دارد که
282
00:10:03,680 –> 00:10:05,279
توسط پل بیلیکن نوشته شده است، بنابراین او یکی از
283
00:10:05,279 –> 00:10:06,880
سخنرانان دیگر
284
00:10:06,880 –> 00:10:09,200
در qdc است.
285
00:10:09,200 –> 00:10:10,720
286
00:10:10,720 –> 00:10:13,120
287
00:10:13,120 –> 00:10:15,120
288
00:10:15,120 –> 00:10:17,680
همچنین
289
00:10:17,680 –> 00:10:20,079
مواردی مانند
290
00:10:20,079 –> 00:10:23,440
tensorflow که توسط google uh pytorch ایجاد شده است و همچنین
291
00:10:23,440 –> 00:10:24,720
احتمالاً کتابخانه یادگیری ماشینی
292
00:10:24,720 –> 00:10:26,640
که من بیشتر از آن استفاده می کنم احتمالاً
293
00:10:26,640 –> 00:10:29,600
ساده ترین آنها یادگیری روانی است و دارای انواع
294
00:10:29,600 –> 00:10:32,560
295
00:10:32,560 –> 00:10:35,120
رگرسیون ها و
296
00:10:35,120 –> 00:10:36,320
تکنیک های طبقه بندی است. بنابراین برخی از بدیهی است که آنها
297
00:10:36,320 –> 00:10:37,920
چیزهای نسبتاً استانداردی هستند مانند
298
00:10:37,920 –> 00:10:40,000
رگرسیون لجستیک برای طبقه بندی
299
00:10:40,000 –> 00:10:42,000
و رگرسیون خطی و همچنین
300
00:10:42,000 –> 00:10:43,680
می توانید کارهایی مانند ols و
301
00:10:43,680 –> 00:10:44,800
رگرسیون
302
00:10:44,800 –> 00:10:46,720
خطی را انجام دهید و همچنین مدل های غیر خطی زیادی نیز
303
00:10:46,720 –> 00:10:49,040
304
00:10:49,040 –> 00:10:50,480
دارید و اگر می خواهید شروع کنید، این مکان نسبتاً خوبی برای شروع است. اساساً میخواهند
305
00:10:50,480 –> 00:10:53,200
یادگیری ماشینی انجام دهند
306
00:10:53,200 –> 00:10:55,440
و تنسورفلو همچنان
307
00:10:55,440 –> 00:10:57,040
استفاده از افزودن int جدید را آسانتر میکنند
308
00:10:57,040 –> 00:10:59,120
عبارات و چیزهای دیگر، بنابراین این
309
00:10:59,120 –> 00:11:00,399
یک چیز جالب است که باید به آن نگاه کرد، اما من
310
00:11:00,399 –> 00:11:01,680
می گویم احتمالاً به عنوان اولین انتخاب
311
00:11:01,680 –> 00:11:04,000
شاید 10 آه روانی یاد بگیرید اگر در
312
00:11:04,000 –> 00:11:05,519
حال انجام یادگیری ماشینی هستید، حداقل
313
00:11:05,519 –> 00:11:07,120
من استفاده از ام را نسبتاً ساده یافته
314
00:11:07,120 –> 00:11:09,839
315
00:11:10,160 –> 00:11:13,120
ام. یکی از جنبههای پایتون که به آن
316
00:11:13,120 –> 00:11:14,560
اشاره کردم و
317
00:11:14,560 –> 00:11:15,920
اگر بگویید که پایتون را یاد میگیرید احتمالاً همه میگویند این
318
00:11:15,920 –> 00:11:17,920
است که پایتون در عمل بسیار
319
00:11:17,920 –> 00:11:20,800
کند است.
320
00:11:22,000 –> 00:11:23,760
321
00:11:23,760 –> 00:11:25,279
322
00:11:25,279 –> 00:11:26,959
به این سوال که این در حال
323
00:11:26,959 –> 00:11:30,000
ضبط است، خیلی خوب و من فکر می کنم wbs
324
00:11:30,000 –> 00:11:32,560
بعداً این را به اشتراک خواهد گذاشت،
325
00:11:32,560 –> 00:11:34,640
بنابراین اساسا پایتون آنقدر سریع نیست، بنابراین
326
00:11:34,640 –> 00:11:36,800
چه کاری می توانیم انجام دهیم تا آن را سریعتر کنیم، بنابراین
327
00:11:36,800 –> 00:11:38,880
سایفون از نظر تاریخی راهی
328
00:11:38,880 –> 00:11:41,360
برای انجام آن بوده است، بنابراین اساسا یک زیر مجموعه دارد.
329
00:11:41,360 –> 00:11:43,760
کد پایتون که می تواند
330
00:11:43,760 –> 00:11:45,920
در اصل به کد ماشین کامپایل شود، بنابراین
331
00:11:45,920 –> 00:11:48,480
این کد به کد تبدیل می شود، در
332
00:11:48,480 –> 00:11:50,880
نهایت کامپایل می شود و سپس
333
00:11:50,880 –> 00:11:52,320
به مسلسل ریخته می شود، بنابراین این یکی
334
00:11:52,320 –> 00:11:53,920
بسیار سریع خواهد بود و
335
00:11:53,920 –> 00:11:54,959
336
00:11:54,959 –> 00:11:56,480
برخی از
337
00:11:56,480 –> 00:11:58,079
آنها. از کد و می گویند پانداها در
338
00:11:58,079 –> 00:12:00,959
واقع در سایفون در زیر
339
00:12:00,959 –> 00:12:02,800
یک تکنیک جدیدتر نوشته شده است، اما برای نوعی
340
00:12:02,800 –> 00:12:04,720
افزایش سرعت کد پایتون استفاده از
341
00:12:04,720 –> 00:12:06,880
عددی است که دارای یک ماشین مجازی سطح پایین است
342
00:12:06,880 –> 00:12:08,639
در این مثال شما
343
00:12:08,639 –> 00:12:09,760
در واقع نیازی به اجرای آن از طریق یک کامپایلر ندارید.
344
00:12:09,760 –> 00:12:11,600
345
00:12:11,600 –> 00:12:14,240
از قبل، اساساً ام، اما شما
346
00:12:14,240 –> 00:12:16,079
باید کد خود را به روشی خاص بنویسید
347
00:12:16,079 –> 00:12:18,240
تا با عدد پشتیبانی شود تا
348
00:12:18,240 –> 00:12:20,079
عدد به عنوان مثال
349
00:12:20,079 –> 00:12:22,720
محاسبات روی آرایههای ناتوان را
350
00:12:22,720 –> 00:12:25,680
بفهمد و محاسبات روی پانداها را درک نکند،
351
00:12:25,680 –> 00:12:27,360
اما نکته کلیدی در مورد اعداد این است که میتوانید در نهایت
352
00:12:27,360 –> 00:12:30,639
این کار را انجام دهید. حلقهها درست مانند سایفون،
353
00:12:30,639 –> 00:12:33,600
اما بسیار سریعتر از پایتون است،
354
00:12:33,600 –> 00:12:35,519
بنابراین گاهی اوقات
355
00:12:35,519 –> 00:12:37,279
نوشتن کد بدون شماره حلقه برای شما بسیار دشوار
356
00:12:37,279 –> 00:12:39,279
است، در واقع
357
00:12:39,279 –> 00:12:40,800
راهحل آن است و من
358
00:12:40,800 –> 00:12:42,639
359
00:12:42,639 –> 00:12:45,120
با استفاده از عدد موفق به افزایش سرعت بسیار زیاد شدهام. امم،
360
00:12:45,120 –> 00:12:46,880
نوشتن کدی که با شماره در پایتون سازگار است، بیشتر طول می کشد،
361
00:12:46,880 –> 00:12:48,320
362
00:12:48,320 –> 00:12:50,000
اما اگر گلوگاه خاصی در
363
00:12:50,000 –> 00:12:51,760
کد خود دارید، اکیداً توصیه می کنم
364
00:12:51,760 –> 00:12:55,120
به یک عدد نگاه کنید و آن را ببینید. s um من
365
00:12:55,120 –> 00:12:56,560
بازخورد خوبی از افراد زیادی دریافت کرده ام که
366
00:12:56,560 –> 00:12:58,399
از اعداد نیز استفاده کرده اند، همزمان
367
00:12:58,399 –> 00:13:00,079
368
00:13:00,079 –> 00:13:01,680
می توانید از برخی از
369
00:13:01,680 –> 00:13:05,279
ویژگی های موازی سازی در پایتون um استفاده کنید، بنابراین
370
00:13:05,279 –> 00:13:07,680
یکی از ماژول هایی که گنجانده شده است
371
00:13:07,680 –> 00:13:08,800
um
372
00:13:08,800 –> 00:13:11,120
uh است. همانطور که threading
373
00:13:11,120 –> 00:13:13,519
um و همچنین پردازش چندگانه وجود دارد
374
00:13:13,519 –> 00:13:14,320
375
00:13:14,320 –> 00:13:15,279
376
00:13:15,279 –> 00:13:16,639
نکته در مورد threading این است
377
00:13:16,639 –> 00:13:19,440
که معمولاً برای سرعت بخشیدن به
378
00:13:19,440 –> 00:13:22,639
عملیات فشرده استفاده می شود، بنابراین منظور از عملیات فشرده
379
00:13:22,639 –> 00:13:25,519
مواردی مانند
380
00:13:25,519 –> 00:13:27,600
خواندن um از صفحات وب بارگیری دیسک
381
00:13:27,600 –> 00:13:29,680
و غیره است و می توانید درخواست های موازی داشته باشید.
382
00:13:29,680 –> 00:13:31,760
با استفاده از threading، اما در زیر آن
383
00:13:31,760 –> 00:13:33,040
در واقع
384
00:13:33,040 –> 00:13:35,279
محاسبات را همزمان انجام نمی دهد، اگر
385
00:13:35,279 –> 00:13:37,120
می خواهید محاسباتی را همزمان انجام دهید
386
00:13:37,120 –> 00:13:40,000
که به توان cpu زیادی متکی هستند،
387
00:13:40,000 –> 00:13:41,519
احتمالاً مانند انجام
388
00:13:41,519 –> 00:13:43,199
شبیه سازی مونت کارلو یا چیزی شبیه به آن،
389
00:13:43,199 –> 00:13:46,720
راه حل دیگر استفاده از uh است. پردازندهها
390
00:13:46,720 –> 00:13:48,399
و با پردازشهایی که به معنای واقعی کلمه در جایی که هست
391
00:13:48,399 –> 00:13:50,160
، یک نمونه پایتون دیگر
392
00:13:50,160 –> 00:13:51,279
روی دستگاه شما
393
00:13:51,279 –> 00:13:52,959
394
00:13:52,959 –> 00:13:56,399
ایجاد میکند، از نظر ایجاد فرآیندها مقداری سربار وجود دارد، اما در بسیاری از
395
00:13:56,399 –> 00:13:57,600
موارد ارزش من را دارد. اگر یک
396
00:13:57,600 –> 00:13:59,760
عملیات محاسباتی فشرده
397
00:13:59,760 –> 00:14:02,639
دارید که میخواهید فلج شوید
398
00:14:02,639 –> 00:14:04,720
، راههای دیگری برای توزیع وظایف
399
00:14:04,720 –> 00:14:07,360
و همچنین مواردی مانند کرفس وجود دارد
400
00:14:07,360 –> 00:14:09,279
که به شما امکان میدهد
401
00:14:09,279 –> 00:14:11,120
وظایف را نه تنها بر روی
402
00:14:11,120 –> 00:14:12,560
دستگاه خود، بلکه به طور بالقوه در کل
403
00:14:12,560 –> 00:14:13,839
خوشه توزیع کنید.
404
00:14:13,839 –> 00:14:16,639
خوب برای انجام
405
00:14:16,639 –> 00:14:19,680
عملیات um ناهمزمان به
406
00:14:19,680 –> 00:14:22,079
نوعی مانند یک لفاف در بالای threading um است
407
00:14:22,079 –> 00:14:24,160
و دیگری مانند یک کتابخانه خوب اگر
408
00:14:24,160 –> 00:14:27,120
با مجموعه داده های بسیار بزرگ سر
409
00:14:27,120 –> 00:14:29,120
و کار دارید، منظورم این است که ویژگی هایی برای انجام
410
00:14:29,120 –> 00:14:31,839
زمان بندی کارها دارد، اما همچنین دارای یک کتابخانه خوب است.
411
00:14:31,839 –> 00:14:34,880
رابط پاندا مانند برای استفاده از uh برای
412
00:14:34,880 –> 00:14:36,959
کار با فریمهای داده،
413
00:14:36,959 –> 00:14:38,800
بنابراین مشکل پانداها این است که فرض کنید
414
00:14:38,800 –> 00:14:40,399
مجموعه دادهای داریم که بزرگ است،
415
00:14:40,399 –> 00:14:42,240
نمیدانم 100 گیگابایت است یا چیزی که
416
00:14:42,240 –> 00:14:43,839
در حافظه شما برای انجام محاسبات جا نمیشود.
417
00:14:43,839 –> 00:14:46,320
پانداها درست است،
418
00:14:46,320 –> 00:14:47,920
بنابراین تنها راه برای استفاده از پانداها این است که
419
00:14:47,920 –> 00:14:50,399
به طور بالقوه آن محاسبات را دسته بندی کنید،
420
00:14:50,399 –> 00:14:51,920
اما این بدان معناست که شما باید
421
00:14:51,920 –> 00:14:53,680
کد خود را بازنویسی کنید و در نهایت به
422
00:14:53,680 –> 00:14:56,560
یک جایگزین نامرتب تبدیل می شود. شما میتوانید از das استفاده کنید
423
00:14:56,560 –> 00:14:57,600
و این
424
00:14:57,600 –> 00:15:00,240
همه آن دستهبندی برای شماست به جای
425
00:15:00,240 –> 00:15:02,560
پانداها، بنابراین فقط این کار را در
426
00:15:02,560 –> 00:15:04,720
پسزمینه انجام میدهد، اساساً برای اجرا یک نمودار محاسبه گراف محاسباتی ایجاد کنید
427
00:15:04,720 –> 00:15:06,320
428
00:15:06,320 –> 00:15:08,079
و نیازی نیست به آن
429
00:15:08,079 –> 00:15:10,320
فکر کنید تا بتوانید
430
00:15:10,320 –> 00:15:12,720
اساساً فایل عظیمی را بارگیری کنید
431
00:15:12,720 –> 00:15:15,440
و عملیات سری زمانی را روی آن انجام دهید
432
00:15:15,440 –> 00:15:17,760
و فقط از آن استفاده کنید که انگار
433
00:15:17,760 –> 00:15:19,839
در حافظه است اما در زیر
434
00:15:19,839 –> 00:15:21,760
داس در نهایت عملیات
435
00:15:21,760 –> 00:15:24,160
را انجام می دهد تا
436
00:15:24,160 –> 00:15:27,839
محاسبات را در پس زمینه انجام دهید.
437
00:15:27,839 –> 00:15:30,959
استفاده خوب از پایتون اساساً
438
00:15:30,959 –> 00:15:33,680
برای انجام پردازش با متن
439
00:15:33,680 –> 00:15:35,199
و پردازش زبان طبیعی است
440
00:15:35,199 –> 00:15:37,199
و در اینجا گزینه های زیادی وجود
441
00:15:37,199 –> 00:15:39,360
دارد که می توانید از آنها استفاده کنید، بنابراین
442
00:15:39,360 –> 00:15:41,680
nltk احتمالاً قدیمی ترین از
443
00:15:41,680 –> 00:15:43,040
شناخته شده ترین
444
00:15:43,040 –> 00:15:45,839
کتابخانه های پردازش زبان طبیعی در پایتون
445
00:15:45,839 –> 00:15:47,600
است. خوب که
446
00:15:47,600 –> 00:15:49,279
بسیاری از عملیات
447
00:15:49,279 –> 00:15:52,800
nltk را تکرار می کند، اما
448
00:15:52,800 –> 00:15:54,639
در بسیاری از موارد بر روی یک سیفون ساخته شده است، بنابراین می
449
00:15:54,639 –> 00:15:56,160
تواند بسیار سریعتر
450
00:15:56,160 –> 00:15:58,240
باشد.
451
00:15:58,240 –> 00:16:00,240
از nltk که استفاده از یک کتابخانه دیگر از استانفورد برای nlp را کمی آسانتر میکند،
452
00:16:00,240 –> 00:16:03,199
453
00:16:03,199 –> 00:16:05,759
nlp باز است
454
00:16:05,759 –> 00:16:07,120
و یک کتابخانه جدیدتر به نام
455
00:16:07,120 –> 00:16:08,639
ترانسفورماتور وجود دارد که دارای بسیاری
456
00:16:08,639 –> 00:16:10,800
از مدلهای پیشرفتهای است
457
00:16:10,800 –> 00:16:12,160
که ما در پردازش زبان طبیعی
458
00:16:12,160 –> 00:16:14,560
داریم.
459
00:16:14,560 –> 00:16:17,519
bert gpt2 فکر نمیکنم gpt-3 داشته باشد زیرا
460
00:16:17,519 –> 00:16:19,519
این منبع نزدیک است، اما
461
00:16:19,519 –> 00:16:20,880
اگر به وبسایت
462
00:16:20,880 –> 00:16:22,399
ترانسفورماتور بروید، صدها و
463
00:16:22,399 –> 00:16:24,320
صدها مدل از پیش آموزشدیدهشده nrp دارم
464
00:16:24,320 –> 00:16:26,079
که میتوانید با آنها بازی کنید و تعداد زیادی
465
00:16:26,079 –> 00:16:27,279
از آنها. برای
466
00:16:27,279 –> 00:16:30,079
کاربردهای خاصی مانند
467
00:16:30,079 –> 00:16:32,240
بررسی محصول یا
468
00:16:32,240 –> 00:16:34,800
نگاه بالقوه به متن Uh مالی
469
00:16:34,800 –> 00:16:36,399
و غیره خواهد بود
470
00:16:36,399 –> 00:16:38,240
و من می گویم که ترانسفورماتورها به عنوان یک کتابخانه بسیار
471
00:16:38,240 –> 00:16:39,120
جالب هستند
472
00:16:39,120 –> 00:16:41,839
، اوه برای استفاده از
473
00:16:41,839 –> 00:16:43,839
اوم نکته کلیدی دیگر این است که اگر نیاز به
474
00:16:43,839 –> 00:16:45,759
دریافت متن دارید، معمولاً شامل خراش دادن وب است.
475
00:16:45,759 –> 00:16:47,040
476
00:16:47,040 –> 00:16:48,959
و سوپ زیبا اساساً به شما کمک می کند
477
00:16:48,959 –> 00:16:51,360
تا یک متن اسکراپر وب را تمیز کنید
478
00:16:51,360 –> 00:16:53,519
و اگر نمی خواهید از چیزی
479
00:16:53,519 –> 00:16:55,360
متن باز استفاده
480
00:16:55,360 –> 00:16:58,000
کنید چیزهایی مانند uh
481
00:16:58,000 –> 00:17:01,440
google cloud aws ibm watson و غیره دارید و آنها
482
00:17:01,440 –> 00:17:04,640
خدمات nlp را در ابر ارائه می دهند.
483
00:17:04,640 –> 00:17:05,919
اگر میخواهید
484
00:17:05,919 –> 00:17:08,640
همزمان
485
00:17:09,280 –> 00:17:12,720
، یکی از جنبههای انجام
486
00:17:12,720 –> 00:17:14,160
کارها در پایتون این است که میخواهید دیگران
487
00:17:14,160 –> 00:17:16,319
از آن درست استفاده کنند، یعنی
488
00:17:16,319 –> 00:17:18,240
هیچ کس دیگری از کد شما استفاده نمیکند و
489
00:17:18,240 –> 00:17:19,039
490
00:17:19,039 –> 00:17:22,000
احتمالاً کمی به بنبست خواهید رسید. اوه شما اساساً می توانید
491
00:17:22,000 –> 00:17:24,799
کد پایتون خود را در یک
492
00:17:24,799 –> 00:17:27,119
صفحه وب قرار دهید و راه های مختلفی
493
00:17:27,119 –> 00:17:28,480
برای انجام این کار وجود دارد، بنابراین یکی از راه هایی که
494
00:17:28,480 –> 00:17:32,080
من استفاده کرده ام فلاسک است، بنابراین اساساً مانند یک
495
00:17:32,080 –> 00:17:34,799
وب سرور کوچک است
496
00:17:34,799 –> 00:17:37,679
و در بالای آن خط تیره وجود دارد.
497
00:17:37,679 –> 00:17:39,120
که یک کتابخانه است
498
00:17:39,120 –> 00:17:40,960
که توسط plotley توسعه داده شده است و
499
00:17:40,960 –> 00:17:42,799
500
00:17:42,799 –> 00:17:44,799
استفاده از آن را برای ایجاد داشبوردهای وب بسیار ساده و آسان می کند و
501
00:17:44,799 –> 00:17:47,039
این یکی از مواردی است که ما در qdc پوشش می دهیم در
502
00:17:47,039 –> 00:17:50,080
واقع اگر در یک داشبورد وب با
503
00:17:50,080 –> 00:17:52,160
uh dash ایجاد
504
00:17:52,160 –> 00:17:53,679
می کنیم. بانک یا هر نوع
505
00:17:53,679 –> 00:17:55,440
مؤسسه مالی، هیچ راهی برای
506
00:17:55,440 –> 00:17:57,840
فرار از اکسل وجود ندارد، همه هنوز دوست دارند،
507
00:17:57,840 –> 00:17:59,440
حتی من
508
00:17:59,440 –> 00:18:01,600
چندین سال است که در حال برنامه نویسی هستم، من هنوز از
509
00:18:01,600 –> 00:18:03,039
اکسل کم استفاده می کنم، زیرا همه آن
510
00:18:03,039 –> 00:18:06,720
بصری است و به
511
00:18:06,720 –> 00:18:08,720
نوعی استفاده از آن آسان تر است.
512
00:18:08,720 –> 00:18:10,320
ضروری است
513
00:18:10,320 –> 00:18:12,799
پس سوال اینجاست که c plus
514
00:18:12,799 –> 00:18:14,559
plus تنها جایگزینی برای سرعت بیش از
515
00:18:14,559 –> 00:18:17,600
پایتون است یا اینکه پایتون یک
516
00:18:17,600 –> 00:18:20,000
بسته هیبریدی پایتون c plus plus دارد um خوب من حدس
517
00:18:20,000 –> 00:18:22,480
می زنم راه های زیادی برای افزایش سرعت um
518
00:18:22,480 –> 00:18:24,640
python وجود دارد، بنابراین برخی از راه هایی که من به
519
00:18:24,640 –> 00:18:26,960
مواردی مانند سایفون اشاره کردم. که اساساً
520
00:18:26,960 –> 00:18:29,520
یک زیرمجموعه از یک ابر مجموعه
521
00:18:29,520 –> 00:18:31,679
کد پایتون را به c تبدیل می کند که می تواند
522
00:18:31,679 –> 00:18:33,760
به کد ماشین
523
00:18:33,760 –> 00:18:35,520
524
00:18:35,520 –> 00:18:39,120
525
00:18:39,120 –> 00:18:43,120
526
00:18:43,120 –> 00:18:46,799
کامپایل شود. در چت در واقع ام
527
00:18:46,799 –> 00:18:49,039
و این در واقع خیلی
528
00:18:49,039 –> 00:18:51,200
سریعتر است اگر کد خود را اجرا کنید تنها
529
00:18:51,200 –> 00:18:52,640
مشکل این است که
530
00:18:52,640 –> 00:18:54,240
با تمام بسته های پایتونی که می خواهید سازگار نیست،
531
00:18:54,240 –> 00:18:56,960
بنابراین من معمولاً فقط از
532
00:18:56,960 –> 00:18:58,880
c python استفاده می کنم زیرا از این نظر فقط
533
00:18:58,880 –> 00:19:01,360
534
00:19:01,360 –> 00:19:04,799
استفاده از آن آسانتر میشود.
535
00:19:04,799 –> 00:19:07,600
اوم، ما همچنین از نظر
536
00:19:07,600 –> 00:19:08,880
خراش دادن وب، چیزهایی مانند
537
00:19:08,880 –> 00:19:12,240
سلنیوم داریم که خراشیده میشوند و اوه دو بار
538
00:19:12,240 –> 00:19:14,320
و بنابراین دو برابر آن را آسان میکند.
539
00:19:14,320 –> 00:19:16,320
540
00:19:16,320 –> 00:19:19,760
اساساً به api توییتر به um دسترسی پیدا کنید، اما یکی از
541
00:19:19,760 –> 00:19:22,080
کارهایی که انجام میدهید و باید
542
00:19:22,080 –> 00:19:24,000
بدانید هنگام دسترسی به api توییتر این
543
00:19:24,000 –> 00:19:25,679
است که به تعداد
544
00:19:25,679 –> 00:19:27,440
توییتهایی که میتوانید دانلود کنید محدود هستید، بنابراین اگر
545
00:19:27,440 –> 00:19:28,960
میخواهید دسترسی کامل داشته باشید. شما باید در واقع
546
00:19:28,960 –> 00:19:32,799
هزینه اشتراک را برای این کار بپردازید
547
00:19:36,559 –> 00:19:39,120
، بنابراین بخش بزرگی از
548
00:19:39,120 –> 00:19:41,440
بازارهای مالی در واقع
549
00:19:41,440 –> 00:19:43,120
دادههای بازار را ذخیره میکنند، ما
550
00:19:43,120 –> 00:19:45,520
اطلاعات بازار و انواع دیگر دادهها را ذخیره
551
00:19:45,520 –> 00:19:46,960
نمیکنیم. ما نمیتوانیم کاری انجام
552
00:19:46,960 –> 00:19:48,799
دهیم، بنابراین اینها برخی از راههایی هستند
553
00:19:48,799 –> 00:19:52,640
که میتوانید به دادهها دسترسی پیدا کنید، بنابراین
554
00:19:52,640 –> 00:19:54,480
قطب شمال وجود دارد که اساساً یک
555
00:19:54,480 –> 00:19:56,480
بستهبندی خوب در بالای mongodb است که
556
00:19:56,480 –> 00:19:59,760
ذخیرهسازی سریهای زمانی را در mongodb
557
00:19:59,760 –> 00:20:01,919
مانند فریمهای داده پانداها آسان میکند. اگر میخواهید
558
00:20:01,919 –> 00:20:04,000
از یک منبع خارجی مانند بلومبرگ به دادهها دسترسی پیدا کنید،
559
00:20:04,000 –> 00:20:05,520
560
00:20:05,520 –> 00:20:07,760
561
00:20:07,760 –> 00:20:09,600
بلومبرگ یک api برای پایتون به نام blp api
562
00:20:09,600 –> 00:20:11,440
دارد و انواع کتابخانهها
563
00:20:11,440 –> 00:20:14,400
نیز برای دسترسی به پایگاههای اطلاعاتی
564
00:20:14,400 –> 00:20:16,799
مانند pi mongo وجود دارد، کیمیاگری sql نیز وجود دارد
565
00:20:16,799 –> 00:20:18,720
که من اینجا ننوشتهام که باعث میشود
566
00:20:18,720 –> 00:20:21,919
خیلی راحته برای دسترسی به پایگاههای داده sql
567
00:20:21,919 –> 00:20:23,280
از طریق um
568
00:20:23,280 –> 00:20:25,440
از طریق پایتون و همچنین
569
00:20:25,440 –> 00:20:27,840
از نظر سایر ارائهدهندگان دادههای بازار،
570
00:20:27,840 –> 00:20:29,360
مشخصاً بلومبرگ یکی از
571
00:20:29,360 –> 00:20:32,159
ابزارهای بازیابی است که یک api خوب دارد و همچنین
572
00:20:32,159 –> 00:20:35,200
اکنون quando که اکنون است، فکر میکنم
573
00:20:35,200 –> 00:20:38,320
بخشهایی از nasdaq نیز دارای
574
00:20:38,320 –> 00:20:41,440
یک api خوب هستند. خوب، بنابراین برخی از دادههای
575
00:20:41,440 –> 00:20:43,120
quandl رایگان هستند، اما
576
00:20:43,120 –> 00:20:45,919
اگر میخواهید بین uh queue و python ترکیب و مطابقت داشته باشید، مقدار زیادی از آنها نیز پولی است.
577
00:20:45,919 –> 00:20:49,760
578
00:20:49,760 –> 00:20:51,840
579
00:20:51,840 –> 00:20:54,559
دادهها
580
00:20:54,559 –> 00:20:57,280
را توصیه میکنم از redis استفاده کنید، بنابراین redis
581
00:20:57,280 –> 00:20:59,840
اساساً یک پایگاه داده در حافظه است، بنابراین من
582
00:20:59,840 –> 00:21:01,919
از redis به طور گسترده برای
583
00:21:01,919 –> 00:21:04,320
ذخیرهسازی دادهها استفاده
584
00:21:04,320 –> 00:21:06,400
میکنم، بنابراین به چکشکاری پایگاه دادهام ادامه نمیدهم، فقط آن را موقتاً روی redis فشار میدهم تا
585
00:21:06,400 –> 00:21:08,559
بتوانم آن را در آن نگه دارم.
586
00:21:08,559 –> 00:21:11,520
اساساً حافظه،
587
00:21:12,480 –> 00:21:14,559
بنابراین من می خواهم کمی در
588
00:21:14,559 –> 00:21:16,880
مورد فرآیندی صحبت کنم که در آن
589
00:21:16,880 –> 00:21:20,320
کتابخانه هایی را برای بازارهای مالی
590
00:21:20,320 –> 00:21:22,080
توسعه
591
00:21:22,080 –> 00:21:23,760
592
00:21:23,760 –> 00:21:26,159
داده ام
593
00:21:26,159 –> 00:21:28,000
594
00:21:28,000 –> 00:21:29,280
.
595
00:21:29,280 –> 00:21:31,120
تشابهات بین مشکلات علم داده
596
00:21:31,120 –> 00:21:32,880
و
597
00:21:32,880 –> 00:21:35,679
توسعه استراتژیهای معاملاتی چیست، اوه، پس
598
00:21:35,679 –> 00:21:39,280
کسی آن را در چت قرار دهد، من میتوانم از
599
00:21:39,280 –> 00:21:41,440
ایمپالا نیز برای حافظه استفاده کنم، فکر میکنم اینطور است،
600
00:21:41,440 –> 00:21:43,600
اما من از impala
601
00:21:43,600 –> 00:21:45,919
برای انجام دادن استفاده نکردهام -حافظه نهان و بله، به
602
00:21:45,919 –> 00:21:47,919
هر حال شعاع تنها در
603
00:21:47,919 –> 00:21:49,360
حافظه نهان نیست، موارد دیگر نیز وجود دارد، من همچنین از حافظه نهان حافظه پنهان استفاده کرده ام، بنابراین تعداد زیادی از حافظه پنهان وجود دارد
604
00:21:49,360 –> 00:21:52,320
605
00:21:52,320 –> 00:21:54,400
606
00:21:54,400 –> 00:21:57,200
607
00:21:57,200 –> 00:21:59,280
608
00:21:59,280 –> 00:22:01,200
609
00:22:01,200 –> 00:22:02,960
. من فقط چند
610
00:22:02,960 –> 00:22:04,720
مرحله کلی را که ممکن است
611
00:22:04,720 –> 00:22:06,240
هنگام تلاش برای حل یک مشکل علم داده
612
00:22:06,240 –> 00:22:08,640
یا در واقع توسعه یک استراتژی معاملاتی انجام دهیم، تشریح میکنم،
613
00:22:08,640 –> 00:22:09,760
614
00:22:09,760 –> 00:22:11,280
بنابراین اولین قدم این است که میخواهیم
615
00:22:11,280 –> 00:22:14,799
نوعی فرضیه را شکل دهیم
616
00:22:14,799 –> 00:22:16,720
که آیا این یک مشکل علم داده است
617
00:22:16,720 –> 00:22:18,320
یا یک استراتژی آموزشی مرحله دوم این
618
00:22:18,320 –> 00:22:20,240
است که ما باید دادهها را پیدا کنیم و
619
00:22:20,240 –> 00:22:21,840
معمولاً این دادهها را از بازار دریافت میکنیم،
620
00:22:21,840 –> 00:22:23,600
اگرچه ممکن است به طور فزایندهای
621
00:22:23,600 –> 00:22:25,360
سعی کنیم مجموعه دادههای جایگزین را که
622
00:22:25,360 –> 00:22:27,840
از خارج از بازار نیز منبع میشوند، بررسی کنیم. l
623
00:22:27,840 –> 00:22:29,520
و سپس مرحله سوم این است که با
624
00:22:29,520 –> 00:22:31,440
فرضیه و داده هایمان می خواهیم از
625
00:22:31,440 –> 00:22:33,840
آمار برای بررسی فرضیه خود استفاده کنیم
626
00:22:33,840 –> 00:22:35,600
و بنابراین این اساساً شامل
627
00:22:35,600 –> 00:22:36,960
آزمایش مجدد یک
628
00:22:36,960 –> 00:22:38,640
استراتژی معاملاتی است
629
00:22:38,640 –> 00:22:40,240
و فقط یک پاسخ به سؤال
630
00:22:40,240 –> 00:22:42,799
در چت در این جلسه به اشتراک گذاشته می شود.
631
00:22:42,799 –> 00:22:44,480
همه کسانی که از
632
00:22:44,480 –> 00:22:46,159
نظر ضبط ثبت نام کرده اند
633
00:22:46,159 –> 00:22:48,159
و سپس مرحله چهارم مرحله نهایی این خواهد
634
00:22:48,159 –> 00:22:49,679
بود که ما می خواهیم یافته های خود را ارائه کنیم
635
00:22:49,679 –> 00:22:51,360
و معمولاً این شامل برخی از
636
00:22:51,360 –> 00:22:54,080
عناصر تجسم است
637
00:22:54,080 –> 00:22:57,679
بنابراین من شروع به ایجاد یک کتابخانه
638
00:22:57,679 –> 00:22:59,360
پایتون python کردم این بیش از دو است در واقع این
639
00:22:59,360 –> 00:23:00,880
اکنون بیش از دو سال است که
640
00:23:00,880 –> 00:23:03,600
واقعاً چند سالی میگذرد، اوم،
641
00:23:03,600 –> 00:23:05,520
و من در نهایت آن را بازنویسی میکنم و اساساً
642
00:23:05,520 –> 00:23:07,120
آن را به تعدادی کتابخانههای مختلف تقسیم
643
00:23:07,120 –> 00:23:09,840
میکنم، دلیل اصلی این است
644
00:23:09,840 –> 00:23:11,600
که وقتی یک
645
00:23:11,600 –> 00:23:12,799
کتابخانه منبع باز مینویسید، میخواهید
646
00:23:12,799 –> 00:23:14,480
نسبتاً متمرکز باشید. به خصوص
647
00:23:14,480 –> 00:23:16,400
محبوبترین کتابخانه که شما کتابخانهای نمیخواهید
648
00:23:16,400 –> 00:23:17,760
که کاملاً همه چیز را بیان کند، زیرا
649
00:23:17,760 –> 00:23:20,320
مردم آن را از نظر
650
00:23:20,320 –> 00:23:22,799
کاری که انجام میدهد گیجکننده میدانند، بنابراین شما میخواهید آن را انجام دهید. چیزی که
651
00:23:22,799 –> 00:23:24,320
مخصوصاً خوب است، حدس میزنم
652
00:23:24,320 –> 00:23:26,559
با کتابخانه
653
00:23:26,559 –> 00:23:28,880
um، بنابراین من چندین نفر از این
654
00:23:28,880 –> 00:23:31,039
هنرمندان را ساختهام، اولین مورد پای نمودار است
655
00:23:31,039 –> 00:23:32,799
که برای تجسم است و
656
00:23:32,799 –> 00:23:35,280
به شما امکان م