در این مطلب، ویدئو پروفایل کردن بارهای کاری پایتون با تقویت کننده VTune اینتل با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:33:43
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:01,949
بنابراین بله، امروز به شما نشان خواهم داد که چگونه
2
00:00:01,949 –> 00:00:06,270
از تقویت کننده vtune اینتل برای پروفایل
3
00:00:06,270 –> 00:00:10,800
برنامه پایتون خود استفاده کنید، بنابراین مطمئن هستم که
4
00:00:10,800 –> 00:00:12,570
همه شما با پایتون آشنایی دارید
5
00:00:12,570 –> 00:00:16,710
اخیراً بسیار محبوب شده است،
6
00:00:16,710 –> 00:00:18,930
ایجاد سریع
7
00:00:18,930 –> 00:00:21,750
برنامه های خود عالی است. کتابخانه ها
8
00:00:21,750 –> 00:00:25,980
و یک پایگاه کاربری بسیار خوب که می تواند به
9
00:00:25,980 –> 00:00:28,050
شما در ساخت برنامه با استفاده از
10
00:00:28,050 –> 00:00:31,769
کتابخانه ها کمک کند، علاوه بر این،
11
00:00:31,769 –> 00:00:33,570
فریمورک های زیادی دارد که در واقع
12
00:00:33,570 –> 00:00:35,670
برای سخت افزار بهینه شده اند، بنابراین
13
00:00:35,670 –> 00:00:38,550
حتی اگر پایتون یک
14
00:00:38,550 –> 00:00:41,100
زبان تفسیری است اگر از آن استفاده می کنید. یکی از این
15
00:00:41,100 –> 00:00:42,989
فریم ورکهای بهینهشده میتواند عملکرد
16
00:00:42,989 –> 00:00:48,600
بسیار خوبی داشته باشد، بنابراین من 3 نوع
17
00:00:48,600 –> 00:00:51,870
بار کاری پایتون را دیدهام، بنابراین اولین
18
00:00:51,870 –> 00:00:54,090
مورد استفاده از پایتون با کتابخانههای استاندارد است،
19
00:00:54,090 –> 00:00:56,910
شاید از چیزی مانند
20
00:00:56,910 –> 00:01:02,190
numpy استفاده میکند و این اولین مورد استفاده اغلب
21
00:01:02,190 –> 00:01:03,600
اوقات کتابخانهها واقعاً نیستند.
22
00:01:03,600 –> 00:01:05,610
برای شما برای سخت افزار بهینه شده است،
23
00:01:05,610 –> 00:01:07,860
بنابراین عملکرد وجود ندارد، فکر می کنم
24
00:01:07,860 –> 00:01:11,250
بسیاری از افراد از این مورد استفاده برای
25
00:01:11,250 –> 00:01:14,509
پردازش داده ها و برنامه های کاربردی i/o یا
26
00:01:14,509 –> 00:01:19,320
نوع کلی اسکریپت و سپس
27
00:01:19,320 –> 00:01:21,630
فکر میکنم امروزه رایجترین روش استفاده از پایتون
28
00:01:21,630 –> 00:01:25,020
برای چارچوبهای مجاز HPC
29
00:01:25,020 –> 00:01:29,280
مانند جریان بیابانی است و بیشتر اوقات
30
00:01:29,280 –> 00:01:32,310
این فریمورکها در واقع
31
00:01:32,310 –> 00:01:33,860
برای سختافزاری که در حال اجرا هستید بهینهسازی شدهاند،
32
00:01:33,860 –> 00:01:37,950
بنابراین بردار و چند رشتهای هستند، بنابراین
33
00:01:37,950 –> 00:01:39,360
فکر میکنم این است. در مورد استفاده اصلی
34
00:01:39,360 –> 00:01:41,970
برای افرادی که یادگیری ماشینی و
35
00:01:41,970 –> 00:01:46,890
برنامه های کاربردی هوش مصنوعی انجام می دهند و مورد سوم این
36
00:01:46,890 –> 00:01:50,970
است که برای ایجاد
37
00:01:50,970 –> 00:01:52,829
زیرساخت برای برنامه خود به پایتون تکیه کنید و
38
00:01:52,829 –> 00:01:57,210
سپس در واقع کتابخانه های سفارشی بنویسید و
39
00:01:57,210 –> 00:02:00,750
ببینید که در واقع همه کارهای سنگین را انجام می دهند.
40
00:02:00,750 –> 00:02:04,320
برنامه خود را بنابراین می توانید با استفاده از Python
41
00:02:04,320 –> 00:02:06,390
تمام این بارهای کاری را نمایه کنید،
42
00:02:06,390 –> 00:02:10,770
بنابراین اگر
43
00:02:10,770 –> 00:02:13,650
از نمایه سازی اساساً با فایل
44
00:02:13,650 –> 00:02:16,110
کردن استفاده نکرده اید، برنامه خود را
45
00:02:16,110 –> 00:02:22,230
از طریق یک پروفایلر اجرا می کنید و از
46
00:02:22,230 –> 00:02:24,870
نمونه گیری زمان و تقویم های سخت افزاری در
47
00:02:24,870 –> 00:02:27,329
CPU استفاده می کند تا به شما بینشی بدهد. در
48
00:02:27,329 –> 00:02:30,060
عملکرد برنامه، به
49
00:02:30,060 –> 00:02:33,720
عنوان مثال، شما می توانید بینشی در مورد
50
00:02:33,720 –> 00:02:39,299
عملکرد حافظه پنهان l1 l2 خود داشته باشید، می توانید
51
00:02:39,299 –> 00:02:42,030
هر نوع پنالتی Numa را مشاهده کنید
52
00:02:42,030 –> 00:02:48,650
. می توانید پرداخت کنید و vtune در مقیاس های مختلفی کار می کند و
53
00:02:48,650 –> 00:02:52,079
روی یک هسته تک
54
00:02:52,079 –> 00:02:54,810
رشته چندین رشته و چندین
55
00:02:54,810 –> 00:02:58,590
رتبه کار می کند، بنابراین می توانید از vtune برای تجزیه و تحلیل
56
00:02:58,590 –> 00:03:08,730
برنامه خود استفاده کنید که در هر بازی برای
57
00:03:08,730 –> 00:03:11,819
بسیاری از این مجموعه ها واقعاً
58
00:03:11,819 –> 00:03:15,599
کم است، بنابراین بسیار زیرک است و آن را انجام دهید.
59
00:03:15,599 –> 00:03:18,709
اطلاعات زیادی در اختیار شما قرار می دهد و
60
00:03:18,709 –> 00:03:21,989
برخلاف بسیاری از ابزارهای پروفایل که
61
00:03:21,989 –> 00:03:23,220
فقط خروجی متنی را انجام می دهند،
62
00:03:23,220 –> 00:03:26,819
vtune دارای یک
63
00:03:26,819 –> 00:03:31,699
رابط کاربری گرافیکی خوب است و به
64
00:03:31,699 –> 00:03:34,019
شما امکان می دهد اطلاعات را به طرق مختلف مرتب کنید
65
00:03:34,019 –> 00:03:35,879
و اساساً اطلاعات را تغییر دهید.
66
00:03:35,879 –> 00:03:41,879
در مورد بینش در اسلاید من
67
00:03:41,879 –> 00:03:45,269
همچنین به این ابزار به نام انسولین اشاره کردم
68
00:03:45,269 –> 00:03:51,359
و مشاور اینتل لزوماً
69
00:03:51,359 –> 00:03:55,019
ابزار پروفایل نیست، اما
70
00:03:55,019 –> 00:03:58,260
تجزیه و تحلیل ایستا و پویا را انجام می دهد تا به شما بینشی
71
00:03:58,260 –> 00:04:00,049
در مورد کارایی برداری شما بدهد
72
00:04:00,049 –> 00:04:03,959
و من دوباره به این ابزار اشاره
73
00:04:03,959 –> 00:04:11,069
می کنم. بعداً vtune
74
00:04:11,069 –> 00:04:15,750
مجموعه های از پیش تعریف شده زیادی دارد، بنابراین در اینجا
75
00:04:15,750 –> 00:04:19,738
یک لیست بسیار گسترده وجود دارد و می
76
00:04:19,738 –> 00:04:22,550
توانید تقریباً هر یک از این
77
00:04:22,550 –> 00:04:24,870
مجموعه ها را در برنامه پایتون
78
00:04:24,870 –> 00:04:27,620
b خود اجرا کنید. با توجه به موارد برجسته شده
79
00:04:27,620 –> 00:04:31,160
و آبی روشن، ما از پایتون پشتیبانی می کنیم،
80
00:04:31,160 –> 00:04:33,620
بنابراین معنای واقعی آن این است
81
00:04:33,620 –> 00:04:36,199
که اگر از آبی
82
00:04:36,199 –> 00:04:38,270
روشن در برنامه پایتون خود استفاده کنید، می
83
00:04:38,270 –> 00:04:42,430
توانید پشته های تماس بومی پایتون را دریافت کنید،
84
00:04:42,430 –> 00:04:45,830
در حالی که اگر کاری انجام دهید. مانند
85
00:04:45,830 –> 00:04:49,760
اکتشاف عمومی، لایه پایتون شما
86
00:04:49,760 –> 00:04:51,919
در این نوع یکپارچه گروه بندی می شود،
87
00:04:51,919 –> 00:04:57,620
بنابراین بیشتر
88
00:04:57,620 –> 00:05:02,150
اوقات زمانی که در حال پروفایل کردن یک کد هستم، از
89
00:05:02,150 –> 00:05:04,669
عملکرد HPC یا
90
00:05:04,669 –> 00:05:08,479
کاوش عمومی استفاده می کنم و این به این دلیل است که
91
00:05:08,479 –> 00:05:10,580
کاوش عمومی تمرکز زیادی دارد. در سطح هسته
92
00:05:10,580 –> 00:05:14,150
و عملکرد HTPC
93
00:05:14,150 –> 00:05:17,540
برای بارهای کاری چند رشته ای مناسب تر است و
94
00:05:17,540 –> 00:05:21,770
این تجزیه و تحلیل ها در واقع مجموعه ای
95
00:05:21,770 –> 00:05:25,250
از این تحلیل های کوچکتر مانند
96
00:05:25,250 –> 00:05:29,479
نقاط اصلی هستند، بنابراین از آنجایی که هزینه های سربار بسیار
97
00:05:29,479 –> 00:05:32,930
پایین است، در بیشتر مواقع دلیلی
98
00:05:32,930 –> 00:05:35,680
برای استفاده نکردن از یکی از آنها ندیدم. این مجموعه ها را
99
00:05:35,680 –> 00:05:39,889
تجزیه و تحلیل می کند و شما می توانید و من به شما نشان خواهم داد که
100
00:05:39,889 –> 00:05:45,889
چگونه از هر دوی آنها استفاده کنید، بنابراین
101
00:05:45,889 –> 00:05:48,760
اگر می خواهید با vtune شروع به کار
102
00:05:48,760 –> 00:05:52,849
کنید، اگر مثلاً
103
00:05:52,849 –> 00:05:55,520
کاربر تتا هستید، خواهید دید که
104
00:05:55,520 –> 00:05:59,650
نصب v2 تحت کامپایلرهای نرم افزاری
105
00:05:59,650 –> 00:06:02,900
وجود دارد و این اسکریپت پوسته XE VARs فراوان وجود دارد
106
00:06:02,900 –> 00:06:05,030
و اگر منبع آن را تهیه
107
00:06:05,030 –> 00:06:07,099
کنید مسیر و هر آنچه را که برای شروع با تقویت کننده vtune نیاز دارید تنظیم می کند
108
00:06:07,099 –> 00:06:12,760
109
00:06:12,760 –> 00:06:15,950
در غیر این صورت اگر خوشه شما دارای
110
00:06:15,950 –> 00:06:18,229
ماژول تنظیم است می توانید از آن استفاده کنید. اینها یا شما
111
00:06:18,229 –> 00:06:21,680
می توانید همه متغیرها را خودتان صادر کنید،
112
00:06:21,680 –> 00:06:24,289
بنابراین نحو استفاده از تقویت کننده
113
00:06:24,289 –> 00:06:26,840
بسیار ساده است، فقط یک عمل
114
00:06:26,840 –> 00:06:29,450
و سپس گزینه های اقدام است و سپس یک خط تیره انجام می دهید
115
00:06:29,450 –> 00:06:31,610
و بعد از آن فقط
116
00:06:31,610 –> 00:06:34,180
برنامه خود را مانند حالت عادی اجرا می کنید،
117
00:06:34,180 –> 00:06:37,370
بنابراین ساده ترین حالت استفاده برای hotspot ها
118
00:06:37,370 –> 00:06:40,940
فقط خط C است که مخفف جمع
119
00:06:40,940 –> 00:06:45,350
و سپس hotspot است – – و شما
120
00:06:45,350 –> 00:06:48,040
مفسر پایتون و اسکریپت پایتون خود را می
121
00:06:48,040 –> 00:06:52,730
شناسید، بنابراین اگر تازه وارد vtune هستید، گزینه –
122
00:06:52,730 –> 00:06:56,990
h-help وجود دارد، بنابراین اگر انجام دادید – h جمع
123
00:06:56,990 –> 00:07:00,920
آوری خواهد شد. در واقع این لیست
124
00:07:00,920 –> 00:07:02,600
از مجموعه های از پیش تعریف شده را لیست می کند که می توانید
125
00:07:02,600 –> 00:07:06,050
اجرا کنید و سپس می توانید آن را با –
126
00:07:06,050 –> 00:07:08,780
eh hotspots جمع آوری کنید و
127
00:07:08,780 –> 00:07:11,090
اطلاعات اضافی را در مورد همه موارد
128
00:07:11,090 –> 00:07:14,300
مختلف در همه موارد به شما می دهد. دستگیره های مختلفی
129
00:07:14,300 –> 00:07:16,180
که می توانید برای سفارشی کردن
130
00:07:16,180 –> 00:07:20,870
تجزیه و تحلیل هات اسپات خود تنظیم کنید، توصیه می کنم
131
00:07:20,870 –> 00:07:23,420
این پیوند را در پایین نشانک کنید،
132
00:07:23,420 –> 00:07:26,180
این مرجع خط فرمان برای
133
00:07:26,180 –> 00:07:29,950
vtune است.
134
00:07:29,950 –> 00:07:33,980
135
00:07:33,980 –> 00:07:35,990
136
00:07:35,990 –> 00:07:37,790
اگر قبلاً از تجزیه و تحلیل خاصی استفاده نکرده اید، می توانید به آن مراجعه کنید،
137
00:07:37,790 –> 00:07:44,780
بنابراین من یک
138
00:07:44,780 –> 00:07:48,290
مثال ساده در اینجا در سمت راست دارم که
139
00:07:48,290 –> 00:07:55,520
فقط مقداری ریاضی انجام می دهد و در سمت چپ
140
00:07:55,520 –> 00:07:57,890
مثالی است از اینکه چگونه آن را اجرا می کنید
141
00:07:57,890 –> 00:08:01,010
تا این کار را انجام دهید. کافی @c CL و جمع آوری
142
00:08:01,010 –> 00:08:03,110
نقاط مهم در برنامه Spotlight
143
00:08:03,110 –> 00:08:06,530
و هنگامی که مجموعه کامل شد، می
144
00:08:06,530 –> 00:08:09,710
توانید رابط کاربری گرافیکی را باز کنید و نتایج را مشاهده کنید،
145
00:08:09,710 –> 00:08:14,630
بنابراین پس از باز کردن رابط کاربری گرافیکی
146
00:08:14,630 –> 00:08:16,400
در این پنجره خلاصه قرار می گیرید
147
00:08:16,400 –> 00:08:18,620
و اطلاعات کمی وجود دارد.
148
00:08:18,620 –> 00:08:21,460
در اینجا، بنابراین ابتدا باید
149
00:08:21,460 –> 00:08:24,560
زمان سپری شده خود را برای برنامه داشته باشید و در
150
00:08:24,560 –> 00:08:29,840
مورد تعداد موضوعاتی که من اجرا کردم، نقاط اصلی خود را دارید
151
00:08:29,840 –> 00:08:32,599
و اینها می توانند
152
00:08:32,599 –> 00:08:36,500
توابع یا حلقه باشند، شما یک هیستوگرام
153
00:08:36,500 –> 00:08:41,150
از میانگین استفاده از CPU و مقداری
154
00:08:41,150 –> 00:08:44,960
اطلاعات دارید. یون در مورد پلت فرم و
155
00:08:44,960 –> 00:08:48,200
نوع تجزیه و تحلیلی که اکنون در بالا جمع آوری شده است
156
00:08:48,200 –> 00:08:51,589
، شما سه
157
00:08:51,589 –> 00:08:54,140
نمای مختلف دارید که نمای پایین به بالا را دارید
158
00:08:54,140 –> 00:08:54,770
159
00:08:54,770 –> 00:08:57,740
که تماس گیرنده آن را ترک می کند و درخت بالا به
160
00:08:57,740 –> 00:09:03,800
پایین را به سرعت در اینجا من یک
161
00:09:03,800 –> 00:09:07,310
مثال با استفاده از آناکوندا اجرا کردم. توزیع برای
162
00:09:07,310 –> 00:09:11,540
پایتون و در اینجا ما زمان اجرا 24
163
00:09:11,540 –> 00:09:16,220
ثانیه داریم و اینتل در واقع
164
00:09:16,220 –> 00:09:20,930
توزیعی برای پایتون نیز دارد و بسیار
165
00:09:20,930 –> 00:09:22,520
شبیه آناکوندا با تعداد زیادی
166
00:09:22,520 –> 00:09:26,450
کتابخانه از قبل بسته بندی شده عرضه می شود، اما این
167
00:09:26,450 –> 00:09:29,209
کتابخانه ها در واقع بر خلاف mkl ساخته شده
168
00:09:29,209 –> 00:09:30,440
اند، بنابراین آنها بسیار هستند. قبلاً
169
00:09:30,440 –> 00:09:31,430
چند رشتهای
170
00:09:31,430 –> 00:09:34,279
هستند و برای عملکرد بهینهسازی شدهاند، بنابراین
171
00:09:34,279 –> 00:09:35,690
میبینید که من واقعاً
172
00:09:35,690 –> 00:09:38,300
چیزی غیر از مفسرم تغییر ندادم و
173
00:09:38,300 –> 00:09:42,860
زمان اجرای من تقریباً سه برابر سریعتر است و
174
00:09:42,860 –> 00:09:47,089
من از چندین رشته استفاده میکنم، بنابراین
175
00:09:47,089 –> 00:09:51,440
به پایین به بالا برمیگردم. مشاهده این
176
00:09:51,440 –> 00:09:54,080
نوع اصلی از نمای هات اسپات است که من
177
00:09:54,080 –> 00:09:57,350
بارها از آنجا شروع کردم، در اینجا
178
00:09:57,350 –> 00:10:03,770
لیستی از توابع یا حلقهها را میبینید
179
00:10:03,770 –> 00:10:06,140
که گزینههایی برای گروهبندی
180
00:10:06,140 –> 00:10:09,550
اطلاعات خود به روشهای مختلف
181
00:10:09,550 –> 00:10:13,730
دارید. این دکمه دیدگاه را تغییر دهید، بنابراین
182
00:10:13,730 –> 00:10:15,470
اگر به یاد داشته باشید که گفتم
183
00:10:15,470 –> 00:10:18,170
به عنوان مثال، کاوش عمومی به عنوان یک
184
00:10:18,170 –> 00:10:23,630
ابرمجموعه از تحلیل های دیگر است، هنگامی که
185
00:10:23,630 –> 00:10:25,490
کاوش های عمومی را جمع آوری کنید، برای مثال
186
00:10:25,490 –> 00:10:27,709
، تمام اطلاعات لازم برای مشاهده نقاط اصلی را نیز خواهد داشت،
187
00:10:27,709 –> 00:10:30,920
بنابراین
188
00:10:30,920 –> 00:10:32,570
می توانید بین این ها تغییر دهید.
189
00:10:32,570 –> 00:10:36,020
190
00:10:36,020 –> 00:10:41,690
اگر روی یکی از این مثلث ها کلیک کنید، به راحتی بدون نیاز به اجرای مجدد مجموعه خود را تجزیه و تحلیل
191
00:10:41,690 –> 00:10:44,510
می کند
192
00:10:44,510 –> 00:10:47,779
، این منوی باز می شود و
193
00:10:47,779 –> 00:10:50,089
تمام توابعی که
194
00:10:50,089 –> 00:10:53,120
این تابع خاص را فراخوانی می کنند نشان می دهد و اگر به
195
00:10:53,120 –> 00:10:55,459
کلیک کردن ادامه دهید، اساسا می توانید بروید
196
00:10:55,459 –> 00:11:01,010
علاوه بر
197
00:11:01,010 –> 00:11:04,699
این، می توانید از طریق انتخاب، داخل یا خارج شوید،
198
00:11:04,699 –> 00:11:08,360
بنابراین
199
00:11:08,360 –> 00:11:10,100
اگر هسته ای را از برنامه خود استخراج
200
00:11:10,100 –> 00:11:11,780
می کنید، باید
201
00:11:11,780 –> 00:11:14,120
نوعی تنظیمات را انجام دهید تا اجرا شود.
202
00:11:14,120 –> 00:11:17,570
مجموعه Ivy من لزوماً
203
00:11:17,570 –> 00:11:21,890
نشاندهنده اجرای استاندارد شما نیست، بنابراین
204
00:11:21,890 –> 00:11:23,810
ممکن است بخواهید تمام قابلیتهای راهاندازی را کاملاً حذف
205
00:11:23,810 –> 00:11:27,080
کنید تا بتوانید
206
00:11:27,080 –> 00:11:31,100
این کار را انجام دهید، ما همه موارد را داریم. e
207
00:11:31,100 –> 00:11:33,680
گزینه های فیلتر را در پایین اینجا قرار دهید، بنابراین می توانید
208
00:11:33,680 –> 00:11:36,290
انتخاب کنید که کدام فرآیند را می خواهید مشاهده کنید
209
00:11:36,290 –> 00:11:39,470
یا اگر می خواهید به یک ماژول خاص نگاه کنید،
210
00:11:39,470 –> 00:11:43,030
می توانید کدام رشته را انتخاب کنید که یکی از موارد
211
00:11:43,030 –> 00:11:46,160
بسیار مفید این است که در پایین
212
00:11:46,160 –> 00:11:48,740
سمت راست تابع فقط شما هستید.
213
00:11:48,740 –> 00:11:52,160
214
00:11:52,160 –> 00:11:57,470
215
00:11:57,470 –> 00:11:59,930
اگر در حال کاوش در مواردی برای
216
00:11:59,930 –> 00:12:03,410
بهینه سازی حلقه ها هستید، به عنوان مثال یا اغلب اوقات
217
00:12:03,410 –> 00:12:06,620
اهداف برداری خود را می توانید برای دیدن حلقه های توابع یا هر دو، بارها و بارها تغییر دهید، بنابراین می توانید
218
00:12:06,620 –> 00:12:09,500
فقط به حلقه ها نگاه کنید و ما به
219
00:12:09,500 –> 00:12:17,390
وضوح داریم دکمه فیلتر در اینجا، بنابراین یک
220
00:12:17,390 –> 00:12:20,450
بازگشت خوب به نمای گروهبندی، یک
221
00:12:20,450 –> 00:12:23,480
گزینه خوب برای پایتون این است که
222
00:12:23,480 –> 00:12:26,030
تابع ماژول را فراخوانی میکند و دلیل آن این است که
223
00:12:26,030 –> 00:12:31,280
در عملکرد پایتون،
224
00:12:31,280 –> 00:12:34,700
زمان زیادی در کتابخانههای بیرونی صرف میشود،
225
00:12:34,700 –> 00:12:37,610
بنابراین ممکن است بخواهید
226
00:12:37,610 –> 00:12:41,180
گروه بندی بر اساس آن یکی دیگر از موارد خوب
227
00:12:41,180 –> 00:12:44,450
پشته فراخوانی تابع رشته است
228
00:12:44,450 –> 00:12:46,580
که اگر سعی کنید تفاوت عملکردی بین رشته های شما وجود داشته باشد مفید است،
229
00:12:46,580 –> 00:12:48,980
230
00:12:48,980 –> 00:12:53,450
بنابراین اگر وارد آن شوید خواهید
231
00:12:53,450 –> 00:12:56,510
دید که اکنون اطلاعات گروه بندی شده است.
232
00:12:56,510 –> 00:12:59,120
ابتدا روی ماژول، اگر میخواهید روی
233
00:12:59,120 –> 00:13:01,490
آن ماژول کلیک کنید، تمام توابع تحت آن را مشاهده خواهید
234
00:13:01,490 –> 00:13:03,380
کرد و سپس
235
00:13:03,380 –> 00:13:08,330
میتوانید به پایینتر از پشته تماس ادامه دهید،
236
00:13:08,330 –> 00:13:13,100
اکنون نمای بالا به پایین را داریم و این نمای به
237
00:13:13,100 –> 00:13:15,770
ویژه مفید است اگر سعی میکنید
238
00:13:15,770 –> 00:13:19,490
توزیع دقیق
239
00:13:19,490 –> 00:13:21,850
زمان خود یا شما
240
00:13:21,850 –> 00:13:24,130
را که آن را در داخل کد خود خم میکند، درک کنید،
241
00:13:24,130 –> 00:13:30,220
بنابراین میتوانید در هر یک
242
00:13:30,220 –> 00:13:32,709
از این سطوح کلیک کنید و اگر روی آن دوبار کلیک کنید
243
00:13:32,709 –> 00:13:36,459
، نمایشگر منبع باز میشود
244
00:13:36,459 –> 00:13:39,009
و میبینید این منبعی است که
245
00:13:39,009 –> 00:13:42,459
من اجرا کردم و درصد
246
00:13:42,459 –> 00:13:45,459
زمان درصد کلی زمانی را که
247
00:13:45,459 –> 00:13:48,639
خط به خط می گذرانم به من نشان می دهد، بنابراین من مقدار
248
00:13:48,639 –> 00:13:50,649
زیادی از داخل جایی که ممکن است
249
00:13:50,649 –> 00:13:55,329
بخواهید اکنون وقت خود را صرف بهینه سازی آن کنید، به شما می
250
00:13:55,329 –> 00:13:59,139
دهم. آخرین نمای تماس گیرنده ای به نام
251
00:13:59,139 –> 00:14:01,149
ترک شما است و به نوعی ترکیبی است
252
00:14:01,149 –> 00:14:05,529
بین دو مورد قبلی،
253
00:14:05,529 –> 00:14:07,720
اگر عملکرد
254
00:14:07,720 –> 00:14:10,060
خاصی دارید که به آن علاقه دارید و
255
00:14:10,060 –> 00:14:13,389
در مکان های مختلف فراخوانی می شود و
256
00:14:13,389 –> 00:14:15,730
نمی خواهید به بالا به پایین بروید یا
257
00:14:15,730 –> 00:14:20,350
ب Otom-up و پیگیری کنید که اگر
258
00:14:20,350 –> 00:14:23,560
تجزیه و تحلیل مصرف حافظه را اجرا
259
00:14:23,560 –> 00:14:26,740
کنید، لیستی از
260
00:14:26,740 –> 00:14:29,980
ماژول ها و ساختارهای داده و
261
00:14:29,980 –> 00:14:32,949
اندازه های مرتبط با آنها و همچنین جدول زمانی
262
00:14:32,949 –> 00:14:34,899
از تخصیص ها و تخصیص های
263
00:14:34,899 –> 00:14:37,660
خود را دریافت خواهید کرد تا بتوانید به دست آورید. کمی
264
00:14:37,660 –> 00:14:39,910
بینش در مورد ردپای حافظه شما
265
00:14:39,910 –> 00:14:47,769
در طول زمان اجرا شما، بنابراین vtune همچنین می
266
00:14:47,769 –> 00:14:52,269
تواند کارهای MPI را نمایه کند و همچنین در
267
00:14:52,269 –> 00:14:54,790
اینجا یک پیوند به مخزن git است که
268
00:14:54,790 –> 00:14:58,860
من یک مثال از آن برداشتم و از آن استفاده می کنم،
269
00:14:58,860 –> 00:15:02,319
بنابراین دو گزینه
270
00:15:02,319 –> 00:15:05,920
برای پروفایل در اختیار دارید. بارهای کاری MPI، بنابراین
271
00:15:05,920 –> 00:15:08,139
یکی از آنها جمع آوری اطلاعات در مورد هر
272
00:15:08,139 –> 00:15:12,759
رتبه است که زمانی مفید است که ممکن است
273
00:15:12,759 –> 00:15:15,160
نوعی عدم تعادل بار داشته باشید که می دانید
274
00:15:15,160 –> 00:15:16,449
یا چیزهای مختلفی در رتبه های مختلف اتفاق می افتد، در
275
00:15:16,449 –> 00:15:21,790
حالی که اگر
276
00:15:21,790 –> 00:15:22,990
می دانید که عدم تعادل بار ندارید
277
00:15:22,990 –> 00:15:25,180
و بارگیری در تمام
278
00:15:25,180 –> 00:15:29,050
رتبهها تقریباً یکسان است،
279
00:15:29,050 –> 00:15:32,019
بهتر است فقط
280
00:15:32,019 –> 00:15:35,320
در مورد رتبه انتخاب اطلاعات جمعآوری کنید،
281
00:15:35,320 –> 00:15:37,090
مشکل دیگری که ممکن است این باشد
282
00:15:37,090 –> 00:15:40,030
که مجوزهای vtune کافی ندارید.
283
00:15:40,030 –> 00:15:45,640
برای جمع آوری هر یک از هر رتبه، بنابراین اگر
284
00:15:45,640 –> 00:15:48,490
سیستم شما از یک MPI استفاده می کند، در اصل تنها کاری که انجام می دهید این
285
00:15:48,490 –> 00:15:51,130
است که اجرای MPI
286
00:15:51,130 –> 00:15:53,440
را به دستور قبلی که
287
00:15:53,440 –> 00:16:00,180
برای V tune انجام دادیم قرار دهید و اگر می
288
00:16:00,180 –> 00:16:04,840
خواهید فقط رتبه هایی را انتخاب کنید MPI run دارای
289
00:16:04,840 –> 00:16:08,800
این است. نماد SPMD که در آن فقط MPI را
290
00:16:08,800 –> 00:16:11,980
اجرا می کنید – n تعدادی رتبه و به دنبال آن
291
00:16:11,980 –> 00:16:14,080
همه گزینه ها و در پایان
292
00:16:14,080 –> 00:16:15,940
آن فقط یک دونقطه انجام می دهید و سپس می
293
00:16: