در این مطلب، ویدئو علم داده در مقابل یادگیری ماشینی – تفاوت چیست؟ | دوره علوم داده | ادورکا با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:16:09
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,810 –> 00:00:10,610
[موسیقی]
2
00:00:10,610 –> 00:00:13,620
سلام بچهها این است لیک خودکار
3
00:00:13,620 –> 00:00:15,839
یادگیری ماشینی Rekha و علم
4
00:00:15,839 –> 00:00:17,820
داده مهمترین حوزهها در دنیای امروزی هستند.
5
00:00:17,820 –> 00:00:20,100
6
00:00:20,100 –> 00:00:21,510
7
00:00:21,510 –> 00:00:23,310
8
00:00:23,310 –> 00:00:25,890
9
00:00:25,890 –> 00:00:27,330
با توجه به اینکه
10
00:00:27,330 –> 00:00:29,250
امروز موضوع جالبی را بررسی خواهیم کرد، در
11
00:00:29,250 –> 00:00:30,990
مورد تمایز بین یادگیری ماشین
12
00:00:30,990 –> 00:00:33,149
و علم داده بحث خواهیم کرد، بنابراین بدون
13
00:00:33,149 –> 00:00:34,710
تاخیر بیشتر اجازه دهید نگاهی به دستور کار امروز بیندازیم،
14
00:00:34,710 –> 00:00:36,750
بنابراین ما می خواهیم این
15
00:00:36,750 –> 00:00:38,940
جلسه را با تعریف دقیق علم داده آغاز کنیم.
16
00:00:38,940 –> 00:00:41,160
پس از آن به ادامه می پردازیم و به این موضوع
17
00:00:41,160 –> 00:00:43,260
نگاه می کنیم که یادگیری ماشین چیست،
18
00:00:43,260 –> 00:00:45,059
به طور خلاصه در مورد زمینه هایی که
19
00:00:45,059 –> 00:00:47,340
تحت علم داده قرار می گیرند بحث می کنیم، پس از آن
20
00:00:47,340 –> 00:00:49,680
یک مورد استفاده را مورد بحث قرار می دهیم که در آن می بینیم که چگونه
21
00:00:49,680 –> 00:00:52,079
علم داده و یادگیری ماشین در
22
00:00:52,079 –> 00:00:54,449
موتورهای توصیه استفاده می شود. پس
23
00:00:54,449 –> 00:00:55,949
بیایید بدون تاخیر بیشتر،
24
00:00:55,949 –> 00:00:58,440
قبل از اینکه به جزئیات علم داده بپردازیم، با اولین موضوع خود شروع
25
00:00:58,440 –> 00:01:00,539
کنیم،
26
00:01:00,539 –> 00:01:02,820
بیایید بفهمیم علم داده چگونه
27
00:01:02,820 –> 00:01:05,459
به وجود آمد. بچه ها به یاد داشته باشید زمانی که
28
00:01:05,459 –> 00:01:07,500
بیشتر داده ها در برگه های اکسل ذخیره می شد
29
00:01:07,500 –> 00:01:09,510
، زمان های ساده تری وجود داشت، زیرا
30
00:01:09,510 –> 00:01:11,700
ما داده های کمتری تولید می کردیم و داده
31
00:01:11,700 –> 00:01:14,070
ها کاملاً ساختار یافته بودند، در آن زمان از
32
00:01:14,070 –> 00:01:16,380
ابزارهای ساده bi یا هوشمند تجاری
33
00:01:16,380 –> 00:01:19,049
برای تجزیه و تحلیل و پردازش داده ها استفاده می کردیم، اما
34
00:01:19,049 –> 00:01:22,409
زمان ها بیش از 2.5 کوئینتیلیون تغییر کرده است.
35
00:01:22,409 –> 00:01:24,750
هر روز بایت داده ایجاد میشود
36
00:01:24,750 –> 00:01:26,700
و این تعداد فقط
37
00:01:26,700 –> 00:01:29,159
از اینجا افزایش مییابد، تخمین زده میشود که تا
38
00:01:29,159 –> 00:01:32,939
سال 2020، 1.7 مگابایت داده در
39
00:01:32,939 –> 00:01:35,340
هر ثانیه برای هر فرد روی زمین ایجاد میشود،
40
00:01:35,340 –> 00:01:37,979
میتوانید تصور کنید چقدر داده است که
41
00:01:37,979 –> 00:01:39,960
چگونه پیش میرویم. برای پردازش این حجم از
42
00:01:39,960 –> 00:01:42,329
دادهها نه تنها دادههای تولید شده
43
00:01:42,329 –> 00:01:44,670
این روزها عمدتاً بدون ساختار یا
44
00:01:44,670 –> 00:01:47,009
نیمه ساختاریافته هستند، بنابراین برای پردازش
45
00:01:47,009 –> 00:01:49,259
چنین دادههایی به الگوریتمهای پیچیدهتر و
46
00:01:49,259 –> 00:01:51,479
مؤثرتری نیاز داریم،
47
00:01:51,479 –> 00:01:53,909
این دقیقاً همان جایی است که
48
00:01:53,909 –> 00:01:56,310
علم داده در علم داده آمده است.
49
00:01:56,310 –> 00:01:58,530
همه چیز در مورد کشف یافته ها از داده ها
50
00:01:58,530 –> 00:02:01,680
با کاوش داده ها در سطح دانه بندی برای
51
00:02:01,680 –> 00:02:04,140
استخراج و درک روندهای رفتاری پیچیده
52
00:02:04,140 –> 00:02:06,450
و تأثیرات آن در
53
00:02:06,450 –> 00:02:08,818
داده های مربوطه مشاهده بینشهای پنهانی
54
00:02:08,818 –> 00:02:11,190
که میتواند به شرکتها کمک کند تا
55
00:02:11,190 –> 00:02:13,050
تصمیمهای تجاری هوشمندانهتری اتخاذ کنند،
56
00:02:13,050 –> 00:02:15,180
برای مثال، مطمئن هستم که همه شما
57
00:02:15,180 –> 00:02:17,640
در حال حاضر در نتفلیکس مشاهده کردهاید.
58
00:02:17,640 –> 00:02:19,710
59
00:02:19,710 –> 00:02:22,500
60
00:02:22,500 –> 00:02:24,870
برای
61
00:02:24,870 –> 00:02:27,000
تصمیم گیری در مورد اینکه کدام سریال نتفلیکس
62
00:02:27,000 –> 00:02:29,880
به طور مشابه تولید کند، اکنون
63
00:02:29,880 –> 00:02:32,430
هدف، رفتارهای خرید هر مشتری
64
00:02:32,430 –> 00:02:35,040
را با ترسیم الگوهایی
65
00:02:35,040 –> 00:02:35,940
از پایگاه داده
66
00:02:35,940 –> 00:02:37,470
آنها مشخص می کند، خوب این به آنها کمک می کند تا
67
00:02:37,470 –> 00:02:40,050
تصمیمات بازاریابی بهتری بگیرند، اکنون که می دانید
68
00:02:40,050 –> 00:02:42,180
چرا علم داده مهم است و
69
00:02:42,180 –> 00:02:44,340
دقیقاً چیست. پیش بروید و
70
00:02:44,340 –> 00:02:47,340
درباره چیستی یادگیری ماشین بحث کنید، بنابراین بچه ها
71
00:02:47,340 –> 00:02:49,680
، ایده پشت یادگیری ماشین این است که
72
00:02:49,680 –> 00:02:52,200
شما ماشین ها را با دادن داده ها
73
00:02:52,200 –> 00:02:54,300
به آنها آموزش دهید و به آنها اجازه دهید خودشان
74
00:02:54,300 –> 00:02:57,000
بدون هیچ دخالت انسانی یاد بگیرند تا
75
00:02:57,000 –> 00:02:58,470
یادگیری ماشین را بفهمند،
76
00:02:58,470 –> 00:03:00,450
بگذارید یک سناریوی کوچک را در نظر بگیریم.
77
00:03:00,450 –> 00:03:02,460
برای برخی از
78
00:03:02,460 –> 00:03:04,500
کلاسهای اسکیت ثبتنام کردهاید و تجربه قبلی
79
00:03:04,500 –> 00:03:07,200
در اسکیت ندارید، بنابراین شروع کنید در واقع، شما
80
00:03:07,200 –> 00:03:09,300
در آن بسیار بد خواهید بود، زیرا هیچ
81
00:03:09,300 –> 00:03:11,760
ایده ای در مورد نحوه اسکیت سواری ندارید، اما با
82
00:03:11,760 –> 00:03:14,190
مشاهده و دریافت اطلاعات
83
00:03:14,190 –> 00:03:16,680
بیشتر، در آن بهتر می شوید، مشاهده تنها
84
00:03:16,680 –> 00:03:19,260
راه دیگری برای جمع آوری داده است، درست مانند
85
00:03:19,260 –> 00:03:21,510
نحوه یادگیری مشاهدات تروما و نحوه یادگیری ما انسان ها.
86
00:03:21,510 –> 00:03:23,910
تجربیاتی که ماشینها
87
00:03:23,910 –> 00:03:26,130
میتوانند به تنهایی وقتی به
88
00:03:26,130 –> 00:03:28,560
آنها داده
89
00:03:28,560 –> 00:03:30,420
میشود یاد بگیرند، این دقیقاً نحوه عملکرد یادگیری ماشینی است.
90
00:03:30,420 –> 00:03:32,790
91
00:03:32,790 –> 00:03:35,070
92
00:03:35,070 –> 00:03:37,500
93
00:03:37,500 –> 00:03:39,840
94
00:03:39,840 –> 00:03:41,910
و مشاهده
95
00:03:41,910 –> 00:03:44,100
دادههای آموزشی برای یافتن بینشها
96
00:03:44,100 –> 00:03:46,920
و الگوهای مفید به منظور ساخت مدلی
97
00:03:46,920 –> 00:03:49,200
که نتایج صحیح را پیشبینی میکند،
98
00:03:49,200 –> 00:03:51,030
بنابراین عملکرد مدل
99
00:03:51,030 –> 00:03:53,580
با استفاده از مجموعه دادههای آزمایشی ارزیابی میشود،
100
00:03:53,580 –> 00:03:55,920
اکنون این فرآیند انجام میشود تا زمانی
101
00:03:55,920 –> 00:03:57,990
که ماشین به طور خودکار یاد بگیرد و
102
00:03:57,990 –> 00:04:00,150
نقشهبرداری کند. ورودی به خروجی صحیح
103
00:04:00,150 –> 00:04:03,150
بدون هیچ دخالت انسانی
104
00:04:03,150 –> 00:04:05,100
بسیار خوب است، امیدوارم همه شما ایده خوبی در مورد آن داشته باشید
105
00:04:05,100 –> 00:04:07,410
اگر بچه ها
106
00:04:07,410 –> 00:04:09,000
می خواهید در مورد یادگیری ماشین یا علم داده بیشتر مطالعه کنید، اکنون یادگیری ماشین چیست،
107
00:04:09,000 –> 00:04:10,860
من
108
00:04:10,860 –> 00:04:12,570
پیوندها را در توضیحات می گذارم، همه می
109
00:04:12,570 –> 00:04:14,370
توانید آن ویدیوها را بررسی کنید و سپس احتمالاً
110
00:04:14,370 –> 00:04:16,560
در حال حاضر به این ویدیو بازگردید،
111
00:04:16,560 –> 00:04:19,108
اجازه دهید ادامه دهیم به موضوع بعدی
112
00:04:19,108 –> 00:04:21,000
ما قبل از شروع مقایسه بین
113
00:04:21,000 –> 00:04:23,280
یادگیری ماشین و علم داده، بیایید
114
00:04:23,280 –> 00:04:25,200
سعی کنیم زمینه های مختلفی را
115
00:04:25,200 –> 00:04:26,490
که تحت این علم تحت پوشش قرار می گیرند درک کنیم،
116
00:04:26,490 –> 00:04:28,949
اکنون علم داده طیف گسترده ای
117
00:04:28,949 –> 00:04:31,500
از حوزه ها از جمله
118
00:04:31,500 –> 00:04:33,569
یادگیری ماشینی هوش مصنوعی و
119
00:04:33,569 –> 00:04:36,030
علم داده یادگیری عمیق را در بر می گیرد. روشهای
120
00:04:36,030 –> 00:04:37,740
یادگیری ماشینی و یادگیری عمیق هوش مصنوعی
121
00:04:37,740 –> 00:04:40,349
به منظور تجزیه و تحلیل دادهها
122
00:04:40,349 –> 00:04:43,110
و سپس استخراج بینشهای مفید از آن
123
00:04:43,110 –> 00:04:45,389
برای شفافتر کردن موارد، اجازه دهید
124
00:04:45,389 –> 00:04:47,280
این اصطلاحات را برای شما تعریف کنم، بنابراین
125
00:04:47,280 –> 00:04:49,620
هوش مصنوعی اساساً زیرمجموعهای از
126
00:04:49,620 –> 00:04:51,990
علم داده است که به ماشینها اجازه میدهد
127
00:04:51,990 –> 00:04:54,240
رفتارهای انسانمانند را تحریک کنند. بسیار خوب، بنابراین
128
00:04:54,240 –> 00:04:56,030
آنها سعی می کنند از یادگیری ماشینی رفتاری شبیه به انسان تقلید کنند
129
00:04:56,030 –> 00:04:58,710
، از طرف دیگر
130
00:04:58,710 –> 00:05:00,990
زیرشاخه ای از در مصنوعی است هوشمندی
131
00:05:00,990 –> 00:05:03,360
که به ماشینها توانایی
132
00:05:03,360 –> 00:05:05,550
یادگیری خودکار و سپس
133
00:05:05,550 –> 00:05:07,440
بهبود تجربیات را بدون
134
00:05:07,440 –> 00:05:09,690
برنامهریزی صریح یا بدون
135
00:05:09,690 –> 00:05:10,860
مداخله انسانی میدهد،
136
00:05:10,860 –> 00:05:13,470
اکنون یادگیری عمیق بخشی از
137
00:05:13,470 –> 00:05:15,840
یادگیری ماشینی است که از
138
00:05:15,840 –> 00:05:18,330
معیارها و الگوریتمهای محاسباتی مختلفی با الهام از
139
00:05:18,330 –> 00:05:19,979
ساختار و عملکرد مغز استفاده
140
00:05:19,979 –> 00:05:22,860
میکند. شبکه های عصبی مصنوعی پس
141
00:05:22,860 –> 00:05:25,440
بچه ها برای نتیجه گیری علم داده
142
00:05:25,440 –> 00:05:27,090
شامل استخراج دانش از داده ها می شود
143
00:05:27,090 –> 00:05:29,940
و برای انجام این کار از مجموعه ای از
144
00:05:29,940 –> 00:05:31,320
روش های مختلف از رشته های مختلف
145
00:05:31,320 –> 00:05:32,970
مانند یادگیری ماشینی
146
00:05:32,970 –> 00:05:34,800
هوش مصنوعی و یادگیری عمیق استفاده
147
00:05:34,800 –> 00:05:36,900
می کند. نکته ای که در اینجا باید به آن اشاره کرد این است که
148
00:05:36,900 –> 00:05:39,210
علم داده یک زمینه گسترده تر است و
149
00:05:39,210 –> 00:05:41,460
منحصراً به این تکنیک ها متکی نیست،
150
00:05:41,460 –> 00:05:43,919
خوب، علم داده چیزهای بیشتری برای
151
00:05:43,919 –> 00:05:45,509
152
00:05:45,509 –> 00:05:48,210
هوش مصنوعی یادگیری ماشین و یادگیری عمیق وجود دارد تا فقط
153
00:05:48,210 –> 00:05:50,250
بخش علم داده، اکنون که
154
00:05:50,250 –> 00:05:52,169
شما تمایز واضحی بین یادگیری ماشینی هوش مصنوعی دارید.
155
00:05:52,169 –> 00:05:54,449
و یادگیری عمیق بیایید در
156
00:05:54,449 –> 00:05:56,699
مورد استفاده در اینجا بحث کنیم ما خواهیم
157
00:05:56,699 –> 00:05:58,860
دید که چگونه علم داده و
158
00:05:58,860 –> 00:06:00,930
یادگیری ماشین در کار
159
00:06:00,930 –> 00:06:03,900
موتورهای توصیه استفاده می شود، بنابراین قبل از
160
00:06:03,900 –> 00:06:05,940
اینکه با مقایسه علم داده و
161
00:06:05,940 –> 00:06:06,659
یادگیری ماشین شروع
162
00:06:06,659 –> 00:06:08,460
کنیم، بیایید نگاه کنیم که
163
00:06:08,460 –> 00:06:11,340
موتور توصیه دقیقاً چیست، بنابراین مطمئن هستم که
164
00:06:11,340 –> 00:06:13,710
همه شما از آن استفاده کرده اید. آمازون برای
165
00:06:13,710 –> 00:06:16,259
خرید آنلاین بسیار خوب است، پس بچه ها آیا متوجه شده اید
166
00:06:16,259 –> 00:06:18,180
که وقتی به دنبال یک کالای خاص
167
00:06:18,180 –> 00:06:20,699
در آمازون می گردید، توصیه
168
00:06:20,699 –> 00:06:22,919
هایی در مورد محصولات مشابه دریافت می کنید، بنابراین آمازون چگونه می
169
00:06:22,919 –> 00:06:25,020
داند که چگونه مواردی را به شما نشان می
170
00:06:25,020 –> 00:06:27,150
دهد که به علاقه شما مرتبط هستند
171
00:06:27,150 –> 00:06:29,520
، چرا که شرکت هایی مانند
172
00:06:29,520 –> 00:06:32,610
آمازون والمارت و نتفلیکس خیلی خوب کار می
173
00:06:32,610 –> 00:06:34,979
کنند به این دلیل است که چگونه
174
00:06:34,979 –> 00:06:37,050
کاربر داده های تولید شده را مدیریت می کند، همه این
175
00:06:37,050 –> 00:06:39,510
شرکت ها شرکت های داده محور هستند، بنابراین
176
00:06:39,510 –> 00:06:39,820
177
00:06:39,820 –> 00:06:42,040
تجارت آنها همیشه داده بوده است و
178
00:06:42,040 –> 00:06:43,870
به همین دلیل است که آنها در حال رشد
179
00:06:43,870 –> 00:06:45,910
بسیار هستند در حال حاضر یک سیستم توصیه
180
00:06:45,910 –> 00:06:48,580
اساسا فهرستی از انتخابها را
181
00:06:48,580 –> 00:06:51,040
برای هر کاربر بر اساس سابقه مرور وی
182
00:06:51,040 –> 00:06:53,770
بر اساس رتبهبندیهایشان بر
183
00:06:53,770 –> 00:06:55,840
اساس جزئیات نمایه جزئیات تراکنشها فیلتر میکند.
184
00:06:55,840 –> 00:06:58,870
r جزئیات و غیره اکنون از چنین
185
00:06:58,870 –> 00:07:01,480
سیستمی برای بدست آوردن بینش مفید
186
00:07:01,480 –> 00:07:03,520
در مورد الگوهای خرید مشتری استفاده
187
00:07:03,520 –> 00:07:06,760
می شود و به هر کاربر یک دید خاص
188
00:07:06,760 –> 00:07:09,040
از وب سایت تجارت الکترونیک را بر اساس
189
00:07:09,040 –> 00:07:11,380
نمایه او ارائه می دهد و به آنها اجازه می دهد تا
190
00:07:11,380 –> 00:07:14,110
محصولات مرتبط را انتخاب کنند به عنوان مثال اگر شما در
191
00:07:14,110 –> 00:07:16,930
جستجوی یک لپتاپ جدید در آمازون
192
00:07:16,930 –> 00:07:18,790
، این احتمال وجود دارد که شما هم بخواهید
193
00:07:18,790 –> 00:07:21,610
کیف لپتاپ بخرید، اکنون آمازون
194
00:07:21,610 –> 00:07:23,710
با ستارهدار کردن
195
00:07:23,710 –> 00:07:26,260
جزئیات تراکنشهای مشابه، تصمیم
196
00:07:26,260 –> 00:07:28,690
میگیرد که تراکنشهای مشابه را
197
00:07:28,690 –> 00:07:31,090
با هم نقشهبرداری کند و سپس موارد مرتبط را به شما پیشنهاد دهد.
198
00:07:31,090 –> 00:07:32,740
199
00:07:32,740 –> 00:07:34,270
در حال حاضر بیایید ببینیم چگونه علم داده و
200
00:07:34,270 –> 00:07:36,010
یادگیری ماشین برای ساختن یک
201
00:07:36,010 –> 00:07:38,350
موتور توصیه استفاده می شود، بنابراین بچه ها
202
00:07:38,350 –> 00:07:41,290
این کل چرخه عمر علم داده است، اکنون
203
00:07:41,290 –> 00:07:42,520
با الزامات تجاری شروع می شود،
204
00:07:42,520 –> 00:07:43,270
205
00:07:43,270 –> 00:07:45,760
قبل از اینکه حتی یک پروژه علم داده را شروع
206
00:07:45,760 –> 00:07:47,590
کنید، بسیار مهم است
207
00:07:47,590 –> 00:07:49,120
که شما مشکلی را
208
00:07:49,120 –> 00:07:50,770
که سعی در حل آن دارید خوب درک می کنید، بنابراین در
209
00:07:50,770 –> 00:07:52,480
این مرحله
210
00:07:52,480 –> 00:07:55,330
هدف اصلی پروژه خود را در c ما شناسایی می کنید.
211
00:07:55,330 –> 00:07:57,040
از آنجایی که هدف ساخت یک
212
00:07:57,040 –> 00:07:59,200
موتور توصیه است که
213
00:07:59,200 –> 00:08:02,260
آیتم های مرتبط را به هر مشتری بر
214
00:08:02,260 –> 00:08:04,300
اساس داده های تولید شده توسط آنها پیشنهاد می کند، اکنون
215
00:08:04,300 –> 00:08:06,700
مرحله دوم جمع آوری داده ها یا جمع آوری داده ها است،
216
00:08:06,700 –> 00:08:09,010
بنابراین پس از اینکه
217
00:08:09,010 –> 00:08:11,110
اهداف پروژه خود را مشخص کردید، زمان
218
00:08:11,110 –> 00:08:13,570
شروع به جمع آوری داده ها است. این فرآیند
219
00:08:13,570 –> 00:08:16,240
همچنین به عنوان داده کاوی داده کاوی نیز شناخته
220
00:08:16,240 –> 00:08:18,310
221
00:08:18,310 –> 00:08:21,340
222
00:08:21,340 –> 00:08:23,200
223
00:08:23,200 –> 00:08:25,300
می شود.
224
00:08:25,300 –> 00:08:28,090
225
00:08:28,090 –> 00:08:30,280
موتور توصیه
226
00:08:30