در این مطلب، ویدئو [3] وارد کردن صورتهای مالی از یک صفحه وب با استفاده از پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:27
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,540 –> 00:00:05,069
سلام به همه، این حسابدار پایتونیک است
2
00:00:05,069 –> 00:00:08,519
و امروز ما قصد داریم
3
00:00:08,519 –> 00:00:11,340
نگاهی به گرفتن داده ها از یک
4
00:00:11,340 –> 00:00:14,490
فایل HTML در اینترنت بیندازیم و می توانید همین الان در
5
00:00:14,490 –> 00:00:16,650
مقابل شما ببینید که ما گوگل را داریم
6
00:00:16,650 –> 00:00:20,189
یا در واقع اکنون 10k عبارت از حروف الفبا
7
00:00:20,189 –> 00:00:24,480
است. 31 دسامبر 2018 و
8
00:00:24,480 –> 00:00:26,130
کاری که ما انجام می دهیم این است که به
9
00:00:26,130 –> 00:00:29,010
بخش صورت های مالی و
10
00:00:29,010 –> 00:00:31,529
ترازنامه های تلفیقی می رویم و
11
00:00:31,529 –> 00:00:33,719
نشان خواهیم داد که چگونه می توانید از پایتون و
12
00:00:33,719 –> 00:00:37,440
کتابخانه پانداها برای گرفتن داده ها از
13
00:00:37,440 –> 00:00:41,219
این جدول در اینجا استفاده کنید. به آن دسترسی داشته باشید تا
14
00:00:41,219 –> 00:00:43,440
بتوانید اکنون برخی از کارها را انجام دهید
15
00:00:43,440 –> 00:00:46,649
توجه داشته باشید که نوعی
16
00:00:46,649 –> 00:00:50,090
استانداردهای XBRL اخیراً پیادهسازی شده وجود دارد که
17
00:00:50,090 –> 00:00:52,980
دادهها را از این استانداردها استاندارد میکند و
18
00:00:52,980 –> 00:00:55,110
ما امروز آن را پوشش
19
00:00:55,110 –> 00:00:57,120
نمیدهیم، اما شاید پوشش دهیم. در یک ویدیوی آینده،
20
00:00:57,120 –> 00:00:59,460
اما هدف امروز این است
21
00:00:59,460 –> 00:01:01,260
که نشان دهد چگونه می توان
22
00:01:01,260 –> 00:01:04,650
داده ها را از جداول HTML دریافت کرد، بنابراین ما ادامه می دهیم
23
00:01:04,650 –> 00:01:07,799
و اولین کاری که باید انجام دهید این است که اگر
24
00:01:07,799 –> 00:01:09,090
25
00:01:09,090 –> 00:01:11,700
ویدیوهای قبلی خود را دنبال کرده اید. باید یک
26
00:01:11,700 –> 00:01:16,979
کتابخانه جدید نصب کنید ry که El XML نامیده می شود، بنابراین
27
00:01:16,979 –> 00:01:20,220
اساساً روشی که شما آن را انجام می دهید این است که Conda
28
00:01:20,220 –> 00:01:22,770
install el XML را تایپ می کنید، من قبلاً این کار را در اینجا انجام داده
29
00:01:22,770 –> 00:01:25,500
ام و بسته El XML را نصب
30
00:01:25,500 –> 00:01:27,270
می کند، کاری که انجام می دهد این است که به پایتون اجازه می دهد
31
00:01:27,270 –> 00:01:33,200
تا بتواند به دادههای HTML
32
00:01:33,200 –> 00:01:37,560
را با استفاده از پانداها و جداول چنگ زدن
33
00:01:37,560 –> 00:01:40,020
بخوانم، بنابراین من قبلاً El XML را نصب
34
00:01:40,020 –> 00:01:41,490
کردهام و نوتبوک Jupiter خود را بارگیری کردهام
35
00:01:41,490 –> 00:01:44,909
و به این ترتیب میرویم، بنابراین قبلاً مقداری
36
00:01:44,909 –> 00:01:46,500
کد را در این برگه دیگر نوشتم، اما
37
00:01:46,500 –> 00:01:48,090
سعی میکنم آن را از ابتدا بنویسم. در
38
00:01:48,090 –> 00:01:50,460
اینجا تا بتوانید دنبال کنید، من
39
00:01:50,460 –> 00:01:53,729
یک نکته را یادداشت کردم که در
40
00:01:53,729 –> 00:01:55,890
غیر این صورت نیاز به تحقیق کمی دارد
41
00:01:55,890 –> 00:01:57,930
و در عرض یک دقیقه خواهید دید که در واقع
42
00:01:57,930 –> 00:02:01,500
تعداد زیادی جدول HTML در این فایل وجود دارد
43
00:02:01,500 –> 00:02:04,170
و کتابخانه pandas همه آنها
44
00:02:04,170 –> 00:02:07,049
را می گیرد. به جای اینکه مجبور باشم مرور
45
00:02:07,049 –> 00:02:09,479
کنم و وقت خود را برای فهمیدن اینکه کدام
46
00:02:09,479 –> 00:02:11,720
جدول مناسب است، ادامه دادم
47
00:02:11,720 –> 00:02:13,580
و شماره جدول
48
00:02:13,580 –> 00:02:15,050
را یادداشت کردم، بنابراین فقط یک دقیقه به شما نشان خواهم داد که چه
49
00:02:15,050 –> 00:02:16,790
شکلی است، بنابراین ابتدا می خواهیم
50
00:02:16,790 –> 00:02:22,040
وارد کنیم. پانداها به عنوان PD سپس ما می خواهیم
51
00:02:22,040 –> 00:02:25,640
مکان این URL را بگیریم و
52
00:02:25,640 –> 00:02:29,870
فقط آن را در URL قرار دهید، اکنون ما
53
00:02:29,870 –> 00:02:33,770
URL را در قاب داده می خوانیم تا DF برابر با
54
00:02:33,770 –> 00:02:39,050
PD برای خواندن URL HTML باشد و این یک دقیقه طول می کشد
55
00:02:39,050 –> 00:02:40,370
زیرا اکنون در حال بررسی
56
00:02:40,370 –> 00:02:43,400
و خواندن تمام HTML و یافتن
57
00:02:43,400 –> 00:02:45,110
همه جداول و حالا بیایید همه آنها را
58
00:02:45,110 –> 00:02:47,990
بگیریم تا ببینیم تعداد آنها چقدر است و
59
00:02:47,990 –> 00:02:52,880
تعداد 382 عدد وجود دارد که ما شماره 238 را می خواهیم، بنابراین من چن
60
00:02:52,880 –> 00:02:54,080
مورد از این موارد را قب
61
00:02:54,080 –> 00:02:58,340
از شیرجه زدن به شما نشان می دهم تا ببینیم اولین مو
62
00:02:58,340 –> 00:03:01,940
د صفر خواهد بود و این یکی نش
63
00:03:01,940 –> 00:03:03,890
ن دهنده چیست فقط اولین
64
00:03:03,890 –> 00:03:05,690
چیزی که شبیه یک جدول است،
65
00:03:05,690 –> 00:03:07,010
واقعاً داده های زیادی در آن نیست، بنابراین
66
00:03:07,010 –> 00:03:07,880
فوق العاده مفید نیست،
67
00:03:07,880 –> 00:03:11,690
بیایید بگیریم شاید بیستمین مورد را ببینیم
68
00:03:11,690 –> 00:03:13,970
که به نظر می رسد بله هنوز خیلی
69
00:03:13,970 –> 00:03:17,660
مفید نیست، ببینید بسیاری از اینها نوعی هستند.
70
00:03:17,660 –> 00:03:21,590
چیزی که برای پانداها شبیه میز به نظر می رسد،
71
00:03:21,590 –> 00:03:25,489
اما واقعاً یک میز واقعی نیست، بنابراین بسیار
72
00:03:25,489 –> 00:03:27,260
خوب، فکر می کنم ما برای این کار کافی بودیم، بیایید
73
00:03:27,260 –> 00:03:29,959
جلوتر برویم و به 2:38 جلو برویم،
74
00:03:29,959 –> 00:03:32,989
زیرا می دانیم که این همان میزی است که ما می خواهیم و من فقط
75
00:03:32,989 –> 00:03:36,560
می خواهم سر را انجام دهید و اکنون می توانید ببینید که
76
00:03:36,560 –> 00:03:39,260
ما چیزی در اینجا داریم، اما در این زمینه فوق العاده
77
00:03:39,260 –> 00:03:41,450
مفید نیست فرمت فعلی من
78
00:03:41,450 –> 00:03:42,950
در واقع این را به
79
00:03:42,950 –> 00:03:44,660
10 ردیف اول یا سرهایی که می توانید کمی بیشتر ببینید گسترش می
80
00:03:44,660 –> 00:03:47,690
دهم، بنابراین اجازه دهید نگاهی به
81
00:03:47,690 –> 00:03:49,880
آنچه در اینجا می بینیم در مقایسه با آنچه
82
00:03:49,880 –> 00:03:52,940
در صفحه وب دیدیم بیندازیم تا بتوانید شما را ببینید.
83
00:03:52,940 –> 00:03:54,709
اولین ستون شما را دارم که به
84
00:03:54,709 –> 00:03:57,350
نوعی عنوان ناحیه حساب شما را دارد
85
00:03:57,350 –> 00:04:00,530
و با این
86
00:04:00,530 –> 00:04:03,080
ستون مطابقت دارد، سپس ما چیزهای خندهداری داریم
87
00:04:03,080 –> 00:04:04,459
که در اینجا اتفاق میافتد، شما به
88
00:04:04,459 –> 00:04:06,739
نوعی دو ستون دارید که نشاندهنده شما
89
00:04:06,739 –> 00:04:09,860
هستند. تاریخ سال قبل و سال جاری است،
90
00:04:09,860 –> 00:04:12,739
اما در اینجا شما چیزی
91
00:04:12,739 –> 00:04:16,519
شبیه به سه ستون برای هر سال دارید و می
92
00:04:16,519 –> 00:04:19,430
توانید ببینید که این دو تا از آنها را بیشتر می شناسید که
93
00:04:19,430 –> 00:04:21,200
94
00:04:21,200 –> 00:04:23,360
در برخی موارد اعداد با هم مطابقت دارند. علامت دلار
95
00:04:23,360 –> 00:04:24,480
در مورد اول نشان داده می
96
00:04:24,480 –> 00:04:26,190
شود اما در دومی نه و
97
00:04:26,190 –> 00:04:28,260
بعد به نظر می رسد هیچ چیز
98
00:04:28,260 –> 00:04:30,720
اینجا در سومین اتفاق نمی افتد، اما بعداً می
99
00:04:30,720 –> 00:04:34,050
توانید ببینید که آیا شاید اگر داستان را انجام دهم می توانید
100
00:04:34,050 –> 00:04:37,950
ببینید که پرانتز بسته
101
00:04:37,950 –> 00:04:39,810
در نهایت اینجا نشان داده می شود. می رویم که
102
00:04:39,810 –> 00:04:41,550
پرانتز بسته در ستون سوم نشان داده می شود
103
00:04:41,550 –> 00:04:44,130
بنابراین واقعاً فکر میکنم تمام دادههای مورد نیاز ما
104
00:04:44,130 –> 00:04:47,370
در این ستون دوم هر سال است
105
00:04:47,370 –> 00:04:50,160
و این یک منفی است، اما کاری که
106
00:04:50,160 –> 00:04:53,430
میتوانید انجام دهید این است که پرانتز باز منفی را
107
00:04:53,430 –> 00:04:55,260
با یک نماد منفی واقعی جایگزین کنید،
108
00:04:55,260 –> 00:04:57,180
بنابراین من آن را در عرض یک دقیقه ورق میکنم تا این کار را انجام
109
00:04:57,180 –> 00:04:59,310
دهد. فکر میکنم کاری که
110
00:04:59,310 –> 00:05:02,450
میخواهیم انجام دهیم این است که جلو برویم و بگوییم
111
00:05:02,450 –> 00:05:06,120
بیایید فقط ستون دوم را بگیریم،
112
00:05:06,120 –> 00:05:09,960
مثلاً ستون صفر دو را میخواهیم و شش
113
00:05:09,960 –> 00:05:11,780
آنها هستند که به آنها اهمیت میدهیم، پس
114
00:05:11,780 –> 00:05:16,290
بیایید جلو برویم و بگوییم بیایید تعادل را ببینیم.
115
00:05:16,290 –> 00:05:26,490
برگهها برابر با 238 فهرست ستون
116
00:05:26,490 –> 00:05:35,310
صفر دو و شش است، بیایید ببینیم چه
117
00:05:35,310 –> 00:05:40,140
شکلی است و به نظر خوب
118
00:05:40,140 –> 00:05:42,270
119
00:05:42,270 –> 00:05:44,250
120
00:05:44,250 –> 00:05:46,350
میرسد.
121
00:05:46,350 –> 00:05:50,010
122
00:05:50,010 –> 00:05:59,480
ستونهای نقطهای ترازنامه برابر است بیایید حساب 12 31 17
123
00:05:59,480 –> 00:06:05,840
و 12 31 18 را انجام
124
00:06:07,819 –> 00:06:10,649
دهیم و اکنون بهتر به
125
00:06:10,649 –> 00:06:12,749
نظر میرسد این است که از شر
126
00:06:12,749 –> 00:06:16,319
هر یک از ردیفهایی که دارای NA هستند خلاص
127
00:06:16,319 –> 00:06:18,659
میشویم زیرا واقعاً اینطور نیست. به آنهایی نیاز داریم که
128
00:06: