معرفی
در این مقاله با یکی از سرویس های مدیریت شده توسط AWS به نام سرویس Rekognition آشنا می شویم. این سرویس یک سرویس جامع تشخیص اشیا است که می تواند متن را در تصاویر نیز تشخیص دهد.
درباره خدمات مدیریت شده شناخت
آمازون Rekognition می تواند متن را در تصاویر و ویدیوها تشخیص دهد. سپس می تواند متن شناسایی شده را به متن قابل خواندن توسط ماشین تبدیل کند. برای پیاده سازی راه حل ها می توانید از تشخیص متن قابل خواندن توسط ماشین در تصاویر استفاده کنید. این راه حل قرار است در سناریوهای زیر استفاده شود
- جستجوی بصری
- فیلتر کردن متن
- جستجوی محتوا در کلیپ های ویدئویی
- و خیلی بیشتر
این سرویس برای شناسایی کلمات در چند زبان مانند انگلیسی، عربی، روسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی و اسپانیایی طراحی شده است.
چرا Rekognition از سرویس TextReader قدرتمندتر است؟
Amazon Texttract یک سرویس جدیدتر AWS است که به عنوان یک راه حل هدفمند برای مشکل OCR (تشخیص کاراکتر نوری) در تصاویر اسناد و PDF ایجاد شده است. در حالی که Rekognition یک سرویس بینایی کامپیوتری قابل تعمیم تر است، Textract دارای پارامترهای تنظیم OCR گرا برای بهینه سازی فرآیند استخراج دقیق و موثر متن است.
خارج از جعبه، اگر تمام تلاش شما این است که متن و ابرداده مربوطه (مختصات، زاویه، مقدار اطمینان) را شناسایی کنید، Rekognition
روش به احتمال زیاد مشابه مشابه عمل خواهد کرد
روش در متن با این حال، Textract ساختار معنایی بیشتری را ارائه میکند که به تنظیم/قالببندی متن کمک میکند که سایر اشکال پسپردازش را که توسعهدهنده بهطور سنتی نیاز به نوشتن آنها دارند، انتزاع میکند.
در نهایت، هنگام مقایسه هزینههای دو روش Detect Text، Texttract کمی بیشتر از Rekognition (1.00 دلار/1k تصویر) هزینه بیشتری دارد (1.50$/1k تصویر).