نرم افزار تشخیص کاراکتر نوری OCR

به روز رسانی شده در ۱۴۰۳/۱۱/۱۸ زمان مطالعه 10 دقیقه

 

نرم افزار تشخیص کاراکتر نوری از اسمارت سافتنرم‌افزار تشخیص کاراکتر نوری یا نرم‌افزار OCR، تصاویر متن چاپ شده، دست‌نویس یا تایپ‌شده را به فرمت متنی دیجیتالی قابل ویرایش کامپیوتری، معمولاً ASCII، ترجمه می‌کند. سپس می‌توان متن دیجیتال را باز کرد و با نرم‌افزار انتشار رومیزی، پردازش کلمه و سایر برنامه‌های رایانه‌ای استفاده کرد. این فرآیند به اسکن به متن نیز معروف است. سازمان‌ها از نرم‌افزار تشخیص کاراکتر نوری برای کاهش خطاهای ورود داده‌ها و سرعت بخشیدن به پردازش کاغذهای قدیمی یا آرشیوهای مبتنی بر تصویر استفاده می‌کنند.

نرم افزار OCR با تجزیه و تحلیل یک سند و مقایسه متن با تمام فونت های متن مختلف ذخیره شده در پایگاه داده نرم افزار یا با یادداشت اشکال و ویژگی های مشترک برای اکثر کاراکترها کار می کند. سپس یک سند متنی بر اساس کاراکترهایی که تشخیص داده است ایجاد می کند.

نمایش همه تولیدکنندگان نرم افزار تشخیص کاراکتر نوری (OCR).

مانند بسیاری از فرآیندهای دیجیتال، دستگاه‌های OCR از ماشین‌های سخت‌افزار اختصاصی با بردهای مدار تخصصی و توان محاسباتی و ذخیره‌سازی محدود به فرآیندهای مبتنی بر نرم‌افزار فعلی تکامل یافته‌اند. این تغییر از طریق پیشرفت در قدرت، سرعت و ذخیره سازی رایانه های شخصی انجام شد. امروزه نرم افزار OCR را می توان بر روی بسیاری از رایانه های مختلف متصل به دستگاه های اسکن مختلف استفاده کرد. این تطبیق پذیری مزیت اصلی یک سیستم مبتنی بر نرم افزار در مقابل ماشین های OCR اختصاصی قدیمی است.

اکثر رایانه‌های دارای سیستم عامل ویندوز دارای یک برنامه اولیه OCR هستند که در برنامه استاندارد مشاهده فکس عکس تعبیه شده است که با یک اسکنر استاندارد با قابلیت رایانه کار می‌کند. نسخه های متن باز رایگان یا ارزان قیمت نیز در وب وجود دارد. این برنامه‌ها برای استفاده شخصی مناسب هستند، اما ممکن است برای استفاده‌های سنگین حرفه‌ای یا برای تصاویری که خوانا نیستند، مناسب نباشند. همچنین، وب سایت هایی وجود دارند که تبدیل رایگان برای تصاویر آپلود شده ارائه می دهند. با این حال، وب سایت های رایگان ممکن است امنیت پایینی داشته باشند یا بسیار کند باشند.

نرم افزار OCR می تواند تصاویر اسکن شده را به فایل های PDF قابل جستجو تبدیل کند. این در بیشتر موارد برای ایجاد رکوردهای دیجیتال مدرن از بایگانی های کاغذی سنتی یا به طور کلی برای تبدیل رسانه های قدیمی به رسانه های جدید استفاده می شود. آنها همچنین می توانند یک فایل تصویر دیجیتال مانند JPEG، GIF یا PNG ایجاد کنند، اگر متن قابل اسکن وجود نداشته باشد، یا اگر کاغذ تماماً تصویر باشد. نرم افزار OCR همچنین می تواند فایل های اکسل را از جداول چاپ شده یا فایل های HTML را از متن و طرح بندی تصویر پیچیده ایجاد کند و فایل های باینری تصویر را با محتوای متن و برچسب ها ترکیب کند. فرمت خروجی پیش فرض برای نرم افزار OCR معمولا یک فایل PDF است.

ویژگی ها

نرم افزار OCR با ویژگی های متنوعی در دسترس است که به بهترین وجه با برنامه مورد نظر مطابقت دارد.

  • معیارهای انتخاب قابل تنظیم به کاربر این امکان را می دهد که یک سند کامل را برای اسکن انتخاب کند یا بخش ها یا فصل های خاص را انتخاب کند.

  • ویژگی های جستجو در بین سیستم های OCR متفاوت است. برخی از نرم‌افزارهای تشخیص کاراکتر نوری اجازه می‌دهند داده‌های پس از جستجو برای استفاده در آینده ذخیره شوند. پس از انتخاب متن، OCR، نرم افزار هر کاراکتر را تحلیل و تفسیر می کند. سپس نرم افزار OCR کل کلمات را بررسی می کند و آنها را با فرهنگ لغت استاندارد و/یا سفارشی مطابقت می دهد.

  • برخی از نرم‌افزارهای OCR و سیستم‌های OCR می‌توانند خروجی‌های قالب‌بندی شده‌ای را تولید کنند که از نظر تصاویر، ستون‌ها و سایر اجزای غیر متنی به سند اصلی نزدیک است.

  • تشخیص الگو ، هوش مصنوعی و بینایی ماشین برای تبدیل تصاویر اسکن شده به متن استفاده می شود که سپس به پایگاه های داده قابل جستجو اضافه می شود. این اجازه می دهد تا تصاویر اسکن شده را بر اساس محتوای آنها بازیابی کنید.

ملاحظات اضافی هنگام انتخاب نرم افزار تشخیص کاراکتر نوری شامل کیفیت و کنتراست تصویر اسکن شده است. به عنوان یک قاعده، تشخیص تصاویر کثیف یا آسیب دیده یا چاپ شده روی کاغذ چروک برای نرم افزار OCR دشوارتر است. تضاد بین متن و پس‌زمینه عامل اصلی است. به عنوان مثال، اسنادی که از متن سیاه در مقابل پس‌زمینه سفید تشکیل شده‌اند، کنتراست 100% را ارائه می‌کنند، بنابراین احتمال اینکه نرم‌افزار تشخیص کاراکتر نوری، OCR، متن را به درستی تفسیر کند، افزایش می‌یابد.

مشخصات

اینها مهمترین جنبه هایی هستند که باید در بسته نرم افزاری تشخیص کاراکتر نوری جستجو کنید:

  • دقت تشخیص کاراکتر

  • دقت بازسازی طرح بندی صفحه

  • پشتیبانی از چندین زبان

  • سازگاری با سرعت و سیستم عامل کامپیوتر میزبان

  • پشتیبانی از خروجی های pdf. قابل جستجو و همچنین فرمت های HTML، XLS و دیگر

  • کیفیت رابط کاربری

پشت رابط هر نرم افزار OCR یک موتور تشخیص کاراکتر است که کار تبدیل تصاویر به متن را انجام می دهد. بهترین رابط کاربری گرافیکی (GUI) یا انواع گزینه‌های خروجی نمی‌تواند محدودیت‌های یک موتور تشخیص OCR را در پشت آن جبران کند. کیفیت موتور تشخیص مهمترین جنبه ای است که باید در تصمیمات خرید نرم افزار OCR در نظر گرفت.

منبع

 

globalspec


نرم افزار تشخیص کاراکتر نوری OCR

محل تبلیغات شما
سرویس تبلیغات تکصان
تبلغات مبتنی بر نوع بازدید کننده و محل بازدید
با ما در تماس باشید و تبلیغات هدف دار و هوشمند به مشتری اصلی را ارائه کنید.