نرم افزار تشخیص کاراکتر نوری OCR
به روز رسانی شده در ۱۴۰۳/۱۱/۱۸ زمان مطالعه 10 دقیقه
نرمافزار تشخیص کاراکتر نوری یا نرمافزار OCR، تصاویر متن چاپ شده، دستنویس یا تایپشده را به فرمت متنی دیجیتالی قابل ویرایش کامپیوتری، معمولاً ASCII، ترجمه میکند. سپس میتوان متن دیجیتال را باز کرد و با نرمافزار انتشار رومیزی، پردازش کلمه و سایر برنامههای رایانهای استفاده کرد. این فرآیند به اسکن به متن نیز معروف است. سازمانها از نرمافزار تشخیص کاراکتر نوری برای کاهش خطاهای ورود دادهها و سرعت بخشیدن به پردازش کاغذهای قدیمی یا آرشیوهای مبتنی بر تصویر استفاده میکنند.
نرم افزار OCR با تجزیه و تحلیل یک سند و مقایسه متن با تمام فونت های متن مختلف ذخیره شده در پایگاه داده نرم افزار یا با یادداشت اشکال و ویژگی های مشترک برای اکثر کاراکترها کار می کند. سپس یک سند متنی بر اساس کاراکترهایی که تشخیص داده است ایجاد می کند.
نمایش همه تولیدکنندگان نرم افزار تشخیص کاراکتر نوری (OCR).
مانند بسیاری از فرآیندهای دیجیتال، دستگاههای OCR از ماشینهای سختافزار اختصاصی با بردهای مدار تخصصی و توان محاسباتی و ذخیرهسازی محدود به فرآیندهای مبتنی بر نرمافزار فعلی تکامل یافتهاند. این تغییر از طریق پیشرفت در قدرت، سرعت و ذخیره سازی رایانه های شخصی انجام شد. امروزه نرم افزار OCR را می توان بر روی بسیاری از رایانه های مختلف متصل به دستگاه های اسکن مختلف استفاده کرد. این تطبیق پذیری مزیت اصلی یک سیستم مبتنی بر نرم افزار در مقابل ماشین های OCR اختصاصی قدیمی است.
اکثر رایانههای دارای سیستم عامل ویندوز دارای یک برنامه اولیه OCR هستند که در برنامه استاندارد مشاهده فکس عکس تعبیه شده است که با یک اسکنر استاندارد با قابلیت رایانه کار میکند. نسخه های متن باز رایگان یا ارزان قیمت نیز در وب وجود دارد. این برنامهها برای استفاده شخصی مناسب هستند، اما ممکن است برای استفادههای سنگین حرفهای یا برای تصاویری که خوانا نیستند، مناسب نباشند. همچنین، وب سایت هایی وجود دارند که تبدیل رایگان برای تصاویر آپلود شده ارائه می دهند. با این حال، وب سایت های رایگان ممکن است امنیت پایینی داشته باشند یا بسیار کند باشند.
نرم افزار OCR می تواند تصاویر اسکن شده را به فایل های PDF قابل جستجو تبدیل کند. این در بیشتر موارد برای ایجاد رکوردهای دیجیتال مدرن از بایگانی های کاغذی سنتی یا به طور کلی برای تبدیل رسانه های قدیمی به رسانه های جدید استفاده می شود. آنها همچنین می توانند یک فایل تصویر دیجیتال مانند JPEG، GIF یا PNG ایجاد کنند، اگر متن قابل اسکن وجود نداشته باشد، یا اگر کاغذ تماماً تصویر باشد. نرم افزار OCR همچنین می تواند فایل های اکسل را از جداول چاپ شده یا فایل های HTML را از متن و طرح بندی تصویر پیچیده ایجاد کند و فایل های باینری تصویر را با محتوای متن و برچسب ها ترکیب کند. فرمت خروجی پیش فرض برای نرم افزار OCR معمولا یک فایل PDF است.
ویژگی ها
نرم افزار OCR با ویژگی های متنوعی در دسترس است که به بهترین وجه با برنامه مورد نظر مطابقت دارد.
معیارهای انتخاب قابل تنظیم به کاربر این امکان را می دهد که یک سند کامل را برای اسکن انتخاب کند یا بخش ها یا فصل های خاص را انتخاب کند.
ویژگی های جستجو در بین سیستم های OCR متفاوت است. برخی از نرمافزارهای تشخیص کاراکتر نوری اجازه میدهند دادههای پس از جستجو برای استفاده در آینده ذخیره شوند. پس از انتخاب متن، OCR، نرم افزار هر کاراکتر را تحلیل و تفسیر می کند. سپس نرم افزار OCR کل کلمات را بررسی می کند و آنها را با فرهنگ لغت استاندارد و/یا سفارشی مطابقت می دهد.
برخی از نرمافزارهای OCR و سیستمهای OCR میتوانند خروجیهای قالببندی شدهای را تولید کنند که از نظر تصاویر، ستونها و سایر اجزای غیر متنی به سند اصلی نزدیک است.
تشخیص الگو ، هوش مصنوعی و بینایی ماشین برای تبدیل تصاویر اسکن شده به متن استفاده می شود که سپس به پایگاه های داده قابل جستجو اضافه می شود. این اجازه می دهد تا تصاویر اسکن شده را بر اساس محتوای آنها بازیابی کنید.
ملاحظات اضافی هنگام انتخاب نرم افزار تشخیص کاراکتر نوری شامل کیفیت و کنتراست تصویر اسکن شده است. به عنوان یک قاعده، تشخیص تصاویر کثیف یا آسیب دیده یا چاپ شده روی کاغذ چروک برای نرم افزار OCR دشوارتر است. تضاد بین متن و پسزمینه عامل اصلی است. به عنوان مثال، اسنادی که از متن سیاه در مقابل پسزمینه سفید تشکیل شدهاند، کنتراست 100% را ارائه میکنند، بنابراین احتمال اینکه نرمافزار تشخیص کاراکتر نوری، OCR، متن را به درستی تفسیر کند، افزایش مییابد.
مشخصات
اینها مهمترین جنبه هایی هستند که باید در بسته نرم افزاری تشخیص کاراکتر نوری جستجو کنید:
دقت تشخیص کاراکتر
دقت بازسازی طرح بندی صفحه
پشتیبانی از چندین زبان
سازگاری با سرعت و سیستم عامل کامپیوتر میزبان
پشتیبانی از خروجی های pdf. قابل جستجو و همچنین فرمت های HTML، XLS و دیگر
کیفیت رابط کاربری
پشت رابط هر نرم افزار OCR یک موتور تشخیص کاراکتر است که کار تبدیل تصاویر به متن را انجام می دهد. بهترین رابط کاربری گرافیکی (GUI) یا انواع گزینههای خروجی نمیتواند محدودیتهای یک موتور تشخیص OCR را در پشت آن جبران کند. کیفیت موتور تشخیص مهمترین جنبه ای است که باید در تصمیمات خرید نرم افزار OCR در نظر گرفت.
منبع