| صفحه اصلی || تماس با ما || درباره ما || نقشه سايت || معرفی و ثبت سایت || حمایت از ما || تبادل لینک || تبلیغات با ما || حمایت مالی |
| تبدیل آنلاین عکس و فایلهای pdf به متن - Online OCR |
|
|
|
| وب و اینترنت - خدمات آنلاین |
| نوشته شده توسط مدیر سایت |
| چهارشنبه ۰۹ آذر ۱۳۹۰ ساعت ۰۷:۵۵ |
|
مقدمه: ...فکر معرفی این سایتها زمانی به ذهنم رسید که یکی از دوستانم از من درخواست تایپ چند صفحه متن انگلیسی که به صورت فایل اسکن شده(تصویر) از روی یک کتاب مرجع بود نمود و اینکه می خواست تا فردا هم متن تایپ شده اش آماده باشد! من هم از طرفی مشغله درسی و کاری داشتم و از طرفی هم نمی خواستم دوستم از دستم ناراحت شود! خوب حالا باید چه کار می کردم؟؟!! همیشه بهترین فکر این است که یک نفر را پیدا کنید که به جای شما تایپ کند و شما هم درستان را بخوانید!!
آشنایی با فن آوری تشخیص نوری کاراکترها...
فن آوری OCR (تشخیص نوری نویسهها) مخفف واژگان Optical Character Recognition عبارت است از شناسایی خودکار متون موجود در تصاویر و اسناد و تبدیل آنها به متون قابل
واژهٔ OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته میشد. پسوند نوری(Optical) در این عبارت در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمیتر بازشناسی نویسهها با مرکب مغناطیسی،MICR، متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روشهای بازشناسی دستنوشته و متون چاپی مطرح شدند که دامنهٔ کار را به کلمات و عبارات رساندند. با وجود عدم تطبیق دقیق OCR با این موارد، این نام برای این روشها و تا حدی برای بازشناسی دستنوشتههای برخط هم استفاده شد و رواج پیدا کرد. هماکنون OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتابها، مجلهها و نامههای چاپی به که عمدتا به صورت فایلهای PDF می باشند به کار میبرند.
سامانهٔ(نرم افزار و یا یک سرویس آنلاین) نویسهخوان مثل یک نفر ماشیننویس، متن سند را میخواند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل میکند. معمولاً یک روبشگر، تصویر سند را برای OCR فراهم میکند. سامانهٔ نویسهخوان، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، شناسایی کرده و رشتهی متناظر با آنها را در قالب مناسب ذخیره میکند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانهٔ نویسهخوان بسیار کم حجم و قابل جستجو مانند یک فایل متن Txt و یا Doc است.
سامانههای نویسهخوان مثل بسیاری از سامانههای هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو پایهٔ اصلی این سامانهها هستند. پیچیدگی این سامانهها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن OCR برای زبانهای لاتین به دلیل اینکه حروف آنها به طور مجزا نوشته میشود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر میچسبند. این موضوع به علاوهٔ جمعیت کم کاربران زبان فارسی، سبب شده سامانههای نویسهخوان قدرتمندی برای زبان فارسی نداشته باشیم. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمینهٔ پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شده است. منبع: صفحه تشخیص نوری نویسه ها در ویکی پدیا فارسی.
لیستی از سایتهای تبدیل آنلاین فایل به متن:
آموزش نحوه ی استفاده از این فن آوری...
برای استفاده از این تکنولوژی شما باید کارهای زیر را انجام دهید: 1- یک تصویر واضح از صفحه مورد نظرتان حالا چه بوسیله دوربین عکاسی، دوربین موبایل و یا اسکنر تهیه نمایید. 2- فایل مورد نظرتان را در یک از سایتهایی که در بالا معرفی شده اند آپلود نمایید. 3- بر روی گزینه مشخص شده برای دریافت خروجی به صورت متن کلیک کرده و منتظر بمانید تا سایت کار خودش را انجام دهد و متن مورد نظرتان را به شما تحویل دهد!
* البته بیشتر این سایتها در تبدیل متنهای انگلیسی بسیار ماهر هستند و با متون فارسی و عربی میانه ی خوبی ندارند. اما خیلی هم نگران نباشید، همانطور که در بالا هم ذکر شده نرم افزارهایی برای تبدیل و استخراج متون فارسی از دل تصاویر و فایلهای گرافیکی و غیر متنی وجود دارد که با یک جستجوی گوگل در سطح وب می توانید آنها را بیابید. موفق و موید باشید.
For Other Users (Non-Persian Language): Free Online Service's Recognize text and characters from PDF scanned documents (including multipage files), photographs and digital camera captured images.Extract text from image (JPG, JPEG, BMP, TIFF, GIF) and convert into editable Word, Text, Excel, PDF, Html output formats. |
| آخرین به روز رسانی در پنجشنبه ۱۰ آذر ۱۳۹۰ ساعت ۰۸:۱۱ |
دسته بندی موضوعی
ورود یا ثبت نام
گفتگوی آنلاین با مدیر
در صورت آنلاین بودن، می توانید مستقیما از طریق یاهو با مدیر سایت گفتگو نمایید.
دوستان و حامیان ما
** تبلیغات متنی**




پردازش، جستجو و ویرایش توسط رایانه. تصویر سند غالبا توسط دستگاه اسکنر(روبشگر) و یا دوربین دیجیتال تولید میشود و شامل تعدادی پیکسل با رنگهای مختلف و سطوح روشنایی گوناگون است. از دید انسان، یک سند ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد، چرا که هر دوی آنها مجموعهای از پیکسلها هستند. برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، باید به نحوی نوشتههای موجود در سند را بازشناسی کرد. چنین کاری توسط نرمافزارهای نویسهخوان نوری(OCR reader) انجام میشود.


نظرات
1) pdf to editable word
نویسنده: شاهی
مطلب مهم و جذابی است
نظرشما؟