در بسیاری از خطوط تولید مدرن، اطلاعات مهمی به صورت متن روی محصولات، قطعات یا بستهبندیها درج میشود. این اطلاعات میتواند شامل تاریخ تولید، تاریخ انقضا، شماره سریال، کد بچ (Batch)، شماره قطعه، کد محصول یا حتی اطلاعات ردیابی باشد. در گذشته بررسی این اطلاعات معمولاً به صورت دستی توسط اپراتورها انجام میشد؛ روشی که علاوه بر کندی، احتمال خطای انسانی بالایی نیز داشت. امروزه با پیشرفت فناوری بینایی ماشین (Machine Vision) و الگوریتمهای هوش مصنوعی، سیستمهایتشخیص متن به یکی از ابزارهای کلیدی در اتوماسیون صنعتی استفاده کرده و آن را به داده دیجیتال تبدیل کنیم. به این روش تشخیص کارارکتر نوری یا OCR (Optical Character Recognition) نیز گفته می شود.
تشخیص متن OCR چیست؟
OCR فناوریای است که به ما امکان میدهد متن موجود در تصویر را شناسایی کنیم و آن را به دادهٔ دیجیتال قابل پردازش تبدیل کنیم. در محیطهای صنعتی، دوربینهای صنعتی نصبشده روی خطوط تولید معمولاً این تصاویر را ثبت میکنند.
برای مثال، کارخانههای داروسازی اطلاعاتی مانند تاریخ تولید و تاریخ انقضا را روی بستههای دارو چاپ میکنند. آنها با استفاده از سیستم OCR این اطلاعات را بهصورت خودکار میخوانند و بررسی میکنند که اطلاعات صحیح باشد. اگر خطایی در چاپ وجود داشته باشد، سیستم بلافاصله محصول را از خط تولید خارج میکند.
ایدهٔ تشخیص خودکار کاراکترها به اوایل قرن بیستم بازمیگردد. امانوئل گلدبرگ از نخستین افرادی بود که فناوری خواندن حروف چاپی را توسعه داد و دادهها را به کد تلگراف تبدیل کرد.
با پیشرفت رایانهها در دهههای 1950 و 1960، استفاده از OCR گسترش یافت. در آن زمان بانکها از این فناوری برای پردازش چکها استفاده میکردند.
در دهههای بعد، پیشرفتهای مهمی در زمینه هوش مصنوعی و یادگیری ماشین رخ داد. به ویژه تحقیقات یان لوکون در زمینه شبکههای عصبی کانولوشنی (CNN) امکان شناسایی دستنوشتهها را فراهم کرد و پایهگذار بسیاری از سیستمهای OCR مدرن شد.
کاربردهای تشخیص متن در صنعت
فناوری OCR در صنایع مختلف کاربردهای بسیار گستردهای دارد. در ادامه چند نمونه از مهمترین کاربردهای آن را بررسی میکنیم.
1. تشخیص شماره سریال قطعات
در صنعت خودروسازی، از فناوری OCR برای تشخیص و خواندن شماره سریال قطعات استفاده می کنیم. بسیاری از قطعات خودرو مانند موتور، گیربکس، ECU، قطعات شاسی و اجزای ایمنی دارای شماره سریال منحصربهفرد هستند که برای ردیابی، کنترل کیفیت و مدیریت زنجیره تأمین استفاده میشود. با استفاده از دوربینهای صنعتی و الگوریتمهای OCR، شرکتها میتوانند این شمارهها بهصورت خودکار از روی قطعات خوانده و در سیستمهای مدیریتی کارخانه مانند MES یا ERP ثبت کنند. این کار باعث میشود اطلاعات هر قطعه در طول فرآیند تولید، مونتاژ و حتی خدمات پس از فروش بهطور دقیق قابل پیگیری باشد.
علاوه بر ردیابی، OCR در خطوط تولید خودرو برای جلوگیری از خطاهای مونتاژ نیز استفاده میشود. به عنوان مثال، سیستم بینایی ماشین میتواند شماره سریال یا کد قطعه را قبل از نصب در خودرو بررسی کند و مطمئن شود که قطعه صحیح در جای درست استفاده میشود. در صورتی که قطعه اشتباه تشخیص داده شود، سیستم میتواند بهصورت خودکار خط تولید را متوقف کند یا هشدار ارسال کند. این قابلیت نقش مهمی در افزایش کیفیت تولید، کاهش خطاهای انسانی و جلوگیری از هزینههای ناشی از استفاده از قطعات نادرست دارد.
2. تشخیص پلاک خودرو
یکی از شناختهشدهترین کاربردهای OCR در دنیای واقعی، سیستمهای تشخیص پلاک خودرو (ANPR) است. در این سیستمها یک یا چند دوربین از خودرو در حال عبور تصویر میگیرند و الگوریتمهای پردازش تصویر ابتدا پلاک را شناسایی کرده و سپس با استفاده از OCR، اعداد و حروف روی پلاک را استخراج میکنند. این فرآیند کاملاً خودکار، بسیار سریع و قابلاعتماد است و میتواند در شرایط مختلف محیطی مانند نور کم، سرعت بالای خودرو، باران یا زاویههای متفاوت نیز عملکرد قابل قبولی ارائه دهد. استفاده از ANPR باعث میشود اطلاعات عبوری خودروها بدون نیاز به اپراتور انسانی و با دقت بالا ثبت و ذخیره شود.
امروزه از این فناوری در بسیاری از سامانههای حملونقل و مدیریت تردد شهری استفاده میکنیم. برای مثال، در سیستمهای کنترل ترافیک، ANPR به پایش جریان خودروها و ثبت تخلفات کمک میکند. در سیستمهای عوارضی، خودرو بدون توقف شناسایی شده و مبلغ عوارض بهصورت خودکار محاسبه میشود. همچنین در پارکینگهای هوشمند، این سیستم ورود و خروج خودرو را ثبت کرده و فرآیند پرداخت را ساده میکند. بسیاری از سازمانها و مجموعههای صنعتی نیز از OCR برای کنترل خودکار ورود و خروج خودروها استفاده میکنند تا امنیت و نظم بیشتری در محوطههای صنعتی برقرار شود.
3. تشخیص LCD و 7-segment
در بسیاری از خطوط تولید و تجهیزات کارخانهای، هنوز از نمایشگرهای LCD، 7‑Segment و پنلهای قدیمی برای نشان دادن مقادیری مانند دما، وزن، فشار، سرعت یا وضعیت دستگاه استفاده میشود. مشکل اصلی اینجاست که بسیاری از این دستگاهها خروجی دیجیتال استاندارد مانند Modbus، RS485 یا Ethernet ندارند و امکان اتصال مستقیم آنها به سیستمهای کنترلی مدرن وجود ندارد. در چنین شرایطی سیستمهای بینایی ماشین با استفاده از OCR میتوانند اعداد و علائمی را که روی نمایشگر ظاهر میشود، بهصورت دقیق بخوانند. دوربین صنعتی تصویر نمایشگر را ثبت میکند و الگوریتم OCR مقدار نشاندادهشده را استخراج کرده و به سیستمهای نرمافزاری ارسال میکند.
این روش در صنایع مختلف برای مانیتورینگ لحظهای، جمعآوری داده، کنترل کیفیت و اتوماسیون دستگاههای قدیمی کاربرد گستردهای دارد. به عنوان مثال، ممکن است یک دستگاه قدیمی تزریق پلاستیک فقط عدد فشار را روی یک نمایشگر 7‑Segment نشان دهد؛ با OCR میتوان این مقدار را بهصورت بلادرنگ دریافت و در سیستم SCADA ثبت کرد یا حتی براساس آن به PLC فرمان کنترلی داد. به این ترتیب، بدون نیاز به تعویض دستگاههای قدیمی یا ایجاد تغییرات سختافزاری پیچیده، امکان دیجیتالسازی و هوشمندسازی خطوط تولید فراهم میشود.
4. خودروهای بدون راننده
در خودروهای بدون راننده، سیستمهای بینایی ماشین یکی از اصلیترین ابزارهای درک محیط محسوب میشوند و نقش مهمی در تصمیمگیری لحظهای خودرو ایفا میکنند. یکی از کاربردهای مهم OCR در این فناوری، تشخیص علائم جادهای دارای متن است. بسیاری از تابلوها علاوه بر نماد، شامل نوشتههایی مانند STOP، SPEED LIMIT یا EXIT هستند که خودرو باید آنها را با دقت و سرعت بالا بخواند. دوربینهای جلو یا جانبی تصویر تابلو را ثبت میکنند و الگوریتمهای OCR متن روی تابلو را استخراج کرده و به سیستم هوش مصنوعی خودرو تحویل میدهند. این کار کمک میکند خودرو بتواند محدودیتها و هشدارهای محیطی را مشابه یک راننده انسانی تفسیر کند.
پس از استخراج متن، اطلاعات به ماژولهای تصمیمگیری خودرو ارسال میشود تا رفتار مناسب انتخاب شود. برای مثال، تشخیص عبارت SPEED LIMIT باعث تنظیم خودکار سرعت میشود، تشخیص EXIT مسیر خروج را فعال میکند و شناسایی STOP فرمان توقف کامل را صادر میکند. ترکیب OCR با سایر فناوریها مانند تشخیص اشیا، رادار و لیدار باعث میشود خودرو بتواند با اطمینان بیشتری در مسیرهای مختلف حرکت کند و خطاهای احتمالی در خواندن تابلوها کاهش یابد. به این ترتیب OCR نقش مکمل و مهمی در ایمنی، دقت و قابلیت اعتماد خودروهای خودران دارد.
تفاوت OCR و OCV چیست؟
OCV مخفف Optical Character Verification است. در این روش سیستم به جای خواندن متن، بررسی میکند که آیا متن چاپشده با مقدار مورد انتظار مطابقت دارد یا خیر. برعکس OCR که وظیفه آن خواندن متن از روی تصویر است، OCV تنها بررسی می کند متن درست چاپ شده است یا نه؟
در بسیاری از خطوط تولید از جت پرینترهای صنعتی برای چاپ اطلاعات روی محصولات استفاده میشود. این اطلاعات شامل شماره سریال، تاریخ تولید و تاریخ انقضای محصول است. گاهی اوقات ممکن است نازل پرینتر دچار گرفتگی شود که درنتیجه بخشی از متن چاپ نشده یا چاپ کمرنگ و ناقص می شود. سیستم OCR میتواند متن چاپشده را بخواند و در صورت وجود خطا، هشدار دهد یا محصول را از خط تولید خارج کند.

دقت تشخیص متن فارسی چقدر است؟
سیستمهای OCR صنعتی در شرایط بهینه میتوانند به دقتی بیش از ۹۹درصد دست یابند، اما این سطح از عملکرد به شدت وابسته به مجموعهای از عوامل محیطی و فنی است؛ از جمله کیفیت دوربین صنعتی و لنز مورد استفاده، کنترل دقیق نورپردازی برای جلوگیری از انعکاس یا سایه، نوع و وضوح فونت و کیفیت چاپ روی سطوح مختلف، و همچنین سرعت حرکت محصول در خط تولید و هرگونه لرزش تجهیزات. به دلیل این وابستگی شدید، در پیادهسازی پروژههای OCR، طراحی صحیح سیستم تصویربرداری (شامل نور و دوربین) نقشی حیاتی در تضمین موفقیت و دقت نهایی سیستم ایفا میکند.
در مورد OCR فارسی، اگرچه الگوریتمهای مبتنی بر یادگیری عمیق توانایی قابل توجهی در تشخیص حروف و کلمات فارسی با فونتها و خطوط مختلف دارند، پیادهسازی آن در محیطهای صنعتی نیازمند کتابخانهها و مدلهای آموزشدیده تخصصی برای مقابله با چالشهایی نظیر اتصالات حروف (Context-dependent rendering) و نمایش متن روی سطوح ناهموار یا نورپردازی متغیر کارخانهها است.
برای دستیابی به بهترین عملکرد OCR در صنعت، رعایت چند نکته بسیار مهم است:
- استفاده از دوربین صنعتی با رزولوشن مناسب
- طراحی صحیح نورپردازی
- استفاده از لنز مناسب
- تنظیم زاویه دوربین
- استفاده از الگوریتمهای پردازش تصویر
در واقع در بسیاری از پروژههای بینایی ماشین، نورپردازی مناسب مهمتر از خود الگوریتم OCR است.
مهمترین چالشهای تشخیص متن در صنعت
یقینا OCR در محیط های صنعتی با کاربرد های متداول OCR مانند تشخیص دستخط متفاوت است. در ادامه به مهمترین چالش هایی که OCR در محیط صنعتی دارد، اشاره می کنیم:
1. خواندن متن روی سطوح مختلف صنعت
در کاربردهای صنعتی، متنها همیشه روی کاغذ یا سطوح صاف چاپ نمیشوند و ممکن است روی فلز، پلاستیک، شیشه، کارتن، بستهبندیهای براق یا قطعات مکانیکی درج شده باشند. این شرایط باعث ایجاد چالشهایی مانند انعکاس نور روی فلز، براق بودن سطح پلاستیک یا حکاکی لیزری متن میشود که خواندن را دشوار میکند. برای رفع این مشکلات معمولاً از نورپردازی کنترلشده، فیلترهای نوری، زاویهدهی مناسب دوربین و تکنیکهای پردازش تصویر استفاده میشود.
2. عملکرد OCR در سرعتهای بالای خط تولید
بسیاری از خطوط تولید، بهویژه در صنایع غذایی، دارویی یا بستهبندی، سرعت بسیار بالایی دارند و گاه صدها محصول در دقیقه از مقابل دوربین عبور میکنند. سیستمهای OCR صنعتی باید بتوانند در این شرایط، تصویر را در کسری از ثانیه ثبت کرده، متن را پردازش کنند و نتیجه را در چند میلیثانیه به سیستم کنترل ارسال کنند. این موضوع نیازمند دوربینهای صنعتی، شاتر مناسب، نور یکنواخت و الگوریتمهای سریع و پایدار است.
3. تشخیص متنهای مخدوش، کمرنگ یا ناقص
در محیطهای واقعی کارخانه، چاپها همیشه واضح و استاندارد نیستند و ممکن است کمرنگ، ناقص، مخدوش یا روی سطوح ناهموار باشند. الگوریتمهای پیشرفته OCR میتوانند تا حدی این مشکلات را جبران کرده و متن را بازیابی کنند، اما زمانی که کیفیت چاپ بسیار پایین باشد، حتی سیستمهای پیشرفته نیز دچار خطا میشوند. به همین دلیل OCR علاوه بر خواندن متن، در بسیاری از خطوط تولید برای کنترل کیفیت چاپ نیز بهکار میرود تا ایرادها زودتر شناسایی شوند.
چه زمانی باید از تشخیص متن استفاده کرد و چه زمانی از بارکد یا QR؟
در بسیاری از صنایع این سوال مطرح میشود که آیا بهتر است از OCR استفاده کنیم یا از فناوریهایی مانند بارکد، QR Code یا RFID؟
پاسخ به این سوال به نوع کاربرد بستگی دارد. OCR زمانی مناسب است که اطلاعات به صورت متن خوانا برای انسان چاپ شده باشد. یعنی زمانی که نیاز باشد اپراتور هم بتواند اطلاعات را بخواند. در مقابل، بارکد و QR برای ذخیره اطلاعات بیشتر در فضای کوچک مناسبتر هستند. اما مشکلش این است که خواندن آن باید توسط دستگاه انجام شود.
در بسیاری از خطوط تولید مدرن، از ترکیب OCR و بارکد استفاده میشود. جهت اطلاعات بیشتر در این خصوص، مقاله 5 کاربرد فوق العاده بارکد و QR را مطالعه فرمایید.
OCR چگونه با سیستمهای صنعتی یکپارچه میشود؟
سیستمهای OCR معمولاً بخشی از یک سیستم بینایی ماشین صنعتی هستند. این سیستمها میتوانند با تجهیزات مختلف کارخانه ارتباط برقرار کنند. از جمله:
- PLC
- SCADA
- MES
- ERP
به عنوان مثال اگر سیستم OCR تشخیص دهد که تاریخ انقضا اشتباه چاپ شده است، میتواند به PLC فرمان دهد تا محصول معیوب از خط تولید خارج شود.
کدنویسی OCR در پایتون
با پیشرفت فناوریهای هوش مصنوعی و یادگیری عمیق، سیستمهای OCR هر روز دقیقتر، سریعتر و قابلاعتمادتر میشوند و نقش مهمتری در اتوماسیون صنعتی پیدا میکنند. امروزه علاوه بر نرمافزارهای تجاری، موتورهای متنباز قدرتمندی مانند Tesseract OCR نیز بهطور گسترده در پروژههای صنعتی و تحقیقاتی مورد استفاده قرار میگیرند. گوگل ابزار فوق العاده Tesseract را توسعه داد که از مدلهای یادگیری عمیق (LSTM) برای تشخیص متن استفاده میکند. همچنین قابلیت تشخیص زبانهای مختلف و امکان سفارشیسازی برای کاربردهای خاص صنعتی را فراهم کرده است و در بسیاری از سیستمهای بینایی ماشین بهعنوان هسته تشخیص متن به کار میرود.
برخی از روندهای مهم آینده OCR در صنعت عبارتاند از:
- استفاده گسترده از Deep Learning برای افزایش دقت تشخیص متن
- توانایی خواندن متن در تصاویر پیچیده و شرایط نوری دشوار
- پردازش بلادرنگ (Real-time) در خطوط تولید پرسرعت
- یکپارچهسازی بیشتر با سیستمهای هوشمند کارخانه مانند MES، ERP و سیستمهای بینایی ماشین
با ادامه این روند، انتظار میرود OCR در آینده نزدیک به یکی از اجزای کلیدی کارخانههای هوشمند (Smart Factories) تبدیل شود و نقش مهمی در اتوماسیون، کنترل کیفیت و دیجیتالسازی فرآیندهای صنعتی ایفا کند.
هزینه پیادهسازی OCR در صنعت چقدر است؟
هزینه اجرای یک سیستم OCR صنعتی به عوامل مختلفی بستگی دارد، از جمله:
- نوع دوربین صنعتی
- کیفیت لنز
- سیستم نورپردازی
- نرم افزار پردازش تصویر
- پیچیدگی الگوریتم OCR
نیاز به یکپارچهسازی با سیستمهای کارخانه در پروژههای کوچک ممکن است هزینه در حد هزار دلار باشد، اما در پروژههای بزرگ صنعتی هزینه میتواند بسیار بیشتر باشد. با این حال، در بسیاری از موارد بازگشت سرمایه (ROI) این سیستمها بسیار سریع است، زیرا از تولید محصولات معیوب جلوگیری میکنند.
جمعبندی
فناوری OCR یکی از ابزارهای کلیدی در اتوماسیون صنعتی و بینایی ماشین است. این فناوری امکان خواندن خودکار متن از روی محصولات، قطعات و نمایشگرها را فراهم میکند و نقش مهمی در کنترل کیفیت، ردیابی محصول و کاهش خطاهای انسانی دارد.
با پیشرفت الگوریتمهای هوش مصنوعی، سیستمهای OCR امروزی میتوانند با دقت بالا در شرایط پیچیده صنعتی نیز کار کنند. به همین دلیل بسیاری از کارخانهها از این فناوری برای بهبود بهرهوری، افزایش کیفیت و دیجیتالی کردن فرآیندهای تولید استفاده میکنند.