تشخیص متن در صنعت با OCR: راهکارها و کاربردها

خانه » تشخیص متن در صنعت با OCR: راهکارها و کاربردها
فناوری تشخیص متن در صنعت به سیستم‌های بینایی ماشین امکان می‌دهد متن‌های چاپ‌شده روی محصولات، قطعات و نمایشگرها را به‌صورت دقیق و بلادرنگ بخوانند. این روش نه‌تنها خطاهای انسانی را حذف می‌کند، بلکه در کنترل کیفیت، ردیابی محصول، تشخیص خرابی چاپ و اتوماسیون خطوط تولید نقش کلیدی دارد. در این مقاله با عملکرد OCR، تفاوت آن با OCV، چالش‌ها و کاربردهای واقعی آن در محیط‌های صنعتی آشنا می‌شوید. در این مقاله به مهم‌ترین سوالات کاربران صنعتی درباره OCR پاسخ می‌دهیم و کاربردهای واقعی آن در صنعت را بررسی می‌کنیم. در این مقاله به مهم‌ترین سوالات کاربران صنعتی درباره OCR پاسخ می‌دهیم و کاربردهای واقعی آن در صنعت را بررسی می‌کنیم.

فهرست مطالب

در بسیاری از خطوط تولید مدرن، اطلاعات مهمی به صورت متن روی محصولات، قطعات یا بسته‌بندی‌ها درج می‌شود. این اطلاعات می‌تواند شامل تاریخ تولید، تاریخ انقضا، شماره سریال، کد بچ (Batch)، شماره قطعه، کد محصول یا حتی اطلاعات ردیابی باشد. در گذشته بررسی این اطلاعات معمولاً به صورت دستی توسط اپراتورها انجام می‌شد؛ روشی که علاوه بر کندی، احتمال خطای انسانی بالایی نیز داشت. امروزه با پیشرفت فناوری بینایی ماشین (Machine Vision) و الگوریتم‌های هوش مصنوعی، سیستم‌هایتشخیص متن به یکی از ابزارهای کلیدی در اتوماسیون صنعتی استفاده کرده و آن را به داده دیجیتال تبدیل کنیم. به این روش تشخیص کارارکتر نوری یا OCR (Optical Character Recognition) نیز گفته می شود.

تشخیص متن OCR چیست؟

OCR فناوری‌ای است که به ما امکان می‌دهد متن موجود در تصویر را شناسایی کنیم و آن را به دادهٔ دیجیتال قابل پردازش تبدیل کنیم. در محیط‌های صنعتی، دوربین‌های صنعتی نصب‌شده روی خطوط تولید معمولاً این تصاویر را ثبت می‌کنند.

برای مثال، کارخانه‌های داروسازی اطلاعاتی مانند تاریخ تولید و تاریخ انقضا را روی بسته‌های دارو چاپ می‌کنند. آن‌ها با استفاده از سیستم OCR این اطلاعات را به‌صورت خودکار می‌خوانند و بررسی می‌کنند که اطلاعات صحیح باشد. اگر خطایی در چاپ وجود داشته باشد، سیستم بلافاصله محصول را از خط تولید خارج می‌کند.

ایدهٔ تشخیص خودکار کاراکترها به اوایل قرن بیستم بازمی‌گردد. امانوئل گلدبرگ از نخستین افرادی بود که فناوری خواندن حروف چاپی را توسعه داد و داده‌ها را به کد تلگراف تبدیل کرد.

با پیشرفت رایانه‌ها در دهه‌های 1950 و 1960، استفاده از OCR گسترش یافت. در آن زمان بانک‌ها از این فناوری برای پردازش چک‌ها استفاده می‌کردند.

در دهه‌های بعد، پیشرفت‌های مهمی در زمینه هوش مصنوعی و یادگیری ماشین رخ داد. به ویژه تحقیقات یان لوکون در زمینه شبکه‌های عصبی کانولوشنی (CNN) امکان شناسایی دست‌نوشته‌ها را فراهم کرد و پایه‌گذار بسیاری از سیستم‌های OCR مدرن شد.

کاربردهای تشخیص متن در صنعت

فناوری OCR در صنایع مختلف کاربردهای بسیار گسترده‌ای دارد. در ادامه چند نمونه از مهم‌ترین کاربردهای آن را بررسی می‌کنیم.

1. تشخیص شماره سریال قطعات

در صنعت خودروسازی، از فناوری OCR برای تشخیص و خواندن شماره سریال قطعات استفاده می کنیم. بسیاری از قطعات خودرو مانند موتور، گیربکس، ECU، قطعات شاسی و اجزای ایمنی دارای شماره سریال منحصر‌به‌فرد هستند که برای ردیابی، کنترل کیفیت و مدیریت زنجیره تأمین استفاده می‌شود. با استفاده از دوربین‌های صنعتی و الگوریتم‌های OCR، شرکت‌ها می‌توانند این شماره‌ها به‌صورت خودکار از روی قطعات خوانده و در سیستم‌های مدیریتی کارخانه مانند MES یا ERP ثبت کنند. این کار باعث می‌شود اطلاعات هر قطعه در طول فرآیند تولید، مونتاژ و حتی خدمات پس از فروش به‌طور دقیق قابل پیگیری باشد.

علاوه بر ردیابی، OCR در خطوط تولید خودرو برای جلوگیری از خطاهای مونتاژ نیز استفاده می‌شود. به عنوان مثال، سیستم بینایی ماشین می‌تواند شماره سریال یا کد قطعه را قبل از نصب در خودرو بررسی کند و مطمئن شود که قطعه صحیح در جای درست استفاده می‌شود. در صورتی که قطعه اشتباه تشخیص داده شود، سیستم می‌تواند به‌صورت خودکار خط تولید را متوقف کند یا هشدار ارسال کند. این قابلیت نقش مهمی در افزایش کیفیت تولید، کاهش خطاهای انسانی و جلوگیری از هزینه‌های ناشی از استفاده از قطعات نادرست دارد.

2. تشخیص پلاک خودرو

یکی از شناخته‌شده‌ترین کاربردهای OCR در دنیای واقعی، سیستم‌های تشخیص پلاک خودرو (ANPR) است. در این سیستم‌ها یک یا چند دوربین از خودرو در حال عبور تصویر می‌گیرند و الگوریتم‌های پردازش تصویر ابتدا پلاک را شناسایی کرده و سپس با استفاده از OCR، اعداد و حروف روی پلاک را استخراج می‌کنند. این فرآیند کاملاً خودکار، بسیار سریع و قابل‌اعتماد است و می‌تواند در شرایط مختلف محیطی مانند نور کم، سرعت بالای خودرو، باران یا زاویه‌های متفاوت نیز عملکرد قابل قبولی ارائه دهد. استفاده از ANPR باعث می‌شود اطلاعات عبوری خودروها بدون نیاز به اپراتور انسانی و با دقت بالا ثبت و ذخیره شود.

امروزه از این فناوری در بسیاری از سامانه‌های حمل‌ونقل و مدیریت تردد شهری استفاده می‌کنیم. برای مثال، در سیستم‌های کنترل ترافیک، ANPR به پایش جریان خودروها و ثبت تخلفات کمک می‌کند. در سیستم‌های عوارضی، خودرو بدون توقف شناسایی شده و مبلغ عوارض به‌صورت خودکار محاسبه می‌شود. همچنین در پارکینگ‌های هوشمند، این سیستم ورود و خروج خودرو را ثبت کرده و فرآیند پرداخت را ساده می‌کند. بسیاری از سازمان‌ها و مجموعه‌های صنعتی نیز از OCR برای کنترل خودکار ورود و خروج خودروها استفاده می‌کنند تا امنیت و نظم بیشتری در محوطه‌های صنعتی برقرار شود.

3. تشخیص LCD و 7-segment

در بسیاری از خطوط تولید و تجهیزات کارخانه‌ای، هنوز از نمایشگرهای LCD، 7‑Segment و پنل‌های قدیمی برای نشان دادن مقادیری مانند دما، وزن، فشار، سرعت یا وضعیت دستگاه استفاده می‌شود. مشکل اصلی اینجاست که بسیاری از این دستگاه‌ها خروجی دیجیتال استاندارد مانند Modbus، RS485 یا Ethernet ندارند و امکان اتصال مستقیم آن‌ها به سیستم‌های کنترلی مدرن وجود ندارد. در چنین شرایطی سیستم‌های بینایی ماشین با استفاده از OCR می‌توانند اعداد و علائمی را که روی نمایشگر ظاهر می‌شود، به‌صورت دقیق بخوانند. دوربین صنعتی تصویر نمایشگر را ثبت می‌کند و الگوریتم OCR مقدار نشان‌داده‌شده را استخراج کرده و به سیستم‌های نرم‌افزاری ارسال می‌کند.

این روش در صنایع مختلف برای مانیتورینگ لحظه‌ای، جمع‌آوری داده، کنترل کیفیت و اتوماسیون دستگاه‌های قدیمی کاربرد گسترده‌ای دارد. به عنوان مثال، ممکن است یک دستگاه قدیمی تزریق پلاستیک فقط عدد فشار را روی یک نمایشگر 7‑Segment نشان دهد؛ با OCR می‌توان این مقدار را به‌صورت بلادرنگ دریافت و در سیستم SCADA ثبت کرد یا حتی براساس آن به PLC فرمان کنترلی داد. به این ترتیب، بدون نیاز به تعویض دستگاه‌های قدیمی یا ایجاد تغییرات سخت‌افزاری پیچیده، امکان دیجیتال‌سازی و هوشمندسازی خطوط تولید فراهم می‌شود.

4. خودروهای بدون راننده

در خودروهای بدون راننده، سیستم‌های بینایی ماشین یکی از اصلی‌ترین ابزارهای درک محیط محسوب می‌شوند و نقش مهمی در تصمیم‌گیری لحظه‌ای خودرو ایفا می‌کنند. یکی از کاربردهای مهم OCR در این فناوری، تشخیص علائم جاده‌ای دارای متن است. بسیاری از تابلوها علاوه بر نماد، شامل نوشته‌هایی مانند STOP، SPEED LIMIT یا EXIT هستند که خودرو باید آن‌ها را با دقت و سرعت بالا بخواند. دوربین‌های جلو یا جانبی تصویر تابلو را ثبت می‌کنند و الگوریتم‌های OCR متن روی تابلو را استخراج کرده و به سیستم هوش مصنوعی خودرو تحویل می‌دهند. این کار کمک می‌کند خودرو بتواند محدودیت‌ها و هشدارهای محیطی را مشابه یک راننده انسانی تفسیر کند.

پس از استخراج متن، اطلاعات به ماژول‌های تصمیم‌گیری خودرو ارسال می‌شود تا رفتار مناسب انتخاب شود. برای مثال، تشخیص عبارت SPEED LIMIT باعث تنظیم خودکار سرعت می‌شود، تشخیص EXIT مسیر خروج را فعال می‌کند و شناسایی STOP فرمان توقف کامل را صادر می‌کند. ترکیب OCR با سایر فناوری‌ها مانند تشخیص اشیا، رادار و لیدار باعث می‌شود خودرو بتواند با اطمینان بیشتری در مسیرهای مختلف حرکت کند و خطاهای احتمالی در خواندن تابلوها کاهش یابد. به این ترتیب OCR نقش مکمل و مهمی در ایمنی، دقت و قابلیت اعتماد خودروهای خودران دارد.

تفاوت OCR و OCV چیست؟

OCV مخفف Optical Character Verification است. در این روش سیستم به جای خواندن متن، بررسی می‌کند که آیا متن چاپ‌شده با مقدار مورد انتظار مطابقت دارد یا خیر. برعکس OCR که وظیفه آن خواندن متن از روی تصویر است، OCV تنها بررسی می کند متن درست چاپ شده است یا نه؟

در بسیاری از خطوط تولید از جت پرینترهای صنعتی برای چاپ اطلاعات روی محصولات استفاده می‌شود. این اطلاعات شامل شماره سریال، تاریخ تولید و تاریخ انقضای محصول است. گاهی اوقات ممکن است نازل پرینتر دچار گرفتگی شود که درنتیجه بخشی از متن چاپ نشده یا چاپ کم‌رنگ و ناقص می شود. سیستم OCR می‌تواند متن چاپ‌شده را بخواند و در صورت وجود خطا، هشدار دهد یا محصول را از خط تولید خارج کند.

تشخیص متن با OCV

دقت تشخیص متن فارسی چقدر است؟

سیستم‌های OCR صنعتی در شرایط بهینه می‌توانند به دقتی بیش از ۹۹درصد دست یابند، اما این سطح از عملکرد به شدت وابسته به مجموعه‌ای از عوامل محیطی و فنی است؛ از جمله کیفیت دوربین صنعتی و لنز مورد استفاده، کنترل دقیق نورپردازی برای جلوگیری از انعکاس یا سایه، نوع و وضوح فونت و کیفیت چاپ روی سطوح مختلف، و همچنین سرعت حرکت محصول در خط تولید و هرگونه لرزش تجهیزات. به دلیل این وابستگی شدید، در پیاده‌سازی پروژه‌های OCR، طراحی صحیح سیستم تصویربرداری (شامل نور و دوربین) نقشی حیاتی در تضمین موفقیت و دقت نهایی سیستم ایفا می‌کند.

در مورد OCR فارسی، اگرچه الگوریتم‌های مبتنی بر یادگیری عمیق توانایی قابل توجهی در تشخیص حروف و کلمات فارسی با فونت‌ها و خطوط مختلف دارند، پیاده‌سازی آن در محیط‌های صنعتی نیازمند کتابخانه‌ها و مدل‌های آموزش‌دیده تخصصی برای مقابله با چالش‌هایی نظیر اتصالات حروف (Context-dependent rendering) و نمایش متن روی سطوح ناهموار یا نورپردازی متغیر کارخانه‌ها است.

برای دستیابی به بهترین عملکرد OCR در صنعت، رعایت چند نکته بسیار مهم است:

  • استفاده از دوربین صنعتی با رزولوشن مناسب
  •  طراحی صحیح نورپردازی
  •  استفاده از لنز مناسب
  •  تنظیم زاویه دوربین
  • استفاده از الگوریتم‌های پردازش تصویر

در واقع در بسیاری از پروژه‌های بینایی ماشین، نورپردازی مناسب مهم‌تر از خود الگوریتم OCR است.

مهمترین چالشهای تشخیص متن در صنعت

یقینا OCR در محیط های صنعتی با کاربرد های متداول OCR مانند تشخیص دستخط متفاوت است. در ادامه به مهمترین چالش هایی که OCR در محیط صنعتی دارد، اشاره می کنیم:

1. خواندن متن روی سطوح مختلف صنعت

در کاربردهای صنعتی، متن‌ها همیشه روی کاغذ یا سطوح صاف چاپ نمی‌شوند و ممکن است روی فلز، پلاستیک، شیشه، کارتن، بسته‌بندی‌های براق یا قطعات مکانیکی درج شده باشند. این شرایط باعث ایجاد چالش‌هایی مانند انعکاس نور روی فلز، براق بودن سطح پلاستیک یا حکاکی لیزری متن می‌شود که خواندن را دشوار می‌کند. برای رفع این مشکلات معمولاً از نورپردازی کنترل‌شده، فیلترهای نوری، زاویه‌دهی مناسب دوربین و تکنیک‌های پردازش تصویر استفاده می‌شود.

 2. عملکرد OCR در سرعت‌های بالای خط تولید

بسیاری از خطوط تولید، به‌ویژه در صنایع غذایی، دارویی یا بسته‌بندی، سرعت بسیار بالایی دارند و گاه صدها محصول در دقیقه از مقابل دوربین عبور می‌کنند. سیستم‌های OCR صنعتی باید بتوانند در این شرایط، تصویر را در کسری از ثانیه ثبت کرده، متن را پردازش کنند و نتیجه را در چند میلی‌ثانیه به سیستم کنترل ارسال کنند. این موضوع نیازمند دوربین‌های صنعتی، شاتر مناسب، نور یکنواخت و الگوریتم‌های سریع و پایدار است.

3. تشخیص متن‌های مخدوش، کم‌رنگ یا ناقص

در محیط‌های واقعی کارخانه، چاپ‌ها همیشه واضح و استاندارد نیستند و ممکن است کم‌رنگ، ناقص، مخدوش یا روی سطوح ناهموار باشند. الگوریتم‌های پیشرفته OCR می‌توانند تا حدی این مشکلات را جبران کرده و متن را بازیابی کنند، اما زمانی که کیفیت چاپ بسیار پایین باشد، حتی سیستم‌های پیشرفته نیز دچار خطا می‌شوند. به همین دلیل OCR علاوه بر خواندن متن، در بسیاری از خطوط تولید برای کنترل کیفیت چاپ نیز به‌کار می‌رود تا ایرادها زودتر شناسایی شوند.

چه زمانی باید از تشخیص متن استفاده کرد و چه زمانی از بارکد یا QR؟

در بسیاری از صنایع این سوال مطرح می‌شود که آیا بهتر است از OCR استفاده کنیم یا از فناوری‌هایی مانند بارکد، QR Code یا  RFID؟ 

پاسخ به این سوال به نوع کاربرد بستگی دارد. OCR زمانی مناسب است که اطلاعات به صورت متن خوانا برای انسان چاپ شده باشد. یعنی زمانی که نیاز باشد اپراتور هم بتواند اطلاعات را بخواند. در مقابل، بارکد و QR برای ذخیره اطلاعات بیشتر در فضای کوچک مناسب‌تر هستند. اما مشکلش این است که خواندن آن باید توسط دستگاه انجام شود.

در بسیاری از خطوط تولید مدرن، از ترکیب OCR و بارکد استفاده می‌شود. جهت اطلاعات بیشتر در این خصوص، مقاله 5 کاربرد فوق العاده بارکد و QR را مطالعه فرمایید.

OCR چگونه با سیستم‌های صنعتی یکپارچه می‌شود؟

سیستم‌های OCR معمولاً بخشی از یک سیستم بینایی ماشین صنعتی هستند. این سیستم‌ها می‌توانند با تجهیزات مختلف کارخانه ارتباط برقرار کنند. از جمله:

  • PLC
  • SCADA
  • MES
  • ERP

به عنوان مثال اگر سیستم OCR تشخیص دهد که تاریخ انقضا اشتباه چاپ شده است، می‌تواند به PLC فرمان دهد تا محصول معیوب از خط تولید خارج شود.

کدنویسی OCR در پایتون

با پیشرفت فناوری‌های هوش مصنوعی و یادگیری عمیق، سیستم‌های OCR هر روز دقیق‌تر، سریع‌تر و قابل‌اعتمادتر می‌شوند و نقش مهم‌تری در اتوماسیون صنعتی پیدا می‌کنند. امروزه علاوه بر نرم‌افزارهای تجاری، موتورهای متن‌باز قدرتمندی مانند Tesseract OCR نیز به‌طور گسترده در پروژه‌های صنعتی و تحقیقاتی مورد استفاده قرار می‌گیرند. گوگل ابزار فوق العاده Tesseract را توسعه داد که از مدل‌های یادگیری عمیق (LSTM) برای تشخیص متن استفاده می‌کند. همچنین قابلیت تشخیص زبان‌های مختلف و امکان سفارشی‌سازی برای کاربردهای خاص صنعتی را فراهم کرده است و در بسیاری از سیستم‌های بینایی ماشین به‌عنوان هسته تشخیص متن به کار می‌رود.

برخی از روندهای مهم آینده OCR در صنعت عبارت‌اند از:

  • استفاده گسترده از Deep Learning برای افزایش دقت تشخیص متن
  • توانایی خواندن متن در تصاویر پیچیده و شرایط نوری دشوار
  • پردازش بلادرنگ (Real-time) در خطوط تولید پرسرعت
  • یکپارچه‌سازی بیشتر با سیستم‌های هوشمند کارخانه مانند MES، ERP و سیستم‌های بینایی ماشین

با ادامه این روند، انتظار می‌رود OCR در آینده نزدیک به یکی از اجزای کلیدی کارخانه‌های هوشمند (Smart Factories) تبدیل شود و نقش مهمی در اتوماسیون، کنترل کیفیت و دیجیتال‌سازی فرآیندهای صنعتی ایفا کند.

هزینه پیاده‌سازی OCR در صنعت چقدر است؟

هزینه اجرای یک سیستم OCR صنعتی به عوامل مختلفی بستگی دارد، از جمله:

  • نوع دوربین صنعتی
  • کیفیت لنز
  • سیستم نورپردازی
  • نرم افزار پردازش تصویر
  • پیچیدگی الگوریتم OCR 

نیاز به یکپارچه‌سازی با سیستم‌های کارخانه  در پروژه‌های کوچک ممکن است هزینه در حد هزار دلار باشد، اما در پروژه‌های بزرگ صنعتی هزینه می‌تواند بسیار بیشتر باشد. با این حال، در بسیاری از موارد بازگشت سرمایه (ROI) این سیستم‌ها بسیار سریع است، زیرا از تولید محصولات معیوب جلوگیری می‌کنند.

جمع‌بندی

فناوری OCR یکی از ابزارهای کلیدی در اتوماسیون صنعتی و بینایی ماشین است. این فناوری امکان خواندن خودکار متن از روی محصولات، قطعات و نمایشگرها را فراهم می‌کند و نقش مهمی در کنترل کیفیت، ردیابی محصول و کاهش خطاهای انسانی دارد.

با پیشرفت الگوریتم‌های هوش مصنوعی، سیستم‌های OCR امروزی می‌توانند با دقت بالا در شرایط پیچیده صنعتی نیز کار کنند. به همین دلیل بسیاری از کارخانه‌ها از این فناوری برای بهبود بهره‌وری، افزایش کیفیت و دیجیتالی کردن فرآیندهای تولید استفاده می‌کنند.

مراجع