no-img
بازار فایل

پایان نامه شبیه سازی تشخیص حروف دست نویس با نرم افزار مطلب همراه با سورس


بازار فایل

ادامه مطلب

پایان نامه شبیه سازی تشخیص حروف دست نویس با نرم افزار مطلب همراه با سورس
zip
۱۳۹۵-۰۳-۲۳
60000 تومان
6 فروش
60000 تومان – خرید

پایان نامه شبیه سازی تشخیص حروف دست نویس با نرم افزار مطلب همراه با سورس


فهرست مطالب

چکیده

فصل 1 : کلیات تحقیق

1-1مقدمه

  • اهمیت تشخیص حروف دست نویس

1-3 برون خطی/ درون خطی

1-4 اصطلاح OCR

1-4-1 مزیت OCR

 

فصل2: مبانی نظری وپیشینه تحقیق

2-1 تکنیک ها و تئوری ها

 

فصل3: موادوروش ها

3-1 پیش پردازش

3-2 لبه یابی تصاویر

3-2-1 تشخيص لبه وبخش بندي تصاوير

3-2-2 الگوريتم هاي آشكارسازي لبه ها

3-2-3 شناسایی لبه ها

3-2-4 نازک سازی ودنبال کردن لبه ها

3-3 تشخیص وشناسایی الگو

3-3-1 کاربرد بازشناسی الگو

3-4 شبکه های عصبی

3-4-1 کاربرد شبکه های عصبی

3-4-2 مزیت شبکه های عصبی

3-4-3 ساختارشبکه های عصبی

3-4-4 تقسیم بندی شبکه های عصبی

3-4-5 شبکه های عصبیMLP

3-4-6 شبکه های عصبی چندلایهMLP

3-5 قواعدفراگیری پرسپترون چندلایه

3-5-1الگوریتم پرسپترون چندلایه

3-5-2 الگوریتم آموزش پرسپترون چندلایه

3-6 بازنمایی (استخراج ویژگی)

فصل4 : نتایج

4-1 نتایج شبیه سازی

4-2رمزگذاری/رمزگشایی

4-3نرم افزاروروابط گرافیکی((GUI

4-نتیجه گیری

فصل 5 : بحث ونتیجه گیری

5-1 بحث ونتیجه گیری

پیوست

 

 

چکیده

OCR یا Optical Character Recoginition به معنای شناسایی حروف با کمک ابزار نوری است و یک شاخه از علم پردازش تصویر را تشکیل می دهد. OCR شامل تصویر برداری از روی کاغذ و استخراج کلمات از آن است.

نمونه هایی از انواع مختلف حروف دست نویس به عنوان الگو به نرم افزار متلب داده می شود (ذخیره می شود) که به عنوان پایگاه داده در نظر گرفته می شود و شبکه عصبی آموزش داده می شود ،بعد تصویر حرفی که می خواهیم تشخیص دهیم به عنوان ورودی به نرم افزار متلب داده می شود و با استفاده از الگوریتم ها و فیلتر ها حرف دست نویس با الگوها و نمونه ها مقایسه شده و تطبیق داده می شود.

به طور کلی ، در ابتدا با استفاده از نرم افزار متلب 100 عدد از هر حرف را که به شکل ماتریس 40*40 بود را به بردار1600*1 تبدیل میکنیم (کاهش ابعاد) و دو مولفه بنام input و target درست می کنیم و در مولفه input به تعداد 100 عدد از هر بردار حروف (مثلا 100 بردار حرف ب) قرار می دهیم و از target به عنوان برچسب برای هر حرف استفاده می کنیم (مثلا حرف ب دارای برچسب 2) را به شبکه عصبی پرسپترون چند لایه آموزش می دهیم (Train) ، که جمعا 3200 حرف می شود بعد وارد فاز تست (Test) می شویم و دقت شبکه عصبی را تست میکنیم و در ادامه به تشخیص حروف و ارقام می پردازیم.

چون متن به صورت مستقیم در تصویر قابل دسترسی نیست زیرا حروف در یک متن اسکن شده از مجموعه ای از نقاط تشکیل می شود که از کنار هم قرار گرفتن این نقاط مطابق الگوهای معین ، تصویر مختلف بوجود می آید.

به علت وجود دست خط های مختلف ، بازشناسی حروف دستنویس یک مساله پیچیده است . دراین فرآیند ، استخراج ویژگیهای حروف به صورت صحیح ، گامی مهم درجهت تشخیص درست حروف خواهد بود .

 

 

فصل 1:کلیات تحقیق

1-1مقدمه

هدف اصلی این پایان نامه پیداکردن یک راه حل جدید برای تحلیل شناختن فونت ها وسبک های مختلف متن دست نوشته ازطریق بهبود ساختارطراحی شبکه عصبی سنتی مصنوعی(ANN) .

شبکه های عصبی مصنوعی درتشخیص الگو،انجمن ها وطبقه بندی ، مطالعات پیش بینی و کنتر

برنامه های کاربردی با موفقیت اعمال نشوند.نتایج تشخیص متن یا اشکال دست نویس با استفاده از کاراکتر از کاربردهای تشخیص دست خط می توان ،متن نوشته شده یا چاپ شده را به متن قابل ویرایش ماشین تایپ تبدیل کرد، اشاره کرد. با استفاده از روش تشخیص می توان وسایل خودکار کتاب خوان برای نابینایان طراحی کرد.OCR سرنام اصطلاحی است كه صورت كامل آن در واژه ‌نامه انگلیسی Optical character Recognitionو به معنی بازشناسایی كاراكتر نوری می‌باشد.فرض كنید كه ما متنی را روی كاغذ داریم و می‌خواهیم آن را وارد رایانه كنیم .

اولین روشی كه به ذهن می ‌رسد این است كه متن را به تایپیست بدهیم تا با كامپیوتر تایپ كند. اما آیا می‌شود عین همان متن را وارد رایانه بكنیم تا نیازی به تایپ نباشد؟ البته دستگاه «اسكنر» می‌تواند تصویری از آن متن را وارد رایانه كند، تا اینجا بخشی از مشكل ما حل شده است. اما رایانه كه نه عقلی دارد و نه «زبان» می‌فهمد، نمی‌تواند حروف و كلمات را از هم تشخیص دهد. مثلااگر از كامپیوتر بخواهیم به ما بگوید كه در متن اسكن‌شده كلمه «علی» چند بار آمده است، بی‌آنكه شرمنده شود، می‌گوید: «error»یعنی نمی‌ توانم تشخیص بدهم در واقع این «تصویر دیجیتال‌ شده» باید به تصویر قابل پردازش تبدیل شود. موضوع اصلی OCR همین است فرض كنید كه مثلاً می‌خواهیم متن مقالات روزنامه اطلاعات سال 1340 شمسی را تایپ دیجیتالی كنیم، و این متن‌ها را داخل بسته‌ های نرم ‌افزاری یا اینترنت قرار دهیم. اگر هر شماره از روزنامه را 24 صفحه فرض كنیم، و هر تایپیست بتواند در هر روز حداكثر یك صفحه از آن صفحات كاهی و كهنه شده قدیمی را دوباره تایپ كند، مجموعاً 24 روز لازم است تا تنها مقالات یك شماره از روزنامه تایپ شود. بنابراین در عرض یك سال یك نفر می‌تواند تنها 15 شماره از روزنامه را تایپ كند. حال اگر نرم‌ افزاری باشد كه بتواند با اسكن كردن هر صفحه روزنامه، به طور خودكار مقالات آن را تایپ كند، تحولی عظیم رخ می ‌دهد، یعنی مطالب و مقالات هزاران شماره از روزنامه‌ های قدیمی به سرعت وارد فایل ‌های رایانه‌ای می‌شود. حال این امكان را تعمیم بدهید به هزاران كتاب و دست نویس‌های قدیمی یا جدید، كه هر كس بخواهد تنها یك صفحه از آنها را تایپ كند، باید كلی وقت صرف كند. می‌بینید كه نرم‌افزار OCR به راستی می‌تواند هزاران هزار روز در وقت ما صرفه‌جویی كند، و البته هزینه‌ ها را هم كاهش دهد. البته فقط یك مشكل كوچك به وجود می‌آید و آن بیكار شدن تایپیست‌ هاست.

 

1-2 اهمیت تشخیص حروف دست نویس

تشخیص حروف دستنویس کابرد زیادی دارد.مثلا درمرتب کردن بسته های پستی ، دفترکارخودکار ، خواندن ومرتب کردن حوالات بانکی و… ازتشخیص اعداد هم درکارهای مالی بسیار استفاده میشود .بنابراین سیستم باید از یک نرخ دقت بالا ، سرعت زیاد و کاربرد آسان بهره مند باشد.تا به حال چندین روش ارائه شده است که چون دارای دقت مناسبی نبوده اند مورد قبول واقع نشده است.دریکی از این روشها ترکیبی از assembly neural network وپرسپترون برای تشخیص ارقام دستنویس دریک رشته عددی استفاده شده است مروری برتکنیکهای نرمالسازی واستخراج الگو صورت گرفته است.یک نگاشت جدید برای تشخیص حروف عربی بیان شده است این سیستم صرفنظر ازاندازه ،جهت وموقعیت الگوی ورودی کارمی کند.

 

یک روش تشخیص ارقام با استفاده ازشبکه عصبی به همراه یک مرحله پیش پردازش آورده شده است . شبکه های عصبی متفاوت با مراحل پیش پردازش مختلف آزمایش ومقایسه شده اند.

یک روش جداسازی دسته بندی نواحی موجود دریک سند با استفاده ازسیستم Nero-fuzzy آورده شده است این سیستم دومرحله دارد.درابتدا با استفاده ازروش آستانه گیری فازی نواحی تصویر سند (سند تصویری) را جدا می کند.وسپس با استفاده ازجداساز Nero-fuzzy وبا توجه به یکسری شروع به برچسب زدن هرکدام از نواحی می کند.

 

  • سری
  • موازی

درروش سری آموزش شبکه عصبی را براساس الگوریتمهای ژنتیک انجام می دهند.و درروش موازی حداقل با دوروش بطورموازی شبکه عصبی را آموزش می دهند.روش غالب بوسیله یک کنترل فازی انجام می شود، درروش موازی شبکه عصبی درهردوره زمانی بطورجداگانه وبصورت بی درنگ وموازی با حداقل دوروش(روش بهینه تطبیق وزن هاوروش الگوریتمهای ژنتیک)تغییرمی دهند.انتخاب روش غالب براساس کاهش خطای آموزش انجام می شود.روش موازی مستقل ازنوع وساختارشبکه عصبی است. شبکه های عصبی نمونه ای ازروشها والگوریتم هوش مصنوعی می باشد اینگونه روشها با وجود آنکه دقت نسبتا بالایی دارند،اما دارای روحی خشک می باشند.این بخاطر وجود محاسبات زیاد ریاضی می باشد. بدلیل قابل فهم ودرک بودن بیشترقواعداگر-آنگاه فازی ، استفاده ازآنها درطبقه بندی کننده ها بسیاررایج شده است . همچنین تعیین میزان منطقی بودن این قواعد،امکان پذیروساده است ومی توان با توجه به دانش قبلی درباره ی مساله مورد نظر،تعدادی قاعده ی پایه را قبل ازایجاد قواعد ازروی نمونه های آموزش ، درمجموعه ی فازی قرارداد.برای ایجاد قواعد فازی بصورت خودکار ازروی الگوهای آموزشی نیزروشهای مختلفی وجود دارد.این روشها ازآموزش همراه با ناظراستفاده می کنند. در روش برون خطی ، تشخیص ، نوشته ای است معمولا به طور عینی به وسیله یک اسکنر و متن کامل که در دسترس است ، گرفته شده است . همچنین به عنوان نتیجه یک تصویر شامل هیچ اطلاعات موقتی می باشد. برخی تفکیک های موجود روش تقسیم بندی مبتنی بر همجوش است .در این رویکرد بیش از تقسیم بندی کلمات از متن بر اساس تراکم پیکسل بین خط بالا و خط پایین تر با چند متخصص اعتبار پایه برای شناخت ویژگی و طبقه بندی توسعه داده شده است. خطاهای کج و مورب در این خط نادیده گرفته شده اند.تشخیص دست خط یکی از جذاب ترین و چالش بر انگیزترین حوزه تحقیقاتی در زمینه پردازش تصویر و تشخیص الگو در سال های اخیر بوده است.تشخیص آفلاین روی یک تصویر اسکن شده از دست خط انجام شده و در نتیجه حاوی هیچ داده ای زمانی نیست.

 

  • برون خطی / درون خطی

به طور کلی ، تشخیص دست خط بر دو نوع طبقه بندی شده است :

  • برون خطی (آنلاین)
  • درون خطی (آفلاین)

برای تشخیص دست خط ، ورودی سیستم ما یک تصویر اسکن شده شامل پاراگراف متن دست نوشته است . تصویر باید در قالب تعیین شده باشد پیش پردازش گامی بزرگ در تشخیص دست خط است .آن چندین گام را به کار می گیرد یعنی تقسیم بندی خط ، اصلاح پایه و غیره . ورودی مثلا تصویر متن خاص در حال اجرا را می گیرد و خروجی مثلا کلمات تقسیم شده را می دهد .پایه و اساس مراحل پیش پردازش بسیار می باشد.

  • اصطلاح OCR

تشخیص کاراکترنوری(Optical character Recognition) است که معمولا به عنوان فرآیند تشخیص کاراکتر خارج ازخط اشاره می شود ، به این معنی که سیستم تصاویری ازکاراکتر های بی حرکت را اسکن می کند ، تشخیص می دهد . ازسوی دیگر ، تشخیص شخصیت دست خط درون خطی نیاز به شناسایی حرکات یک قلم دارد همانطورکه آن روی یک دستگاه مخصوص می نویسد .برون خطی ، ماشین شخصیت های چاپ شده واعداد دست خط می تواند با دقت بالاتر از99% شناخته شود . ازآنجا که تنها بررسی انسان می تواند رسیدن به تشخیص (شناخت) کامل باشد، دو مساله درنظرگرفته شده به خوبی حل شده است . درحال حاضر چندین نرم افزار تجاری وابزارهای موجود برای این کاربرد خاص وجود دارد . بااین حال ، تمرکز این تحقیقات برای فرآیند تشخیص شخصیت دست خط برون خطی (آنلاین)است.

اسکنرمی توان تصویریک صفحه کاغذ رابه صورت یک فایل گرافیکی (تصویری)، به رایانه ارسال ودرآن ذخیره نمود.بدین ترتیب کاربر می تواند با یک نرم افزارمناسب نمایش دهنده تصاویر، تصویرصفحه اسکن شده رابرروی نمایشگررایانه خود ملاحظه نماید یاآن راچاپ کند; اما قادرنخواهد بود که متن موجود درتصویرسندراویرایش کندیاآن رامورد جستجوقراردهد.یک نرم افزار<< ا سی آر>> ، تصویراسکن شده رامی خواند ، محتویات آن (شامل متن ، خطوط،تصاویر،جداول،…)را شناسایی می نماید، وسپس آن را به یک قالب ویرایش (درواژه پردازها) تبدیل می کند. امروزه بیشتراسکنربه نرم افزارهای << ا سی آر>> مجهزگردیده اند وقادرند متن موجود دریک سند اسکن شده را تشخیص دهند وآن را باهمان نحوه قالب بندی ، ستون بندی ، جدول بندی ونوع فونت مطابق باشند کاغذی اصلی ، درقالب یک فایل متنی با قالب بندی مناسب ذخیره نمایند .



درباره نویسنده

مدیر سایت بازار فایل

مدیر 10 نوشته در بازار فایل دارد . مشاهده تمام نوشته های

دیدگاه ها


دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

چهار × سه =