Методы улучшения распознавания символов
Автор: Искандарова С.Н., Хурсандова Р.
Журнал: Теория и практика современной науки @modern-j
Рубрика: Медицина и здоровье
Статья в выпуске: 7 (25), 2017 года.
Бесплатный доступ
В данном тезисе рассматриваются методы и процессы улучшения распознавания символов. Для отсканированных данных используются методы удаления шума, потери изображения, фильтрации и разделения символов, а так же их правильная интерпритация.
Весовой коэффициент, рандомизация, распознавание образов
Короткий адрес: https://sciup.org/140272070
IDR: 140272070
Текст научной статьи Методы улучшения распознавания символов
Arab bosma matnini tanish tizimi bir necha bosqichdan iborat.Birinchi navbatda matn tahlil qilinadi va aloxida blokka olinadi,undan keyin skaner qilinadi va xuddi Bit-map tasviri kabi xotiraga saqlanadi.Arab tilida yozilgan so’zlarda bir xil ko’rinishlarda unli harf bor,bir xil ko’rinishlarda esa unli harf yo’q.Matnda unli harflarni qanday tanishi va qanday tuzilishga ega ekanligi haqida davom etamiz.
Filtirlash
Filtirlash paytida bizga xalaqit berayotgan shovqinlar olib tashlanadi,Tasvir ikkilik tasvir shaklida bo’ladi bu jarayon skanerlash vaqtida amalga oshiriladi.Ko’plab ananaviy tasvirlarni filtirlash ucjun bir qacha filtrlash turlari bor.Masalan:Gaussa filtiri, o’rtacha filtirlash va boshqalar.Lekin qanday filtirlash usulidan qatiy nazar birinchi navbatda uning samadorligi maqsad qilib olinadi.Yuqorida ko’rganimizdek 1 – 2 rasmlar filtirlash amalga oshirilgandan so’ngi natijalardir.Filtirlash jarayonida matnni bir zarracha deb olib bitmap shaklida tekshiradi va uning sakkiz qo’shnilarini o’rtacha qaytaradi.(3 – rasmga qarang).
10 |
1 |
12 |
20 |
5о |
100 |
1 |
50 |
30 |
1 1 |
25 |
20 |
40 ▲ |
50 |
12 |
25 |
25 |
30 |
40 |
50 |
20 |
30 |
60 |
51 |
60 |
1 |
20 |
25 |
30 |
•30 |
40 |
40 |
50 |
50 |
-
3 –rasm. O‘rtacha filtirlash.
-
4 – rasm. Gorizontal sigmentatsiya.
Matn sigmentatsiyasi
Gorizontal sigmentatsiya.
Bu bosqich matni gorizontal sigmentatsiyalashni ko’zda tutadi va uni tarmoqlarga oladi.Bunda asosiy etiborni individual chiziqlar orasidagi masofani juda yaqin aniqlash talab etiladi. Ushbu yangi matn maydoni malim bir kattalikdagi,ikki chiziq orasidagi masofa kam bo’lsa,ushbu ikki qatorning biri sifatida idrok etildi.Quydagi gorizontal sigmentatsiya bo’ladi.
-
- Sarr boshi belgilanadi.Bu kamida bir qora pikselni o’z ichiga olgan,bir
tomonlama matritsasi, birinchi tarmog’i mos keladi.
-
- Qator oxirida ikkilik matritsa bo’yicha qora piksel yo’q.Jarayon
o’ngdan chapga amalga oshiriladi.
Vertikal sigmentatsiya.

5 – rasm.Vertikal sigmentatsiya.
-
- So’z boshida bir qora piksel o’z ichiga ikkilik matritsani birinchi ustun
bo’ylab oladi.
-
- Oxiridagi so’zni o’z ichiga olgan qora piksel yo’q bo’lgani uchun
birinchi ustun bo’ylab oladi.
Ramzlar uchun Split so’zlar.
Aniqlashimiz uchun kerak bo’ladigan so’zlarni tanlash:
-
1) Qatorlardagi aloqa.U xuddi qatorlardagi kabi qora pikselni tashkil qiladi kontsentratsiyalar bilan.
-
2) Har bir qator uchun eng yuqori kontsentratsiya sifatida belgilab oladi.Bunda qora piksel o’z ichiga yuqoridan birinchi tarmoqni oladi.
-
3) Har bir so’z ustun uchun pastki chiziqdan hisoblanadi.Bunda qora piksel o’z ichiga pastdan birinchi tarmoqni oladi.
-
4) Vertikal gistogram boshlanishi uchun unga teng yoki unda kam bo’lishi kerak.
Foydalanilgan adabiyotlar ro’yxati.
-
[1] El-Sheikh T. S., Guindi R. M. Computer Recognition of Arabic Cursive Script, Pattern Recognition // 21(4). 1988. P. 293–302.
-
[2] Hussain F., Cowell J. Character Recognition of Arabic and Latin Scripts // Proc. IEEE International Conference on Information Visualisation. 2000. P. 51– 56.
-
[3] Amin A. Un systeme pour la reconnaissance et la comprehension de la arabe ecrit et imprime. These de etat. — Nancy. December 1985.
-
[4] Граничин О. Н., Поляк Б. Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. — М.: Наука. 2003. 291 с.
Список литературы Методы улучшения распознавания символов
- El-Sheikh T. S., Guindi R. M. Computer Recognition of Arabic Cursive Script, Pattern Recognition // 21(4). 1988. P. 293-302.
- Hussain F., Cowell J. Character Recognition of Arabic and Latin Scripts // Proc. IEEE International Conference on Information Visualisation. 2000. P. 51-56.
- Amin A. Un systeme pour la reconnaissance et la comprehension de la arabe ecrit et imprime. These de etat. - Nancy. December 1985.
- Граничин О. Н., Поляк Б. Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. - М.: Наука. 2003. 291 с.