Improved Mixed Thai & English OCR using
Two-step Neural Net Classification


Chularat Tanprasert, Wasin Sinthupinyo, and Premnath Dubey
Software Technology Laboratory,
the National Electronics and Computer Technology Center (NECTEC),
108 Bangkok Thai Tower Building, Floor 11th, Rangnam Road,
Phayathai, Bangkok 10400 THAILAND
Thitipong Tanprasert
Faculty of Science and Technology, Assumption University,
Hua Mark, Bangkok, 10240, THAILAND


ABSTRACT -- This paper presents a new technique in applying artificial neural networks to solve the problem of Thai and English Optical Character Recognition (Thai & English OCR). The Kohonen self-organization and back propagation models are applied for rough and fine classifications to the Thai & English typed fonts, respectively. The experimental results confirm that the proposed technique is a major improvement in Thai & English OCR technology.
Keywords -- Thai & English OCR, Kohonen self-organization, Back propagation model

บทคัดย่อ -- บทความนี้ได้เสนอแนวทางใหม่ในการประยุกต์ใช้โครงข่ายประสาทเทียมกับการรู้จำตัวอักษรไทยและอังกฤษ โดยใช้การจัดตัวเองแบบโคโฮเนนในการแบ่งกลุ่มตัวอักษรอย่างหยาบๆ และใช้รูปแบบการแพร่กระจายย้อนกลับในการรู้จำอย่างละเอียดอีกขั้นหนึ่ง ผลการทดลองแสดงให้เห็นถึงความสามารถในการรู้จำที่สูงขึ้นสำหรับตัวอักษรไทยและอังกฤษ
คำสำคัญ -- การรู้จำตัวอักษรไทยและอังกฤษ, การจัดตัวเองแบบโคโฮเนน, รูปแบบการแพร่กระจายย้อนกลับ

Reprint -- Reprint from Proceedings of the 1997 International Conference on Neural Information Processing and Intelligent Information Systems, Vol. 2, pp. 1227-1230


National Electronics and Computer Technology Center (NECTEC)
Copyright  © 2001 By Information System Service Section. All right reserved.