การรู้จำหน่วยเสียงสระเสียงเดี่ยวสำหรับภาษาไทยโดยการใช้ทรานส์เฟอร์ฟังก์ชันของอวัยวะกำทอนเสียงบนสเกลบาร์ก
Unmixed Vowel Utterances Recognition in Thai spoken language using Vocal Tract Transfer functions on the Bark scale


นริศ บุญศักดิ์เฉลิม วรา คงคาวิทูร ไกรสิน ส่งวัฒนา
ภาควิชาวิศวกรรมไฟฟ้า คณะวิศวกรรมศาสตร์ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
โทร: 662 3269967 ; Email: kskraisi@kmitl.ac.th


ABSTRACT -- In this paper we address the problem of unmixed vowel utterances recognition in Thai spoken language. The vowel utterances to be recognized are "i", "e", " ", "w", "g", "a", "u", "o", and " ". Each utterance is represented by a 18-dimensional feature vector of Critical Band Intensities of the vocal tract transfer function which is determined from Linear Predictive Coding Coefficients. Using the K-Nearest Neighbor rule on feature vectors of sample utterance show the maximum accuracy of 96%.
KEYWORDS -- Vowel Recognition, Bark scale, K-Nearest Neighbor

บทคัดย่อ -- บทความนี้เสนอวิธีการในการรู้จำหน่วยเสียงสระเสียงเดี่ยวในภาษาไทย และวิธีการปรับปรุงระบบเพื่อให้ได้ประสิทธิภาพสูง โดยหน่วยเสียงสระที่จะทำการรู้จำ คือ เสียง อิ, เอะ, แอะ, อึ, เออะ, อะ, อุ, โอะ และเอาะ แต่ละหน่วยเสียงนั้นจะถูกแทนโดยเวคเตอร์ 18 มิติ โดยแต่ละมิติ คือ Critical Band Intensity ของ Transfer Function ของอวัยวะกำทอนเสียงในการกำเนิดเสียงนั้นๆ ซึ่งคำนวณจากสัมประสิทธิ์ที่ได้จากการทำ Linear Predictive Coding (LPC) การทดลองจะทำการเก็บตัวอย่างเสียงมาทำการคำนวณ Transfer Function ของอวัยวะกำทอนเสียงจาก LPC อันดับต่างๆ แล้วจึงใช้เทคนิค K-Nearest Neighbor ในการแยกแยะเวคเตอร์ ผลการทดลองพบว่าได้ความถูกต้องเฉลี่ยในการรู้จำสูงสุดเท่ากับ 96%
คำสำคัญ -- การรู้จำเสียงสระ, สเกลบาร์ก, K-Nearest Neighbor


National Electronics and Computer Technology Center (NECTEC)
Copyright  © 2001 By Information System Service Section. All right reserved.