อินเทลแข่งไมโครซอฟท์ผนวกคำสั่งเสียงและภาพ
อินเทลเร่งพัฒนาโปรแกรมแปลข้อมูลภาพ ประกาศเปิดตัวซอฟต์แวร์อ่านริมฝีปากเชื่อมโยงคำพูด
ขณะที่เผยเตรียมดัดแปลงใช้สังเกตการณ์ผู้ป่วย และตรวจหาอาชญากร ด้านผู้เชี่ยวชาญชี้เทคนิคคล้ายจีวินโดว์ส
สำนักข่าวซีเน็ต รายงานว่า บริษัท อินเทล คอร์ป. ผู้ผลิตชิพรายใหญ่ของโลก
ได้เปิดตัวซอฟต์แวร์จดจำคำพูดระบบโสตทัศนะ "ออดิโอ
วิช่วล สปีช รีคอกนิชั่น" หรือเอวีเอสอาร์ (The
Audio Visual Speech Recognition-AVSR) ซึ่งมีคุณสมบัติในการเชื่อมโยงลักษณะการเคลื่อนไหวของปากกับคำพูด
เพื่อให้คอมพิวเตอร์สามารถรับคำสั่งด้วยเสียงได้แม้ในบริเวณที่มีเสียงอึกทึก
ตัวแทนอินเทล เปิดเผยว่า โปรแกรมเอวีเอสอาร์
เป็นส่วนหนึ่งของห้องสมุดโอเพ่น ซีวี ซึ่งเป็นศูนย์รวบรวมระบบงานโอเพ่นซอร์ส และเครื่องมือที่ช่วยให้คอมพิวเตอร์สามารถแปลความหมายข้อมูลภาพได้
โดยซอฟต์แวร์ตัวนี้ได้รับการพัฒนาขึ้นในห้องทดลองสาขาประเทศจีน ของอินเทล ทั้งนี้
ผู้ผลิตคอมพิวเตอร์ได้พยายามพัฒนาระบบงานจดจำเสียงมาเป็นเวลานานแล้ว แต่เทคโนโลยีดังกล่าวก้าวหน้าขึ้นหลังจากที่อุตสาหกรรมคอมพิวเตอร์เริ่มหันมาใช้ชิพความเร็ว 1.5-3
กิกะเฮิรตซ์ ซึ่งช่วยให้หน่วยประมวลผลพีซีสามารถรองรับระบบคำสั่งเช่นนี้ได้
ผู้เชี่ยวชาญกล่าวว่า เทคโนโลยีเอวีเอสอาร์ เป็นแนวคิดในการปรับปรุงระบบงานจดจำเสียงวิธีหนึ่ง
ด้วยการนำสัญญาณภาพมารวมกับโปรแกรมจดจำเสียง คล้ายคลึงกับการพัฒนาระบบงานต้นแบบ "จีวินโดว์ส"
(GWindows) ของไมโครซอฟท์ ซึ่งช่วยให้ผู้ใช้คอมพิวเตอร์สามารถอ่านชื่อไฟล์หรือเปลี่ยนหน้าจอวินโดว์สได้โดยการผนวกคำสั่งเสียงเข้ากับคำสั่งท่าทาง
นายแอนดี้ วิลสัน ผู้ออกแบบโปรแกรมจีวินโดว์ส อธิบายว่า โปรแกรมดังกล่าวสามารถทำงานได้ดีกว่าระบบจดจำเสียงทั่วไป
เนื่องจากการใช้ท่าทางประกอบ จะช่วยเพิ่มระดับความแม่นยำในการอ่านคำสั่ง
นอกจากนี้ ตัวแทนอินเทล เปิดเผยอีกว่า
ทางบริษัทยังเตรียมพัฒนาระบบงานภาพอื่นๆ ที่อาศัยเทคโนโลยีเอวีเอสอาร์ อาทิ ซอฟต์แวร์ที่ใช้กล้องถ่ายภาพในการสังเกตการณ์ผู้ป่วยในโรงพยาบาล
และซอฟต์แวร์ที่ใช้ข้อมูลจากกล้องรักษาความปลอดภัย เพื่อค้นหาผู้มีแนวโน้มเป็นอาชญากรตามที่จอดรถต่างๆ
โดยโปรแกรมเหล่านี้ต่างอาศัยหลักการเดียวกันคือ การกำหนดให้เครื่องคอมพิวเตอร์ส่งสัญญาณเตือนเมื่อเห็นสถานการณ์ผิดปกติ
เช่น เมื่อคลื่นสมองผู้ป่วยเริ่มเต้นช้าลง
หรือพบคนเดินจากรถคันหนึ่งไปยังรถอีกคันหนึ่ง แทนที่จะเดินตรงไปยังห้าง
ขณะเดียวกัน อินเทลยังได้เปิดตัวโปรแกรมห้องสมุดทางเทคนิคสำหรับสร้างเครือข่ายเบยีเชี่ยน (Bayesian network) เวอร์ชั่นทดสอบ และมีกำหนดเปิดตัวห้องสมุดเวอร์ชั่นสมบูรณ์ ภายใต้ชื่อ "โพรเบบิลิตี้ เน็ตเวิร์ค ไลบรารี่" (Probability Network
Library) ภายในช่วงสิ้นปีนี้
ที่มา
: กรุงเทพธุรกิจ
ฉบับวันที่ 30 เมษายน 2546
|