- บทความ | นัทธ์หทัย ทองนะ
ภาพประกอบ | กันยาเรศ นาคเรือง
บ่อยครั้งที่เรามักจะได้ยินคำว่า “Digital Transformation” แทรกซึมอยู่แทบทุกกิจกรรม องค์กร ธุรกิจ โดยเฉพาะอย่างยิ่งในยุคที่มีการแข่งขันสูงอย่างปัจจุบัน Digital transformation คือ ส่วนสำคัญในการสร้างศักยภาพด้านการแข่งขันให้สามารถพัฒนาเป็นไปตามความคาดหวังของกลุ่มเป้าหมาย ส่งผลให้การดำเนินงานหรือธุรกิจต่าง ๆ ประสบความสำเร็จ
Digital Transformation จึงเกี่ยวข้องกับการใช้เทคโนโลยีดิจิทัล เป็นการสร้างกระบวนการใหม่ให้มีประสิทธิภาพ และประสิทธิผลมากขึ้น ไม่เพียงแต่เป็นการนำเทคโนโลยีเข้าทำซ้ำบริการที่มีอยู่ในรูปแบบดิจิทัลเท่านั้น แต่เป็นการใช้เทคโนโลยีเพื่อเปลี่ยนแปลงบริการดังกล่าวจาก “สิ่งที่มีอยู่” ให้เป็น “สิ่งที่ดีกว่าเดิม” แต่เทคโนโลยีก็สามารถเปลี่ยนแปลงได้ตลอดเวลา โดยหัวข้อที่ส่วนใหญ่มักจะพูดถึงมากที่สุดในตอนนี้คงหนีไม่พ้นเรื่องการนำปัญญาประดิษฐ์ AI เข้ามาช่วยการ Digital Transformation
บทบาทของเนคเทคในการพัฒนา AI …ทำอะไรบ้าง?
เนคเทคได้รวบรวมผลงานพร้อมใช้ที่พัฒนาอยู่บนเทคโนโลยี AI มาให้บริการเพื่อให้คนไทยได้เข้าถึงในชื่อของ AI Service Platform มาช่วยเพิ่มประสิทธิภาพในการดำเนินงาน (Operation) ให้ดีขึ้น (Save Cost) ประหยัดมากขึ้น ทรัพยากรที่ใช้ในการผลิตและบริการ (Resource) ต้องใช้น้อยลง ภายใต้แนวคิดที่ร้อยเรียงกันทั้ง 3 ส่วน คือ
- 1. IoT: Data collection through IoT
- เป็นพื้นฐานโครงสร้าง (Infrastructure) ทำหน้าที่เก็บข้อมูลมาเยอะ ๆ จากเซนเซอร์ของสิ่งต่าง ๆ ที่เราใช้งาน เช่น หลอดไฟ อุณหภูมิ ฝุ่น เป็นต้น
- 2. Big data: Capture, storage, and analysis of data-IoT: Data collection through IoT
- จากแหล่งเก็บข้อมูลเดิม ๆ ซึ่งเก็บข้อมูลจำนวนมหาศาลไม่พอ ก็จะมีเทคโนโลยีใหม่เข้ามาช่วยเก็บ และวิเคราะห์ข้อมูลด้วย แต่เราจะไม่หยุดเพียงเท่านี้ ไม่อย่างนั้นความฉลาดจะไม่เกิดขึ้น
- 3. AI: Data-based Learning พวก Deep Learning มาช่วยให้เกิดข้อมูล
- ข้อมูลดิบจากการจัดเก็บ ถูกกรอง และจัดแบ่งให้เป็นระเบียบในเบื้องต้นได้ด้วย AI แล้วจึงให้คนมาปรับแต่งและตรวจสอบ ก่อนส่งต่อเข้ากระบวนการเรียนรู้เพื่อสร้างเครื่องมือมาให้บริการ
Concept การให้บริการของซอฟต์แวร์
เดิมการให้บริการของซอฟต์แวร์แทนที่จะต้องลงแผ่น เช่น Microsoft Word, Adobe ในเครื่องคอมพิวเตอร์ ซึ่งมีข้อด้อยอยู่มาก ทำให้บริษัทผลิตซอฟต์แวร์ต่าง ๆ หันมาให้บริการในรูปแบบ Software as a Service (SaaS) หรือเรียกว่า “On Demand Software” คือ รูปแบบการให้บริการซอฟต์แวร์ผ่านทางอินเทอร์เน็ต Web Server คล้ายกับการเช่าใช้ เพียงแค่ผู้ซื้อจ่ายค่าซอฟต์แวร์ตามลักษณะการใช้งานที่ต้องการ (Pay-as-you-go) เช่น ตามจำนวนผู้ใช้และตามระยะเวลาที่ต้องการใช้ เพียงเท่านี้ผู้ซื้อก็สามารถเข้าใช้งานได้ ปัจจุบันได้เปลี่ยนรูปแบบการให้บริการในลักษณะ Micro Service ซึ่งย่อยลงไปอีก เทรนด์ที่กำลังเข้ามา คือ การให้บริการในรูปแบบ AIaaS (Artificial Intelligence as a Service) หรือเรียกว่า การให้บริการซอฟต์แวร์ด้วย Cloud AI
การส่ง Input ด้วยภาษาหนึ่งแล้ว Output ออกมาเป็นอีกภาษาหนึ่ง เช่น การส่ง Input เป็นข้อความภาษาไทยแล้วแสดงผล Output เป็นภาษาอังกฤษ หรือการส่งรูปภาพเข้าสู่บริการ Micro Service ที่เป็นการนับใบหน้า ระบบก็จะนับใบหน้าว่าในห้องนี้นั่งกันอยู่กี่คน ซึ่งการให้บริการแบบ Micro Service นี้กำลังที่เป็นเทรนด์ที่ให้บริการกันอยู่
จากภาพจะเห็นว่ารายได้การเติบโตจาก AI มีลักษณะการเจริญเติบโตแบบทะยานสูงขึ้น เพราะ AI เป็นสิ่งที่เกือบทุกบริษัทต้องการให้มี เพื่อลดค่าใช้จ่าย เพิ่มประสิทธิภาพในการทำงาน จึงเห็นแนวโน้มว่า AI มีการเจริญเติบโตเรื่อย ๆ
ยักษ์ใหญ่ในตลาด Cloud &AI
มี 4 บริษัทยักษ์ใหญ่ระดับโลกที่ให้บริการเกี่ยวกับ AI ได้แก่ Google Cloud, Microsoft Azure, Amazon, IBM Cloud ซึ่งเมื่อมีตรงนี้แล้วบริษัทต่าง ๆ ก็สามารถเข้าไปใช้งานได้ แต่ก็ไม่สามารถ Plug and Play ได้เช่นกัน เช่น กรณีมีข้อมูลแล้วอยากให้ทำ AI ก็ไม่สามารถทำได้ เพราะยังขาดความรู้เชิงลึกในสาย Computer Science คือ มีบริการให้ใช้ แต่ถ้า Apply ผิด ก็ประยุกต์ใช้ได้ไม่ถูก ซึ่งบุคคลที่ทำหน้าที่เหล่านี้ คือ Data Scientist บุคคลเหล่านี้จะต้องมีทักษะรอบด้าน Programming Database, Communication, Visualization Skill และความรู้แบบเฉพาะทาง เช่น Financial ความรู้ในทางที่ต้องการจะนำไปประยุกต์ใช้งานในด้านอื่นๆ
โดยเมื่อเร็วๆนี้ มีข่าวด้านไอทีว่ามีการสำรวจบริษัทต่าง ๆ ในยุโรปกว่า 2830 บริษัท พบว่ากว่า 40 % ที่เป็นบริษัทด้าน AI ไม่ได้ใช้ AI at all หมายความว่าไม่ได้ใช้ AI เลย แต่บริษัทเหล่านั้นก็ยังเคลมว่ามี AI ในบริษัท สาเหตุที่เป็นแบบนั้น เพราะเมื่อเคลมสถานะบริษัทว่าเป็น Startup ด้าน AI จะได้รับเงิน Funding เฉลี่ยแล้วกว่า 15 % มากกว่าบริษัทที่ไม่มี AI สรุปแล้วเท่และได้เงินด้วย จะเห็นว่า AI ในโซนยุโรป อเมริกามีการพัฒนาไปได้ไกลมาก แต่ในความจริงแล้วไม่สามารถ Apply ได้เยอะขนาดนั้น เพราะสิ่งที่ยังขาด คือ ทักษะและบุคลากร ซึ่งการ Apply นั้นก็ต้องดูด้วยว่าเหมาะสมหรือเปล่า
The valley of death
จากงานวิจัยในห้องแลปพัฒนาสู่ต้นแบบ ฝ่าฟันจนมี Business Model เพื่อให้เกิดการซื้อจากคนที่ยอมจ่ายเงิน การ Commercialization คือ ส่วนที่ต้องใช้เวลาเนื่องจากเทคโนโลยีต้องสามารถตอบโจทย์ (Pain Point) ว่าเข้าไปช่วยให้ชีวิตดีขึ้นยังไงบ้าง เช่น ทำงานให้ง่ายและเร็วขึ้น เนคเทคในฐานะที่มีความเชี่ยวชาญด้านการวิจัยและพัฒนา R&D จึงตั้งบทบาทเป็น Service และพัฒนา Module AI ให้ดีที่สุด เพื่อให้ผู้ใช้ได้มีโอกาสนำไปพัฒนาต่อยอดให้ทั่วถึงทั้งระดับ SME หน่วยงานภาครัฐ เอกชน รวมถึงStartup และเปิดโอกาสให้องค์กรณ์ต่าง ๆ ได้เป็นผู้ดำเนินการแทน เพราะว่าพวกตัวแทนจากบริษัทจะรู้ดีว่า Pain Point ของบริษัทตัวเองอยู่ตรงไหน ตรงนี้สามารถตอบโจทย์อะไรได้บ้าง
จากกราฟนี้จะเป็นสิ่งที่จะบอกได้ว่า AI Service Platform ที่เนคเทคพัฒนาจะตอบโจทย์ได้จนถึงส่วนของ Technology Transfer โดยจะพัฒนาให้ดีที่สุดแล้วปล่อยให้หน่วยงานต่างๆ นำไปใช้งาน
AINRG (Artificial Intelligence Research Group)
AI ในเนคเทคมีหน่วยงานที่มีประสบการณ์กว่า 20 ปี ปัจจุบันมีชื่อว่ากลุ่มวิจัยปัญญาประดิษฐ์ AINRG (Artificial Intelligence Research Group) วิจัยและพัฒนาเทคโนโลยีแพลตฟอร์มทางด้านปัญญาประดิษฐ์และการประมวลผลภาษาไทย เพื่อสนับสนุนการใช้งานและต่อยอดในภาคอุตสาหกรรมบริการภายในประเทศ
Mission การทำ R&D ทางด้าน AI and NLP เนคเทคมีความเชี่ยวชาญพอสมควรจากประสบการณ์ 20 ปี เพื่อให้เกิดการใช้งาน AI ภายในประเทศไทย โดยหน้าตาของ AI Service Platform มี 3 ส่วน
- 1. การประมวลผลภาษา
- เนคเทคมีความเชี่ยวชาญในภาษาไทย ไม่ว่าจะเป็นการตัดคำ การวิเคราะห์ไวยากรณ์ (Grammar) การรู้จำชื่อบุคคลชื่อสถานที่ การวิเคราะห์คำเฉพาะการแปลภาษา การวิเคราะห์ขั้วอารมณ์ของข้อความ โดยจะรวบรวมประยุกต์สิ่งเหล่านี้ให้อยู่ในรูปแบบบริการ ที่มีการจัดการ Input ที่ส่งเข้ามา และตอบกลับเป็น Output ที่เป็นรูปแบบเดียวกัน
- 2. Vision คือ การประมวลผลพวกรูปภาพและวิดีโอ
- ด้านการประมวลผลรูปภาพของเนคเทค ทีมวิจัยและพัฒนามีความเชี่ยวชาญในด้านต่าง ๆ ดังต่อไปนี้
- OCR ในมิติที่เฉพาะลงไป เช่น สามารถ Customize กับป้ายจราจร ซึ่งเนคเทคจะพยายามทำในมุมที่ลึกลงไป
- Object recognition มีการใช้งานจำนวนมาก โดยทางเนคเทคมีทีมนักวิจัยที่มีประสบการณ์ทางด้านนี้ เช่น การถ่ายภาพใบข้าว แล้ว Identify ว่ามีโรคอะไรเกิดขึ้นบ้างในใบข้าว และสามารถที่จะ Apply ความรู้ตรงนี้ได้เพื่อต่อยอดต่อไป
- Face Analytics เป็นสิ่งหนึ่งที่จำเป็นต้องทำเนื่องจากมี Data Privacy แม้ว่าปัจจุบันหลาย ๆ บริษัท ไม่ว่าจะ 4 บริษัทยักษ์ใหญ่ที่ให้บริการด้าน Cloud และ AI ต่างก็มี หรือแม้กระทั่งบริษัทมือถือเจ้าใหญ่ในประเทศจีนก็มีใช้ แต่ถ้าประเทศไทยเราไม่มีสิ่งนี้ ก็จำต้องนำเข้าองค์ความรู้นี้จากต่างประเทศ ดังนั้นใบหน้าของเราแทนที่จะที่อยู่ในหน้าหน่วยงานเรา ก็จะไปแสดงผลอยู่ใน Cloud ส่วนไหนของโลกก็ไม่รู้ นี่คือเหตุผลว่าทำไมประเทศไทยถึงจำเป็นต้องมีและทำขึ้นมาก
- Person & Active Analytics คือ การ Detect Activity เช่น การยกมือถือ วางของทิ้งไว้ หรือมีแอปพลิเคชันเชิงถ่ายวิดีโอ แล้วดูพฤติกรรมการใส่หมวกกันน็อค ใช้ในการ Detect เพื่อความปลอดภัยได้
ซึ่งถ้าลองย้อนกลับไปดูเนคเทคมี Open Source ที่ค่อนข้างใช้งานได้ดีอยู่แล้ว เราเพียงวิจัยพัฒนาต่อยอดให้ดีขึ้นไปอีก ด้วยคอนเซ็ปต์ที่ว่า “นำสิ่งที่มีอยู่แล้ว มาต่อยอดให้ดีขึ้น”
- 3. Conversation (การสนทนา)
- เนคเทคยังมีความชำนาญด้าน Speech to Text และ Text to Speech ซึ่งเป็นเทคโนโลยีที่พัฒนามาอย่างต่อเนื่อง โดยเน้นความเชี่ยวชาญในการรู้จำและสร้างสัญญาณเสียงภาษาไทย แล้วแปลเป็นข้อความผ่าน Chatbot ให้เข้าใจว่าเป็น Intent Sentiment แล้วตอบโต้ออกมาเป็นเสียง
Strength & Differentiation
- ความเชี่ยวชาญด้านการประมวลผลภาษาไทย
- พร้อมแนะนำและให้คำปรึกษา
- สร้างโมเดลที่แตกต่างจากทั่วไป โดยสร้างการจำลองโมเดลที่บ่งบอกถึงลักษณะเฉพาะที่ เช่น ส่งภาพเข้าไปแล้วสามารถแสดงผลว่า นี่คือ ส้มตำ ผัดไท รวมทั้งด้านวัฒนธรรม เช่น วัดวาอาราม สามารถถ่ายรูปพระแล้วบอกได้ว่า นี่คือ ศาสนาพุทธ
Virtual Assistant : JibJib
ภายใน ‘JibJib’ ประกอบด้วยเทคโนโลยี 3 ตัวหลัก ของเทคโนโลยีหมวด Conversation อันได้แก่ Speech to text (Partii), Chatbot (Abdul), และ Text to speech (Vaja) ที่มีความสามารถในการฟังคำพูด/คำสั่งภาษาไทย ประมวลผลคำตอบ และพูดตอบด้วยภาษาไทย
JibJib ถูกนำเสนอด้วยลักษณะของ 3D Avatar ที่เลียนแบบลักษณะคน โดยใส่ Character ความเป็นไทย โดยสามารถนำไปประยุกต์ใช้เป็น Digital Reception ตามร้านต่าง ๆ หรืองาน Expo สำหรับรองรับคำถามคำตอบที่ผู้ร่วมงานสงสัยได้ในเบื้องต้น
Technology Roadmap
อนาคตเป็นสิ่งที่น่าจับตามองว่าวันนี้เนคเทคได้ดำเนินการกับหลายภาคส่วน การสร้างพันธมิตร บ่มเพาะก่อเกิดเป็น Community ด้าน AI รวมทั้งคาดหวังว่าหากประเทศไทยมี AI Service platform ที่สามารถนำไปประยุกต์ใช้ทั้ง AI ด้านภาษา ด้านการมองเห็น ด้านการสนทนา แล้วเนคเทคพร้อมขยายผลและส่งเสริมการใช้งานอย่างแน่นอน
แผนการพัฒนา AI Service Platform มีในระยะเวลา 3 ปี ให้ติดตามและเท่าทันต่อเทคโนโลยีด้าน AI ที่กำลังถูกพัฒนา และเปลี่ยนแปลงไปอย่างรวดเร็ว โดยปีที่ 1 (พ.ศ. 2563) โครงการจะเริ่มพัฒนาแพลตฟอร์มด้วยการนำเทคโนโลยีด้านปัญญาประดิษฐ์ที่มีอยู่ในปัจจุบันของเนคเทคมาเริ่มให้บริการในรูปแบบ web service API ซึ่งจะทำให้ระบบสามารถให้บริการใช้งาน Engine ต่าง ๆ ได้ตามคุณสมบัติดังต่อไปนี้ Sentiment Analysis (S-Sense): สามารถจัดข้อความภาษาไทยลงกลุ่ม sentiment ที่กำหนดไว้ได้โดยใช้ Deep learning, Machine Translation (Parsit): สามารถแปลข้อความภาษาไทยในโดเมนการท่องเที่ยวให้เป็นภาษาอังกฤษได้, Face Analytics: สามารถระบุใบหน้าคนในภาพได้ถูกต้องจากการฝึกฝนจากใบหน้าคนไทยเพิ่มขึ้น, Person & Activity Analytics: สามารถตรวจจับและวิเคราะห์ส่วนของร่างกายคนได้, Thai OCR (ArnThai): สามารถวิเคราะห์ตัวอักษรและโครงสร้างของเอกสารที่ได้จากภาพสแกนได้, Object Detection: สามารถตรวจจับยานยนต์จากภาพได้, Speech-to-Text (Partii): สามารถรู้และจำคำพูดภาษาไทยได้โดยใช้ LSTM-based neural networks, Text-to-Speech (Vaja): สามารถสร้างเสียงพูดภาษาไทยได้โดยใช้ Deep neural network, และ Chatbot (ABDUL): สามารถโต้ตอบกับผู้ใช้ตาม Pattern ที่กำหนดไว้ได้
ในระหว่างการให้บริการ แพลตฟอร์มจำเป็นต้องพัฒนาโครงสร้างอย่างต่อเนื่องเพื่อให้เท่าทันเครื่องมือและเทคโนโลยีที่ห้องปฏิบัติการวิจัยต่าง ๆ จำเป็นต้องใช้ รวมถึงรองรับการปรับแต่งเครื่องมือต่าง ๆ ให้สามารถทำงานตาม Application Program Interface (API) ที่อาจเปลี่ยนแปลงไปตามเทคโนโลยีได้ โดยในปีที่ 2 และ 3 (พ.ศ. 2564-2565) AI Engine ต่าง ๆ จะมีความสามารถเพิ่มขึ้น และพร้อมให้บริการตามแผนวิจัยและพัฒนาดังนี้
- S-Sense: ในปีที่ 2 สามารถวิเคราะห์ Intent ในข้อความภาษาไทยได้ ส่วนในปีที่ 3 สามารถวิเคราะห์ Emotion ของข้อความภาษาไทยได้
- Parsit: ในปีที่ 2 สามารถแปลงข้อความภาษาไทยในโดเมนการท่องเที่ยวเป็นภาษาจีนได้ ส่วนในปีที่ 3 สามารถแปลงข้อความภาษาไทยในโดเมนการท่องเที่ยวเป็นภาษาอาเซียนได้
- Face analytics: ในปีที่ 2 สามารถวิเคราะห์อารมณ์ของคนจากภาพได้ ส่วนในปีที่ 3 สามารถรู้และจำหน้าของคนไทยได้แม่นยำยิ่งขึ้น
- Person & activity analytics: ในปีที่ 2 สามารถวิเคราะห์องค์ประกอบของภาพได้ดียิ่งขึ้น และสามารถแยกเพศของคนได้ ส่วนในปีที่3 สามารถบ่งบอกประเภทของกิจกรรมของบุคคลในภาพได้
- ArnThai: ในปีที่ 2 สามารถวิเคราะห์ตัวอักษรที่ใช้ Font ต่าง ๆ และวิเคราะห์ตารางจากเอกสารที่ได้จากภาพสแกนได้ ส่วนในปีที่ 3 สามารถวิเคราะห์ตัวอักษรจากเอกสารที่ได้จากกล้องดิจิทัลได้
- Object detection: ในปีที่ 2 สามารถใช้ Deep learning มาวิเคราะห์วัตถุในภาพทางการเกษตรได้ ส่วนในปีที่ 3 สามารถเรียกใช้เครื่องมือบน Embedded system ได้โดยเน้นการวิเคราะห์ภาพอาหารไทย และโดเมนการท่องเที่ยว
- Partii: ในปีที่ 2 สามารถรู้และจำเสียงพูดแม้มีเสียงรบกวนได้ ส่วนในปีที่ 3 สามารถแปลงสัญญาณเสียงพูดเป็นอักขระภาษาไทยได้โดยตรง
- Vaja: ในปีที่ 2 สามารถให้บริการสร้างเสียงพูดภาษาไทยตามน้ำเสียงที่กำหนดได้ ส่วนในปีที่ 3 สามารถให้บริการสร้างเสียงพูดภาษาไทยตามสำเนียงท้องถิ่นที่กำหนดได้
- Chatbot: ในปีที่ 2 สามารถโต้ตอบได้ตามบทสนทนาที่กำหนด ส่วนในปีที่ 3 สามารถตอบโต้บทสนทนาได้โดยอัตโนมัติ