คลาวด์คอมพิวติงแพลตฟอร์มสำหรับการประมวลผล Data Mining บนข้อมูลขนาดใหญ่ (KitWai Cloud Computing Platform for Large-scale Data Mining) เป็นต้นแบบคลาวด์คอมพิวติงแพลตฟอร์มในลักษณะของ On-demand Apache Spark Cluster บน OpenStack Cloud ที่จะช่วยสร้างบริการประมวลผล data mining หรือ machine learning ที่ขยายได้แบบยืดหยุ่น (elastic scale-out) ด้วยตนเอง (self-configure) โดยรองรับการประมวลผลบนหน่วยประมวลผลร่วมหรือ GPU ท่านสามารถดูรายละเอียดเพิ่มเติมได้ที่ https://kitwaicloud.github.io
จุดเด่นของเทคโนโลยี
- Application-aware automatic resource optimization
- รองรับการทำงานของHadoop, Spark และ HPC แอพลิเคชันบนคลัสเตอร์เดียวกันได้
- คำนวณเร็วด้วยเทคโนโลยี GPU และ in-memory processing
คุณสมบัติ
- สามารถติดตั้งลงบน Public หรือ Private OpenStack คลาวด์ได้โดยตรง
- บริหารจัดการ Spark คลัสเตอร์ของตนเองผ่านทางWeb Interface
- รองรับการเชื่อมต่อกับแหล่งข้อมูลหลายชนิด ได้แก่ RDBMS, NoSQL, Amazon S3, OpenStack Swift เป็นต้น
- รองรับการเชื่อมต่อกับแอพลิเคชันต่างๆ ได้หลายช่องทางเช่น REST API, Java API, CLI, JDBC, ODBC
- มี Library ที่รองรับการทำงานกับ NETPIE, distributed deep neural network training (Caffe) และ Thai Twitter Stream
ผู้ใช้งานเทคโนโลยีเป้าหมาย
- กลุ่มผู้ให้บริการ public และ privateคลาวด์
- นักวิจัยและนักพัฒนาซอฟต์แวร์สำหรับการประมวลผล data mining กับข้อมูลขนาดใหญ่
- กลุ่ม startup ที่ต้องการทำ ad-hoc data analystics
สถานภาพทางทรัพย์สินทางปัญญา
- อยู่ระหว่างการยื่นจดสิทธิบัตร “ระบบย้ายเครื่องเสมือนแบบบางส่วน”
วิจัยพัฒนาโดย
- ห้องปฏิบัติการวิจัยการจำลองขนาดใหญ่ (LSR)
- หน่วยวิจัยการวิเคราะห์ข้อมูลและการคำนวณ (DACRU)
- ดูรายละเอียดการใช้งานได้ที่ https://kitwaicloud.github.io
- พูดคุยกับทีมคิดไว : https://www.facebook.com/KitWaiNECTEC
สอบถามข้อมูลเพิ่มเติม
- ฝ่ายพัฒนาธุรกิจและถ่ายทอดเทคโนโลยี (BTT)
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค)
โทร. 0 2564 6900 ต่อ 2346, 2351-2354, 2357, 2382, 2383, 2399
email: business[at]nectec.or.th