สรรสาร เป็นระบบสืบค้นข้อมูล (Information Retrieval System) หรือเสิร์ชเอ็นจิน (Search Engine) สำหรับภาษาไทย ใช้สำหรับการค้นคืน และสืบค้นสารสนเทศที่อยู่ในรูปแบบข้อความและเอกสารเป็นหลัก ทั้งนี้ข้อความและเอกสารอาจจะถูกจัดเก็บในระบบบริหารจัดการฐานข้อมูล (Database Management System) หรือบนเว็บเซิร์ฟเวอร์ (Web Server) ระบบจะสร้างฐานดัชนี(Index) จากข้อความและเอกสารที่นําเข้า การใช้งานเริ่มจากผู้ใช้ป้อนคําสําคัญ (Keywords) ผ่านหน้าอินเตอร์เฟส (User Interface) และระบบนําเอาคําสําคัญไปตรวจสอบในฐานดัชนีเพื่อค้นหาข้อความหรือเอกสารที่มีคําเหล่านั้นปรากฏอยู่
คุณสมบัติของสรรสาร
- ค้นหาข้อมูลจากเอกสาร (Documents) หน้าเว็บ (Web Rages) และฐานข้อมูล (Databases) สามารถค้นได้ทั้งที่เป็นต้น วลี และประโยค
- ค้นหาข้อมูลที่อยู่ในรูปแบบมัลติมีเดียต่างๆ ได้หลายแบบ เช่น Text, Spreadsheet, Presentation, PDF, HTML, XML Images
- ค้นหาข้อมูลจากอินเทอร์เน็ต (Internet) อินทราเน็ต (Intranet) และแบบไม่เชื่อมต่อกับอินเทอร์เน็ต (Offline)
- มีความสามารถพิเศษทางภาษาไทย คือ
- ค้นหาคำพ้องเสียง (Soundex Search) สามารถค้นคำที่อ่านออกเสียงเหมือนกันแต่สะกดต่างกันได้ เช่น บันใด บรรได
- แนะนําคำค้นคืนที่ใช้บ่อย (Query Suggestion)
- แก้คําคำค้นที่สะกดผิด(Query Approximation)
ส่วนประกอบของระบบสืบค้นข้อมูล
โครงสร้างของระบบสืบค้นข้อมูลภายใต้ลิขสิทธิ์นี้ประกอบไปด้วยโมดูลและองค์ประกอบต่างๆ ดังแสดงในรูป
ผู้ใช้งานเทคโนโลยีเป้าหมาย
นักพัฒนาซอฟต์แวร์ และผู้ที่สนใจเทคโนโลยีการค้นคืนและสืบค้นข้อความ (Information Retrieval and Search Engine)
วิจัยพัฒนาโดย:
สนใจผลงาน/ถ่ายทอดเทคโนโลยี
- ติดต่อ ฝ่ายพัฒนาธุรกิจและถ่ายทอดเทคโนโลยี (BTT)
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
โทร. 0 2564 6900 ต่อ 2346, 2351-2354, 2357, 2382, 2383, 2399
email: business[at]nectec.or.th.th