Expose Framework for Joomla 2.5 and 3.0+ A rapid template development framework
"พาที" โซลูชั่น
สมรรถภาพ
ระบบรู้จำเสียงพูดภาษาไทย “พาที (PARTY)” เวอร์ชัน 1.0 มีคุณสมบัติสำคัญดังนี้
· ไม่จำกัดเนื้อหา (Open domain)– พาที ได้ใช้วิทยาการใหม่ที่สร้างขึ้น โดยมีพจนานุกรมในระบบขนาดเพียง 40,000 คำ บรรจุหน่วยคำผสมกับหน่วยพยางค์ที่ใช้บ่อยในภาษาไทย หน่วยพยางค์สามารถผสมเป็นคำใหม่ๆ ที่ระบบไม่รู้จัก ส่งผลให้ครอบคลุมคำศัพท์ได้ใกล้เคียงกับระบบที่มีพจนานุกรมขนาดเกิน 140,000 คำ ทั้งยังช่วยลดปริมาณทรัพยากรที่ต้องใช้ในการคำนวณอย่างมากด้วยเช่นกัน
· ความแม่นยำ 80% (Accuracy) – ภายใต้การทดสอบกับเสียงพูดผ่านช่องทางข้อมูล (data channel) ด้วยสมาร์ทโฟน โดยไม่กำหนดเนื้อหา ผู้พูด หรือรูปแบบการพูด ระบบให้ความถูกต้องของการรู้จำเกือบ 80% ซึ่งใกล้เคียงกับบริการจากต่างประเทศ (ทดสอบเมื่อพฤษภาคม 2557)
· ตอบสนองภายใน 1.5xRT (Response time) – การทดสอบความเร็วในการตอบสนองภายใต้เครือข่าย WiFi และเครือข่าย 3G จำลอง พบว่าพาทีสามารถตอบสนองได้ภายในเวลาไม่เกิน 1.5 เท่าของความยาวของเสียงอินพุต ซึ่งใกล้เคียงกับการตอบสนองของบริการรู้จำเสียงพูดภาษาไทยจากต่างประเทศ
· เว็บบริการพร้อมติดตั้งและปรับแต่งได้ (Customizable)– จุดเด่นสำคัญของ พาที คือความเชี่ยวชาญของทีมวิจัยและพัฒนาในการปรับแต่งระบบตามความต้องการ ปัจจุบันพาทีอยู่ในรูปแบบเว็บบริการพร้อมติดตั้งในหน่วยงานที่ต้องการใช้งาน สามารถขยายบริการตามปริมาณการใช้งาน และปรับแต่งระบบให้ถอดความได้ถูกต้องมากขึ้นในเนื้อหาหรือผู้พูดที่กำหนดได้
ประโยชน์
ระบบรู้จำเสียงพูดภาษาไทย พาที เป็นเครื่องมือพื้นฐานที่ประยุกต์ใช้ให้เกิดประโยชน์ได้หลากหลาย โดยเฉพาะอย่างยิ่งในยุคปัจจุบันที่ผู้คนสามารถติดต่อสื่อสารและเข้าถึงข้อมูลข่าวสารได้สะดวกรวดเร็วผ่านสมาร์ทโฟนและเครือข่ายอินเทอร์เน็ต ตัวอย่างการประยุกต์ใช้ ได้แก่
· การสื่อสารโทรคมนาคม (Telecommunication) – ระบบรู้จำเสียงพูดใช้แปลงเสียงพูดลูกค้าที่ติดต่อเข้าที่ศูนย์บริการลูกค้าหรือ Contact center ผ่านทางโทรศัพท์อย่างกว้างขวางในต่างประเทศ แต่ในประเทศไทยมีการใช้งานระบบดังกล่าวในวงจำกัด เป้าหมายของนวัตกรรมนี้นอกจากต้องการวิเคราะห์ความต้องการของลูกค้า ลดค่าใช้จ่ายในการฝึกอบรมพนักงาน เพิ่มประสิทธิภาพของการให้บริการแล้ว ยังใช้ในการติดตามตรวจสอบการทำงานของพนักงานผู้ให้บริการด้วย บทความของ DMG Consulting LLC สำรวจการใช้งานในสหรัฐอเมริกา พบว่าสามารถเพิ่มการรับสายลูกค้าได้ 20-60% โดยที่ลูกค้าถึง 80% มีความพึงพอใจที่จะใช้ระบบดังกล่าว และในปัจจุบัน พาที กำลังอยู่ระหว่างการทดสอบภาคสนามร่วมกับบริษัทเอกชนที่ให้บริการศูนย์บริการลูกค้าในลักษณะดังกล่าว
· สิ่งอำนวยความสะดวกในการป้อนข้อมูล (Voice data input) – เมื่อนโยบายภาครัฐให้ความสำคัญที่บริการต่างๆ โดยเฉพาะบริการจากภาครัฐจะต้องสามารถเข้าถึงได้อย่างทั่วถึงและเท่าเทียม เทคโนโลยีนี้จึงกลายเป็นส่วนประกอบสำคัญที่จะถูกนำไปต่อยอดเป็นนวัตกรรมสิ่งอำนวยความสะดวกแก่ผู้พิการ คนชรา และผู้ด้อยโอกาส เนคเทคมีแผนในการประยุกต์ใช้ระบบรู้จำเสียงพูดช่วยในศูนย์บริการถ่ายทอดการสื่อสารสำหรับผู้บกพร่องทางการได้ยิน (Thailand Telecommunication Relay Service หรือ TTRS) ซึ่งให้บริการอยู่ในปัจจุบัน
นอกจากนี้ การป้อนข้อมูลด้วยเสียงพูดยังสามารถประยุกต์ใช้ในนวัตกรรมที่สร้างโอกาสทางธุรกิจได้อีกมาก เช่น ความต้องการป้อนข้อมูลอย่างรวดเร็วผ่านอุปกรณ์พกพาหรือสมาร์ทโฟนภายใต้สถานการณ์ฉุกเฉิน การป้อนข้อมูลเพื่อบริหารคลังสินค้าขนาดใหญ่ ตลอดจนการป้อนข้อมูลด้วยเสียงเพื่อสั่งการอุปกรณ์ต่างๆ ภายในอาคารบ้านเรือน ปัจจุบันเนคเทคอยู่ระหว่างการทดสอบภาคสนามกับบริษัทเอกชนเพื่อพัฒนาสมาร์ทโฟนให้เป็นรีโมทคอนโทรลแบบใหม่โดยใช้เสียงสั่งการผ่านไปบังกล่องรับทีวีในการเลือกช่องรายการ โดยเล็งเห็นถึงช่องทางในอนาคตที่นวัตกรรมนี้จะมาทดแทนการใช้รีโมทคอนโทรลที่ใช้อยู่ในปัจจุบัน
· การแทรกบทบรรยาย (TV captioning) – เช่นเดียวกับช่องทางการเผยแพร่ข้อมูลข่าวสารอื่นๆ โปรแกรมทีวีในยุคทีวีดิจิทัลก็มีข้อกำหนดจากภาครัญให้ต้องมีบทบรรยายใต้ภาพเพิ่มโอกาสในการเข้าถึงของผู้พิการ โดยเริ่มต้นข้อกำหนดด้วยรายการข่าวและจะขยายมากขึ้นจนเป็นมาตรฐานในการทำรายการทีวีในอนาคต เช่นเดียวกับที่เกิดขึ้นในหลายประเทศที่พัฒนาแล้ว เทคโนโลยีรู้จำเสียงพูดนี้จะเป็นกลไกสำคัญที่ช่วยเพิ่มประสิทธิภาพ และลดค่าใช้จ่ายในการจัดทำบทบรรยายใต้ภาพสำหรับโปรแกรมทีวีจำนวนมากที่เกิดขึ้นในปัจจุบัน
· การถอดความข้อมูลเสียง (Audio transcription) – ในขณะที่ข้อมูลเสียงขนาดใหญ่เกิดขึ้นในทุกวัน ความต้องการถอดความเพื่อนำข้อมูลข่าวสารไปใช้ประโยชน์ต่อก็ต้องมีการลงทุนเพิ่มขึ้นอย่างมากตามไปด้วย ตัวอย่างเช่น ความต้องการในการจัดทำรายงานการประชุมรัฐสภาของสำนักงานเลขาธิการรัฐสภาและวุฒิสภาที่ต้องสำเร็จออกเป็นร่างรายงานภายในเวลาอันสั้น ความต้องการจัดทำรายงานการไต่สวนคดีในศาลยุติธรรมเพื่อให้ผู้ที่เกี่ยวข้องลงนามรับรองหลังจบการไต่สวน ความต้องการถอดความเสียงบันทึกเทปต่างๆ เพื่อการสืบค้นย้อนหลังได้ง่ายขึ้น เป็นต้น ความต้องการเหล่านี้ล้วนมีความเป็นไปได้ในการประยุกต์ใช้เทคโนโลยีการรู้จำเสียงพูด พาที ในปัจจุบันเนคเทคได้รับการติดต่อจากหน่วยงานที่ให้ความสนใจดังกล่าว และอยู่ระหว่างศึกษาความเป็นไปได้ในการประยุกต์ใช้ให้มีประสิทธิภาพ