"พาที" โซลูชั่น

สมรรถภาพ

ระบบรู้จำเสียงพูดภาษาไทย พาที (PARTY)เวอร์ชัน 1.0 มีคุณสมบัติสำคัญดังนี้

·        ไม่จำกัดเนื้อหา (Open domain) พาที ได้ใช้วิทยาการใหม่ที่สร้างขึ้น โดยมีพจนานุกรมในระบบขนาดเพียง 40,000 คำ บรรจุหน่วยคำผสมกับหน่วยพยางค์ที่ใช้บ่อยในภาษาไทย หน่วยพยางค์สามารถผสมเป็นคำใหม่ๆ ที่ระบบไม่รู้จัก ส่งผลให้ครอบคลุมคำศัพท์ได้ใกล้เคียงกับระบบที่มีพจนานุกรมขนาดเกิน 140,000 คำ ทั้งยังช่วยลดปริมาณทรัพยากรที่ต้องใช้ในการคำนวณอย่างมากด้วยเช่นกัน

·        ความแม่นยำ 80% (Accuracy) ภายใต้การทดสอบกับเสียงพูดผ่านช่องทางข้อมูล (data channel) ด้วยสมาร์ทโฟน โดยไม่กำหนดเนื้อหา ผู้พูด หรือรูปแบบการพูด ระบบให้ความถูกต้องของการรู้จำเกือบ 80% ซึ่งใกล้เคียงกับบริการจากต่างประเทศ (ทดสอบเมื่อพฤษภาคม 2557)

·        ตอบสนองภายใน 1.5xRT (Response time)การทดสอบความเร็วในการตอบสนองภายใต้เครือข่าย WiFi และเครือข่าย 3G จำลอง พบว่าพาทีสามารถตอบสนองได้ภายในเวลาไม่เกิน 1.5 เท่าของความยาวของเสียงอินพุต ซึ่งใกล้เคียงกับการตอบสนองของบริการรู้จำเสียงพูดภาษาไทยจากต่างประเทศ

·        เว็บบริการพร้อมติดตั้งและปรับแต่งได้ (Customizable) จุดเด่นสำคัญของ พาที คือความเชี่ยวชาญของทีมวิจัยและพัฒนาในการปรับแต่งระบบตามความต้องการ ปัจจุบันพาทีอยู่ในรูปแบบเว็บบริการพร้อมติดตั้งในหน่วยงานที่ต้องการใช้งาน สามารถขยายบริการตามปริมาณการใช้งาน และปรับแต่งระบบให้ถอดความได้ถูกต้องมากขึ้นในเนื้อหาหรือผู้พูดที่กำหนดได้

 

ประโยชน์

 

ระบบรู้จำเสียงพูดภาษาไทย พาที เป็นเครื่องมือพื้นฐานที่ประยุกต์ใช้ให้เกิดประโยชน์ได้หลากหลาย โดยเฉพาะอย่างยิ่งในยุคปัจจุบันที่ผู้คนสามารถติดต่อสื่อสารและเข้าถึงข้อมูลข่าวสารได้สะดวกรวดเร็วผ่านสมาร์ทโฟนและเครือข่ายอินเทอร์เน็ต ตัวอย่างการประยุกต์ใช้ ได้แก่

·        การสื่อสารโทรคมนาคม (Telecommunication)ระบบรู้จำเสียงพูดใช้แปลงเสียงพูดลูกค้าที่ติดต่อเข้าที่ศูนย์บริการลูกค้าหรือ Contact center ผ่านทางโทรศัพท์อย่างกว้างขวางในต่างประเทศ แต่ในประเทศไทยมีการใช้งานระบบดังกล่าวในวงจำกัด เป้าหมายของนวัตกรรมนี้นอกจากต้องการวิเคราะห์ความต้องการของลูกค้า ลดค่าใช้จ่ายในการฝึกอบรมพนักงาน เพิ่มประสิทธิภาพของการให้บริการแล้ว ยังใช้ในการติดตามตรวจสอบการทำงานของพนักงานผู้ให้บริการด้วย บทความของ DMG Consulting LLC สำรวจการใช้งานในสหรัฐอเมริกา พบว่าสามารถเพิ่มการรับสายลูกค้าได้ 20-60% โดยที่ลูกค้าถึง 80% มีความพึงพอใจที่จะใช้ระบบดังกล่าว และในปัจจุบัน พาที กำลังอยู่ระหว่างการทดสอบภาคสนามร่วมกับบริษัทเอกชนที่ให้บริการศูนย์บริการลูกค้าในลักษณะดังกล่าว

·        สิ่งอำนวยความสะดวกในการป้อนข้อมูล (Voice data input)เมื่อนโยบายภาครัฐให้ความสำคัญที่บริการต่างๆ โดยเฉพาะบริการจากภาครัฐจะต้องสามารถเข้าถึงได้อย่างทั่วถึงและเท่าเทียม เทคโนโลยีนี้จึงกลายเป็นส่วนประกอบสำคัญที่จะถูกนำไปต่อยอดเป็นนวัตกรรมสิ่งอำนวยความสะดวกแก่ผู้พิการ คนชรา และผู้ด้อยโอกาส เนคเทคมีแผนในการประยุกต์ใช้ระบบรู้จำเสียงพูดช่วยในศูนย์บริการถ่ายทอดการสื่อสารสำหรับผู้บกพร่องทางการได้ยิน (Thailand Telecommunication Relay Service หรือ TTRS) ซึ่งให้บริการอยู่ในปัจจุบัน

นอกจากนี้ การป้อนข้อมูลด้วยเสียงพูดยังสามารถประยุกต์ใช้ในนวัตกรรมที่สร้างโอกาสทางธุรกิจได้อีกมาก เช่น ความต้องการป้อนข้อมูลอย่างรวดเร็วผ่านอุปกรณ์พกพาหรือสมาร์ทโฟนภายใต้สถานการณ์ฉุกเฉิน การป้อนข้อมูลเพื่อบริหารคลังสินค้าขนาดใหญ่ ตลอดจนการป้อนข้อมูลด้วยเสียงเพื่อสั่งการอุปกรณ์ต่างๆ ภายในอาคารบ้านเรือน ปัจจุบันเนคเทคอยู่ระหว่างการทดสอบภาคสนามกับบริษัทเอกชนเพื่อพัฒนาสมาร์ทโฟนให้เป็นรีโมทคอนโทรลแบบใหม่โดยใช้เสียงสั่งการผ่านไปบังกล่องรับทีวีในการเลือกช่องรายการ โดยเล็งเห็นถึงช่องทางในอนาคตที่นวัตกรรมนี้จะมาทดแทนการใช้รีโมทคอนโทรลที่ใช้อยู่ในปัจจุบัน

·        การแทรกบทบรรยาย (TV captioning)เช่นเดียวกับช่องทางการเผยแพร่ข้อมูลข่าวสารอื่นๆ โปรแกรมทีวีในยุคทีวีดิจิทัลก็มีข้อกำหนดจากภาครัญให้ต้องมีบทบรรยายใต้ภาพเพิ่มโอกาสในการเข้าถึงของผู้พิการ โดยเริ่มต้นข้อกำหนดด้วยรายการข่าวและจะขยายมากขึ้นจนเป็นมาตรฐานในการทำรายการทีวีในอนาคต เช่นเดียวกับที่เกิดขึ้นในหลายประเทศที่พัฒนาแล้ว เทคโนโลยีรู้จำเสียงพูดนี้จะเป็นกลไกสำคัญที่ช่วยเพิ่มประสิทธิภาพ และลดค่าใช้จ่ายในการจัดทำบทบรรยายใต้ภาพสำหรับโปรแกรมทีวีจำนวนมากที่เกิดขึ้นในปัจจุบัน

·        การถอดความข้อมูลเสียง (Audio transcription)ในขณะที่ข้อมูลเสียงขนาดใหญ่เกิดขึ้นในทุกวัน ความต้องการถอดความเพื่อนำข้อมูลข่าวสารไปใช้ประโยชน์ต่อก็ต้องมีการลงทุนเพิ่มขึ้นอย่างมากตามไปด้วย ตัวอย่างเช่น ความต้องการในการจัดทำรายงานการประชุมรัฐสภาของสำนักงานเลขาธิการรัฐสภาและวุฒิสภาที่ต้องสำเร็จออกเป็นร่างรายงานภายในเวลาอันสั้น ความต้องการจัดทำรายงานการไต่สวนคดีในศาลยุติธรรมเพื่อให้ผู้ที่เกี่ยวข้องลงนามรับรองหลังจบการไต่สวน ความต้องการถอดความเสียงบันทึกเทปต่างๆ เพื่อการสืบค้นย้อนหลังได้ง่ายขึ้น เป็นต้น ความต้องการเหล่านี้ล้วนมีความเป็นไปได้ในการประยุกต์ใช้เทคโนโลยีการรู้จำเสียงพูด พาที ในปัจจุบันเนคเทคได้รับการติดต่อจากหน่วยงานที่ให้ความสนใจดังกล่าว และอยู่ระหว่างศึกษาความเป็นไปได้ในการประยุกต์ใช้ให้มีประสิทธิภาพ