เนคเทค เดินหน้าพัฒนาเทคโนโลยีระบบรู้จำเสียงพูดจากภาษาไทยในโครงการ พาที Party เพื่อเปลี่ยนเสียงจากคำพูดเป็นข้อความตัวอักษร บนอุปกรณ์สมาร์ทโฟน

 

ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ เดินหน้าพัฒนาเทคโนโลยีระบบรู้จำเสียงพูดจากภาษาไทยในโครงการ พาที Party เพื่อเปลี่ยนเสียงจากคำพูดเป็นข้อความตัวอักษร บนอุปกรณ์สมาร์ทโฟน
นายชัย วุฒิวิวัฒน์ชัย หัวหน้าห้องปฏิบัติการเทคโนโลยีเสียง ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ หรือเนคเทค สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ กระทรวงวิทยาศาสตร์และเทคโนโลยี กล่าวว่า ในปัจจุบันเทคโนโลยีการรู้จำเสียงพูด Automatic speech recognition หรือ ASR ได้ถูกนำมาใช้เพื่อเปลี่ยนเสียงจากคำพูดเป็นข้อความกันอย่างแพร่หลาย โดยเฉพาะในแอพพลิเคชั่นบนอุปกรณ์สมาร์ทโฟน แต่การพัฒนาเทคโนโลยีดังกล่าวยังรองรับภาษาอังกฤษมากกว่าภาษาไทย
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ เดินหน้าพัฒนาเทคโนโลยีระบบรู้จำเสียงพูดจากภาษาไทยในโครงการ พาที Party เพื่อเปลี่ยนเสียงจากคำพูดเป็นข้อความตัวอักษร บนอุปกรณ์สมาร์ทโฟน
นายชัย วุฒิวิวัฒน์ชัย หัวหน้าห้องปฏิบัติการเทคโนโลยีเสียง ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ หรือเนคเทค สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ กระทรวงวิทยาศาสตร์และเทคโนโลยี กล่าวว่า ในปัจจุบันเทคโนโลยีการรู้จำเสียงพูด Automatic speech recognition หรือ ASR ได้ถูกนำมาใช้เพื่อเปลี่ยนเสียงจากคำพูดเป็นข้อความกันอย่างแพร่หลาย โดยเฉพาะในแอพพลิเคชั่นบนอุปกรณ์สมาร์ทโฟน แต่การพัฒนาเทคโนโลยีดังกล่าวยังรองรับภาษาอังกฤษมากกว่าภาษาไทย ซึ่งระบบรู้จำเสียงพูดในประเทศไทยได้ถูกนำมาใช้เป็นส่วนหนึ่งในระบบตอบรับอัตโนมัติสำหรับผู้ให้บริการเครือข่ายโทรศัพท์ หรือคอลเซนเตอร์ แต่ยังมีข้อจำกัดคือสามารถตอบได้เพียงเป็นคำ หรือวลีสั้นๆ และไม่ถูกหลักไวยากรณ์ ดังนั้น เนคเทคจึงได้ร่วมกับจุฬาลงกรณ์มหาวิทยาลัย พัฒนาระบบรู้จำเสียงพูดจากภาษาไทยเป็นตัวอักษร ในชื่อโครงการ พาที Party โดยการทำงานประกอบด้วย 3 ส่วน ได้แก่ แบบจำลองภาษา พจนานุกรมคำอ่าน และแบบจำลองเสียง ซึ่งเมื่อมีการเปล่งเสียงพูด ระบบทั้ง 3 ส่วนจะทำการวิเคราะห์ หรือเดาคำศัพท์ที่ควรจะเป็น แล้วถอดรหัสออกมาเป็นตัวอักษร โดยในขณะนี้มีความแม่นยำอยู่ที่ร้อยละ 60
หัวหน้าห้องปฏิบัติการเทคโนโลยีเสียง เนคเทค กล่าวเพิ่มเติมว่า ระบบรู้จำเสียงพูดภาษาไทยจะมีประโยชน์ในหลายด้าน เช่น ลดค่าใช้จ่ายในระบบตอบรับอัตโนมัติสำหรับการสื่อสารโทรคมนาคม การขอความช่วยเหลือผ่านบริการการแพทย์ฉุกเฉิน หรือคนพิการ แปลบทคำบรรยายใต้ภาพการรายงานข่าว หรือภาพยนตร์ และการถอดข้อความเสียงบันทึกการประชุมที่สำคัญในรัฐสภาและศาล นอกจากนี้ เนคเทคยังได้พัฒนาแอปพลิเคชั่น "พาที" Party thai speech to text บนอุปกรณ์สมาร์ทโฟนในระบบปฏิบัติการ iOS สำหรับบริการส่งเอสเอ็มเอสฟรี โดยเจ้าหน้าที่จะทำการถอดเสียงเป็นข้อความ และนำเสียงของผู้ใช้งานไปเป็นแบบจำลองทางเสียงภาษาไทยต่อไป เพื่อพัฒนาให้ระบบรู้จำเสียงพูดภาษาไทยมีความสมบูรณ์ โดยคาดว่าไม่เกิน 1 ปี จะสามารถพัฒนาให้มีความแม่นยำมากกว่าร้อยละ 80
 
ที่มา สถานีวิทยุกระจายเสียงแห่งประเทศไทย 

language switcher