เกี่ยวกับ โครงการ "พาที"

Thai Speech Recognition Service Project

ระบบรู้จำเสียงพูดอัตโนมัติ (ASR) เริ่มเข้ามาเป็นเทคโนโลยีที่มีบทบาทมากขึ้่น โดยเฉพาะอย่างยิ่งในยุคที่โทรศัพท์มือถือมีการขยายตัวและเข้าถึงผู้คนทุกเพศทุกวัย แต่ในส่วนของระบบรู้จำเสียงพูดภาษาไทยนั้น ยังถือว่าอยู่ในช่วงของการพัฒนา เพราะระบบดังกล่าวหากจะให้สามารถนำออกมาใช้ได้จริงนั้น จำเป็นต้องอาศัยองค์ประกอบหลายอย่าง ทั้งในด้านของ การประมวลผลเสียงธรรมชาติ และข้อมูลตัวอย่างเสียง เพื่อให้ระบบทำงานได้ดีที่สุดสำหรับเสียงพูดในภาษาไทย

 

ดังนั้น เนคเทค (NECTEC) จึงได้ริเริ่มโครงการระบบรู้จำเสียงพูดอัตโนมัติ (2013-2014) โดยมีจุดประสงค์ที่ต้องการจะสร้างสร้างระบบโครงสร้างพื้นฐานของประเทศ (Platform service) เพื่อเร่งการพัฒนาวิจัยระบบรู้จำเสียงพูดภาษาไทย แบบไม่จำกัดเนื้อหา และ เปิดให้นักพัฒนาที่สนใจอื่นๆ สามารถนำระบบดังกล่าวไปพัฒนาต่อยอดได้

 

 

Partii, a Co-Creation Platform to Springboard Thai ASR

ปัญหาที่สำคัญที่สุดในการสร้าง ASR ที่มีประสิทธิภาพ และใช้งานได้จริง ก็คือ ทรัพยากรทางภาษา ทั้งในส่วนของข้อมูลเสียง และ ข้อมูลของโครงสร้างภาษานั้นยังไม่เพียงพอ ปัญหาดังกล่าวจะสามารถแก้ไขได้โดยทำการจำกัดเนื้อหาที่จะพูดและสภาพแวดล้อมในการพูดเพื่อให้เหมาะกับงานใดงานหนึ่ง แต่อย่างไรก็ตาม ASR ที่ถูกสร้างสำหรับงานใดงานนึงนั้น ไม่สามารถนำไปใช้กับงานอื่นๆได้  ดังนั้นการสร้าง ASR แบบไม่จำกัดเนื้อหานั้นย่อมเป็นทางออกที่ดีสุดสำหรับปัญหานี้

 

แต่อย่างไรก็ตาม การที่จะสร้าง ASR แบบไม่จำกัดเนื้อหานั้น ย่อมต้องการใช้ทรัพยากรเสียงขนาดใหญ่ และเพื่อให้ได้ผลลัพธ์ของระบบที่ดีที่สุด เสียงเหล่านั้น ควรเป็นเสียงตัวอย่างจากการใช้งานจริง ด้วยเหตุผลทั้งหมดเหล่านี้ จึงเป็นที่มาของระบบ "พาที"

 

"พาที" เป็นแอปลิเคชั่นที่ให้ผู้ใช้งานสามารถ ส่งข้อความ SMS หรือ พิมพ์ข้อความต่างๆได้ ด้วยเสียงพูด ด้วยเทคโนโลยีการแปลงเสียงพูดให้เป็นข้อความ โดยข้อมูลเสียงและข้อมูลภาษาทั้งหมด ที่ผู้ใช้งานใช้งานระบบ "พาที" นั้น จะถูกนำไปใช้เป็นข้อมูลเพื่อวิจัยและพัฒนาระบบรู้จำเสียงพูดภาษาไทยอย่างต่อเนื่อง และทำการปรับปรุงระบบรู้จำเสียงพูดภาษาไทยให้มีประสิทธิภาพมากสุด

 

 พาที ได้รับการพัฒนาอย่างต่อเนื่องในช่วง 2556-2557 จนกระทั่งปัจจุบันมีศักยภาพเพียงพอสำหรับประยุกต์ใช้ในงานต่างๆ

 

R&D Team and Partners

Speech and Audio Technology Lab

Intelligent Informatics Research Unit, NECTEC

ชัย วุฒิวิวัฒน์ชัย (ดร.)          หัวหน้าโครงการ

วาทยา ชุณห์วิจิตรา (ดร.)      นักวิจัยส่วนรู้จำเสียงพูด

ศิลา ชุณห์วิจิตรา (ดร.)         นักวิจัยส่วนวิศวกรรมระบบ

ศวิต กาสุริยะ                      นักวิจัยส่วนถ่ายทอดเทคโนโลยี

ขวัญชีวา แตงไทย                ผู้ช่วยนักวิจัยส่วนรู้จำเสียงพูด

พุทธพงศ์ เสริฐศรี                ผู้ช่วยนักวิจัยส่วนนวัตกรรม

ณัฐพงษ์ เครือภักดี               ผู้ช่วยนักวิจัยส่วนวิศวกรรมระบบ

ภัชริกา ชูตระกูล                 ผู้ช่วยนักวิจัยส่วนคลังข้อมูล

 

Department of Computer Engineering

Chulalongkorn University

ผศ. ดร.อติวงศ์ สุชาโต  Project co-research