-->

Microsoft AI สร้างเสียงที่เหมือนจริงจากข้อความตัวอักษร หรือ Text-to-speech





Laz Flash Sale ลดแรงกว่า 90%
ดีลจำกัดเวลา ให้คุณเลือกซื้อสินค้าราคาพิเศษได้ทุกวัน สินค้าลดราคากับ Flash Sale
Lazada แฟลชเซล จัดเต็มดีลฮิตทุกวัน ช้อปออนไลน์ 24 ชั่วโมง ☆ดีลจำกัดเวลาสุดฮอต ☆ลดราคาแรง ☆สินค้าหลากหลาย

ช้อปเลย





Microsoft AI สร้างเสียงที่เหมือนจริงจากข้อความตัวอักษร หรือ Text-to-speech



     Microsoft AI สร้างเสียงที่เหมือนจริงจากข้อความตัวอักษร หรือ Text-to-speech โดยใช้เพียงการฝึกเพียงฝนของระบบเพียงเล็กน้อย โดยเป็นงานวิจัยร่วมระหว่างไมโครซอฟท์และนักวิจัยที่พยายามที่จะสร้างระบบ อ่านตัวอักษรออกมาเป็นเสียงให้มีความเป็นธรรมชาติและน่าฟังมากที่สุดด้วยการใช้เทคโนโลยี AI หรือ ปัญญาประดิษฐ์ในการทำงานดังกล่าว

<

     นักวิจัยของไมโครซอฟท์ และมหาวิทยาลัยในจีนนั้นได้ร่วมงานวิจัย ที่จะทำให้การสนทนาแบบ Text-to-speech นั้นมีความสมจริงมากขึ้นพวกเขาได้ทำการสร้าง Text-to-speech AI ที่เป็นระบบปัญญาประดิษล่าสุดมาใช้ในการทำงานดังกล่าว โดยระบบนี้สามารถที่จะสร้างบทสนทนาจากข้อความได้เหมือนจริง และดูเป็นธรรมชาติเหมือนเสียงพูดของคนจริงๆ ออกมาได้โดยการใช้เพียงตัวอย่างเสียงเพียง 200 ตัวอย่าง ในการถอดเทียบเสียงที่ตรงกัน


     ระบบสามารถทำงานได้โดยอาศัย deep neural networks ที่เลียนแบบเซลล์ประสาทในสมองทำการเปรียบเทียบน้ำหนักทุกอินพุตและเอาต์พุตได้ทันที ช่วยให้ระบบสามารถประมวลผลได้อย่างมีประสิทธิภาพมาก – พูดประโยคที่ค่อนข้างซับซ้อนได้ดี

     ถึงแม้ว่าผลการทดลองที่ได้อาจจะยังไม่สมบูรณ์แบบมากเท่าไร โดยมีการพบเสียงบางคำที่ออกเสียงยังเป็นแบบหุ่นยนต์อยู่ แต่ดูถึงความแม่นยำของคำพูดที่ระบบนี้สามารถทำได้ถึง 99.84 % เลยทีเดียว ซึ่งเทคโนโลยีเหล่านี้มีความจำเป็นที่จะนำมาใช้งานในอนาคตโดยสามารถนำมาใช้ในอุปกรณ์ต่างๆ ได้ง่ายขึ้นหากมีการพัฒนาให้ต่อเนื่องและใช้งานดะสะดวกมากกว่านี้
จะเห็นได้จากเมื่อก่อนที่มีการใช้งานเทคโนโลยี Text-to-speech นี้ก็คือระบบการสังเคราะห์เสียงของ Stephen Hawking นักวิทยาศาสตร์ชื่อดังในด้านอวกาศ ผู้เป็นเจ้าของหนังสือ A Brief History of Time  ที่มีความพิการทางกายหลายอย่างรวมถึงในการพูดด้วย โดยนาย Dennis Klatt ได้สร้างโปรแกรมสำหรับสร้างเสียงให้กับศาสตราจารย์ Hawking ในยุค 80 และเขาก็ได้ใช้เครื่องมือดังกล่าวจนวันสุดท้ายของชีวิต
     นอกจากนั้นเรายังสามารถใช้เทคโนโลยีนี้ในแง่อื่นๆได้อีกมากมาย เช่นการสร้าง Interactive Book หรือ หนังสือที่อ่านออกเสียงได้ สำหรับคนที่พิการทางสายตา ใช้ในการศึกษาใช้ในอุปกรณ์สมาร์ตโฟน สำหรับผู้ที่พิการทางการพูดก็สามารถทำได้โดยจะเป็นการให้อุปกรณ์อ่านออกเสียงจากข้อความที่ผู้พิการพิมพ์ลงบนแป้นพิมพ์เพื่อใช้สื่อสารกับคนที่ไม่เข้าใจภาษามือได้

     คุณผู้อ่านคิดว่าเทคโนโลยีนี้ Text-to-speech จะมีประโยชน์ หรือสามารถน้เอาไปใช้ในกิจกรรมใดได้บ้าง สามารถแสดงความคิดเห็นได้อย่างกว้างขวางในหน้าแฟนเพจของเราได้เลย ทางเรารอความเห็นดีๆจากทุกท่านอยู่

อ้างอิง : https://speechresearch.github.io/unsuper/