أعلنت شركة بايدو الصينية عن إطلاق الجيل الثاني من نظام تحويل النص إلى كلام التابع لها «ديب فويس» Deep Voice، وذلك بعد 3 أشهر فقط من إطلاق الجيل الأول، ليأتي «ديب فويس 2» مع تحسينات كبيرة تبشر بمساعدات رقمية تتفاعل مع المستخدمين كما لو كانت أناسا حقيقيين.

وكانت عملاقة البحث الصينية قد أطلقت في فبراير الماضي «ديب فويس 1»، وهو نظام لتوليد الأصوات البشرية الاصطناعية تماما باستخدام الشبكات العصبية العميقة. ووفقا لموقع aitnews المعني بشؤون التقنية، فإنه من خلال تدريب الشبكات العصبية العميقة القادرة على التعلم من كميات كبيرة من البيانات والميزات البسيطة، أنشأت الشركة نظاما مرنا على نحو لا يصدق لتوليف صوت عالي الجودة في الوقت الحقيقي.

أما «ديب فويس 2» الجديد، فقد قالت بايدو إنها، وفي غضون ثلاثة أشهر فقط، تمكنت من توسيع نطاق النظام من 20 ساعة من الكلام وصوت واحد إلى مئات الساعات مع المئات من الأصوات مع القدرة على تقليدها تماما.