Xiaomi’den konuşma bozukluğu olan kişiler için konuşma teknolojisi

IoT platformu ile bağlanan akıllı telefonlar ve donanımlar geliştiren tüketici elektroniği ve akıllı üretim şirketi olan Xiaomi, erişilebilirlik alanına yönelik geliştirdiği ileri düzey algoritma uygulamasını ve konuşma teknolojisini tanıttı.

Xiaomi AI Lab’ın geliştirdiği spontane tarzındaki “metin okuma teknolojisi”, konuşma bozukluğu olan kişiler için benzersiz ve özelleştirilmiş bir ses üretiyor. Konuşma bozukluğu çeken kişiler, monoton bir elektronik ses yerine “kendi seslerini” kullanarak başkalarıyla iletişim kurabiliyor.

Konuşma bozukluğu çeken kişi için en uygun ve kişiselleştirilmiş sesin oluşturulabilmesi adına şirket bünyesinde 200’den fazla gönüllüyle birlikte çalışan Xiaomi, gönüllülerin bağışladığı seslerin özelliklerini konuşma bozukluğu çeken kişilerin sesleriyle eşleştirmek için ses izi eşleştirme algoritması kullandı. Bu yaklaşımla, konuşma bozukluğu çeken kişinin ses referansının temel sesi olarak en uygun ses bulundu. Kişiselleştirme ve kişisel gizlilik göz önünde bulundurularak seçilen gerçek ses, yeni ve orijinal bir ses oluşturmak için karmaşık bir akustik modifikasyonla manipüle edildi.

Daha sonra, yapay zeka modelini eğitmek için spontane tarzda metin okuma teknolojisi kullanılarak, yeni sesin kademeli olarak bir insanın duygularını ve tonunu doğru bir şekilde ifade edebilen doğal bir ritim ve tonlama kazanması sağlandı.