Google推出Android语音转字幕应用程序Live Transcribe,以帮助听障人士与外界沟通,并进一步公开其设计细节。这个应用程序使用了当前Google云端自动语音辨识(Automatic Speech Recognition ,ASR)技术,以及设备上机器学习,并且与专为聋人和弱听人士而设的高立德大学合作,进行使用者体验研究。
Google设计Live Transcribe其中一个重要的考量,是避免使用者消耗过多移动流量。为此,Google在移动设备上实作了类神经网络语音侦测器,并使用了大规模声音数据集AudioSet。Google提到,该网络是一个类似VGGish的图像模型,能够侦测语音,并且自动管理到云端自动语音辨识引擎的网络连接,在长时间使用的状况下,能最大程度减少移动用量。