今年,蘋果智能助手Siri引發的問題不斷,始終占據著媒體上的主導地位。而Siri的成功之一,即它在聽到“Hey Siri”的發音時就開始傾聽的功能,也已經成為《機器學習期刊》有關蘋果需要應對的最新主題,這也暗示了Siri未來的改進方向。
蘋果解釋稱,iOS設備現在不斷地監聽提示,并指出人工智能(AI)的進步可以消除Siri對初始訓練的需求。在“個性化Siri”中,Siri團隊指出,該功能面臨的最大挑戰是意外激活和意外錯過激活。目前,蘋果試圖通過利用設備主人的聲音設置Siri來防止這些問題,要求用戶對Siri進行簡短的訓練,并用五種對話來創建用戶資料特征。然后Siri悄悄地添加用戶的35個“被接受”話語,幫助改善個人資料。
有趣的是,“Hey Siri”的觸發點是,這個配置文件不僅僅是試圖匹配單個語音輸出,而是最終包含了這個短語的基線版本,有40個變體可被接受。Siri只會在給定的“Hey Siri”話語等于或高于平均得分的情況下才會被激活。該設備還存儲了40個“Hey Siri”的請求記錄,使用戶的個人資料在沒有經過用戶重新培訓的情況下得以重建,而蘋果則通過軟件更新改進系統。
將來,蘋果希望Siri不必接受預先訓練,用戶的配置文件將會被清空,然后通過用戶許可,隨著更多請求的加入,Siri能自我成長和更新自己。該公司還在研究如何屏蔽“虛假接受”,即Siri被用戶以外的其他東西喚醒。使用深度神經網絡,蘋果相信它可以將“虛假接受”率降低50%,降低錯誤拒絕率(當用戶說“Hey Siri”時設備沒有回應)約40%,而Siri被其他人激活的幾率可降低75%。
另一個問題是讓Siri在更大和嘈雜的環境中表現得更好,比如汽車或者有風的戶外環境。蘋果公司的團隊表示,目前正在研究如何處理與用戶個人資料中現有的“Hey Siri”錄音嚴重不匹配的環境,但在所謂的“多風格訓練”中取得了成功。在這種訓練中,訓練數據的一個子集被不同類型的噪音和混響所增強。
因為蘋果始終在改進Siri,而且并不一定會改變所有調整,所以不清楚上面提到的改進會在什么時候實現。在6月份的全球開發者大會上,蘋果經常強調Siri的重大變化,鑒于最近對Siri缺點的討論,我們預計在不久的將來會聽到有關Siri更重要的消息。