8月下旬,Motherboard?爆料說微軟已經與承包商共享Xbox用戶的錄音,以改善其AI語音助手的功能。該月初,另一份報告顯示,微軟正在與承包商共享?Skype錄音和Cortana語音命令,以改善聊天平臺的服務。一些錄音包含私密的內容。

微軟只是雇用人工來偵聽和注釋用戶生成數據的幾家公司之一。最近幾個月,谷歌,亞馬遜,Facebook和蘋果公司已經建立了類似的程序,這些程序已經確立了用戶隱私保護的倡導者地位。

隨著語音助手和聊天機器人的日益普及,科技公司面臨著一個艱巨的挑戰:他們的AI算法無法處理人類語言的復雜性,并且他們常常無法理解用戶命令和句子的含義。說。

目前,唯一的解決方案是雇用人員以正確的方向引導這些AI算法。這通常需要讓這些工作人員聽取用戶的親密談話,以便對他們進行轉錄和注釋。

語言理解的挑戰

Alexa,Siri和Cortana之類的基于語音的助手的能力歸功于深度學習的進步,而深度學習是人工智能的一個分支,在過去幾年中非常流行。深度學習算法特別擅長查找模式和分類信息。

當您提供具有數百萬個語音記錄及其對應文本的深度學習算法時,它可以非常高精度地轉錄新的音頻摘錄。深度學習還擅長預測:當您在大量文本集上訓練AI算法時,它會開發出不同單詞序列的復雜數學表示形式,并且可以執行諸如自動完成句子之類的任務。

但是深度學習要努力理解單詞和句子的含義,這是單純依靠數學和統計學無法完成的任務。

Robust.AI的認知科學家,認知科學家Gary Marcus說:“語音識別和自然語言理解可能聽起來像是類似的問題,但實際上卻完全不同。”?“在語音識別中,您的語言中的音節和音素數量有限,并且您正在嘗試將音頻流轉換為屬于很小類別的內容。”

英語具有成千上萬個常用單詞,在大數據時代,您可以輕松地找到數百萬個示例,每個示例都可以用來訓練深度學習模型。但是解析句子并解釋其含義是完全不同的努力。有無數可能的句子,每個句子都有其獨特的含義。單詞的含義會根據它們在句子中的位置以及其前后的位置而有所不同。

“除了幾個小句子,幾乎您聽到的每個句子都是原創的。您沒有直接獲得任何數據。這意味著您在推理和理解上存在問題,” Marcus說。“對于將事物進行分類,將其放入您已經知道的垃圾箱中的技術而言,根本不適合這樣做。理解語言是將您已經了解的世界與其他人正在嘗試使用的單詞聯系起來他們說。”

在新書《重新引導AI》(與紐約大學教授歐內斯特·戴維斯合著)中,馬庫斯解釋了當代AI在解釋人類語言含義時所面臨的一些挑戰。我們理所當然的事情之一是我們每個人都擁有的世界常識以及我們如何利用這些知識來消除口語和書面語言的歧義。

每天的談話都充滿了這種含糊。例如,考慮一下這句話,馬庫斯(Marcus)和戴維斯(Davis)在書中對此進行了檢查:“艾爾西(Elsie)試圖通過電話聯系她的姨媽,但她沒有回答。”?這是一個簡單的句子。但是,它還包含您作為人類可以輕松解決的多個歧義。聽到句子后,您將立即知道“到達”是指“交流”而不是“實際伸出手”,“在電話上”是指“通過使用電話”而不是“在電話上”和“她” ”是指Elsie的姑姑,而不是Elsie自己。這些都是您可以不用思考就能做出的推斷,因為您知道電話的用途,用途以及撥打電話的過程。

無休止的訓練周期

深度學習缺乏常識和對世界的了解,這使科技公司別無選擇,只能繼續訓練越來越多的實例來訓練他們的AI模型,希望他們最終能涵蓋所有可能的方式來表達AI助手應該做的事情。這就是為什么他們需要人工的幫助,他們通常是遠程的且薪水低廉,他們可以評估AI算法的性能,或者轉錄和注釋AI算法無法解密的用戶錄音。

但是,鑒于人類可以無休止地表達事物的方式,更多的培訓最終將成為創可貼解決方案。總是存在離群點,即未經AI處理的場景;人類語言是動態的并且不斷發展。這一切都需要更多的培訓,這意味著您將聽到更多有關遠程辦公人員收聽私人對話的故事。

Marcus說:“當前技術的弱點在于它極度需要數據,特別是在諸如自然語言理解之類的開放性問題中。因此,公司迫切希望獲得這些數據。”?“我認為無論如何都不會真正解決他們的問題。雖然會有所幫助,但無法解決。”

如果沒有將常識和基礎知識嵌入到深度學習算法中的方法,就不會在短期內解決該問題。隨著科技公司繼續收集和注釋用戶數據以訓練其AI算法,他們將面臨隱私權倡導者的強烈反對以及數據保護機構可能采取的法律行動。這導致這些公司淡化并重組其數據收集和共享程序,但并未停止。

8月下旬,Apple在其網站上發布了未簽名的道歉,以便與承包商共享Siri語音命令。該公司承諾僅在人們選擇參加評估計劃時才將其錄音用于培訓。Google?暫停了其在歐洲的評估計劃,因為歐洲的數據隱私規則更加嚴格,但該計劃在其他領域仍未減弱。Microsoft已更新其隱私政策,以明確規定人類承包商可能正在聽您的聲音。亞馬遜對其程序進行了更改,使用戶可以選擇退出其評估程序,許多用戶會忽略甚至不知道。

從長遠來看,Marcus認為,我們需要對AI提出新的看法:“我們需要對AI進行更好的研究。這意味著將一種主要涉及數據和數學的文化轉變為一種也包含了心理學等其他領域的其他思想的文化哲學和語言學方面,人們對人腦的運作方式進行了深刻的思考,并且可能會導致構建人工智能的技術比我們現在真正看到的更加豐富。