通過提出正確的問題來學習如何操作 VUI

已發表: 2019-06-20

編者按: Adrien Schmidt 是國際公認的企業家、工程師和創新者。 2015 年,他與人共同創立了 Aristotle by Bouquet.ai,這是一家企業軟件公司,提供個人語音分析助手,將數據分析轉換為有意義的對話。 這篇評論中表達的想法和觀點是他自己的。

***

圖形用戶界面背後的科學經過精心調整——這是近三年設計、開發和測試的結果。 另一方面,語音用戶界面非常新穎,僅在 7 年前,在 iPhone 4S 的 iOS 5 版本中才成為主流。 在不到十年的時間裡,語音已經成為一個自身的生態系統,在爆炸式增長的推動下,不僅因為它在移動設備中無處不在,還因為亞馬遜、谷歌和其他幾家公司每年售出數千萬台家用設備

對於正在處理這種新形式的搜索和軟件參與的 VUI 開發人員來說,這項技術代表了科幻小說和現代人工智能限制的融合——五十多年夢想和實驗的結晶。 因此,用戶和開發人員仍在學習 VUI 的外觀以及它應該如何操作也就不足為奇了。

用戶應該問什麼問題才能得到他們需要的答案? 他們應該給出哪些命令來觸發他們想要的動作? 這是該行業目前面臨的最大和最緊迫的問題。 隨著 VUI 的改進和精簡,用戶會問什麼以及他們在未來幾年將如何溝通?

人工智能應該理解什麼?

語音用戶界面的挑戰在於它依賴於對話以及幾乎每個將使用您的軟件的人所獨有的觸發器、提示和俗語。 它有規則,必須經過訓練才能對以特定方式說出的特定語言模式做出反應。

您製作的界面越靈活,它需要的培訓就越多,而且容易出錯。 它越不靈活,對用戶來說就越令人沮喪。 所以這裡需要在人工智能將理解的內容和用戶負責的內容之間取得良好的平衡。

我們選擇將對話置於我們設計的核心,以便系統更新問題和響應流的上下文。 這讓我們可以專注於更簡單的問題。 這與搜索有很大的不同,因為我們從 Google 開始就已經習慣了。 我們沒有將所有關鍵詞放在一個單一的話語中,這對語音來說很複雜,會給 NLP 造成混亂,我們選擇對話和跟進作為將復雜問題分解成更容易表達的更小的子問題的一種方式並理解。

向最終用戶傳達限制和期望

在傳統意義上,設計是一個高度依賴設計者的專業知識和經驗,結合有針對性的測試和用戶實驗的過程。 對於 VUI,這略有不同。 在 VUI 應該如何工作方面建立的最佳實踐較少,最重要的是該系統是自學的。 這將設計過程轉變為算法發揮更大作用的過程,例如,確定如何考慮用戶反饋、新話語、新同義詞等。

您將需要設計您的產品以捕獲正確的數據以盡可能多地向您的用戶學習,這意味著幾乎無限次迭代跨越一系列不同的技術障礙——從核心 AI 對用戶的理解到您提示用戶的方式輸入和您收到的回复。

同時,系統需要向用戶傳達所需要的信息。 如果您曾經使用過 Echo,您就會知道 Alexa 會提示詳細的響應,這對於現有用戶來說通常是多餘的。 這是有意且重要的,因為它可以準確地告訴用戶需要什麼,同時減少人們可能“卡住”以不同形式重複相同問題的頻率。

使用對話樹是很誘人的,因為它們與 UX 流程圖相似——試圖在提出問題時匹配人類語音的自然流。 雖然設計師可以在某種程度上進行推斷,但其中大部分在自然語言對話中實際上是無用的。 預測用戶會問什麼是一個具有挑戰性的過程,需要同等程度的藝術和科學。 如果做得好,您將構建一個精心平衡的系統,可以處理越來越微妙的用戶意圖,並將它們朝著他們尋求的信息的正確方向移動。

VUI 算法的下一步

語音界面的下一個自然階段是我們已經在其他幾種技術中看到的那種成熟——設備識別用戶並與用戶交互並考慮他們的“背景”的能力:位置、即將舉行的會議、最近的消息、習慣等. 挑戰不僅在於技術,還在於獲得用戶的信任,即我們不會通過查看他們的數據來侵犯他們的隱私。 這可以通過設備上的處理實現,其中算法在設備上本地運行,並且不與服務提供商或設備製造商共享任何信息。

這不僅可以讓系統更容易在用戶所在的任何地方使用,還可以讓系統變得更智能,利用機器學習技術開始根據用戶的情緒、語調、上下文和單詞從用戶那裡推斷出更多的信息選擇。 我們距離這成為現實還有一段時間,但在這些系統中對用戶交互細節的投資和關注將有助於讓我們更加接近。

人工智能從用戶的要求中學習與用戶學習要求從語音界面中獲取某些內容之間存在一種謹慎的禪宗平衡。 隨著系統變得更加智能和無處不在,這種平衡將繼續轉向人工智能,但就目前而言,設計人員需要認識到這個問題並構建與之匹配的應用程序。

***

Adrien Schmidt 是國際公認的工程師、演說家和企業家。 他是加利福尼亞州舊金山的企業軟件公司 Bouquet.ai 的 Aristotle 的首席執行官和聯合創始人,該公司提供個人語音分析助手,將數據分析轉換為有意義的對話。 作為人工智能/語音領域的思想領袖,他的作品可以在福布斯、Inc、HuffPo 和 B2C 等主要出版物中找到。 他被 Inc. 列為值得關注的 AI 企業家,並曾在 Web 峰會、碰撞、對話交互、語音峰會和寶潔數據分析峰會等活動上發表演講。 在他的公司或個人網站、Twitter 或 LinkedIn 上與他聯繫。