在過去的18個月里,Arthur Coleman在Acxiom Research的團隊已經深入地研究了一種叫做自然語言處理(NLP)的人工智能。其中最激動人心的NLP項目叫做ABBY——她是Acxiom Research的第一個人工智能員工。
Arthur Coleman有兩個關于NLP的想法:
第一,圍繞NLP的開源技術非常強大,你可以輕松地“站在巨人的肩膀上”,僅僅依靠一個小型的、高度集中的團隊和平臺就能創建出令人驚訝的高效的NLP應用程序。
第二,即使有這么多強大的技術在你的指尖,創造一個前端NLP(即“對話”,這是大多數人在想到人工智能時所想到的)需要遠見和毅力。遠見,即能夠看到技術的力量,并將其出售給你的內部利益相關者。毅力,因為在你看到你需要開發的一些更高級的能力的回報之前,它需要大量的前期投資。你還必須愿意學習面向消費者的營銷人員的技能,并處理那些已經在你的用戶群中被保留的行為。
后端NLP更容易,并提供更直接的ROI(投資回報率)
基于NLP的改進不需要你的業務有對話前端。這些后端驅動或語言分析項目通常在很短的時間內提供最快、最具成本效益、最高回報的使用NLP的方法。這些項目一般由兩到三個人的團隊在幾個月的時間內完成。
在最近的一次Strata Conference大會上,Cloudera的機器學習總經理Hilary Mason在一次主題演講中展示了后端NLP的一個很好的例子。Mason解釋了Cloudera如何降低呼叫中心的成本,并通過NLP提高客戶滿意度。他們從自己公司的呼叫中心采集了記錄電話的統計樣本,并將其轉錄成文本。他們對這個語料庫進行了文本分析,尋找與特定問題和問題解決步驟相關的語音模式。然后,他們將基于分析結果的預測模型部署到他們的呼叫中心系統中。當客戶來電時,底層的算法會識別出語音的模式,主動地向客戶服務代推薦一個可能的解決方案。Mason說,這種做法減少了呼叫中心的呼叫次數,并且提高了客戶滿意度(我的團隊在我們自己的類似項目中也看到了同樣的積極結果)。
會話NLP成本更高,需要更長期的遠見
一旦你專注于會話NLP(或AI),并希望機器與人類互動時能夠像普通人類一樣使用語言,流暢而隨意,那么這個問題在技術上變得具有挑戰性,并且非常昂貴。在這里我說的不是聊天機器人。聊天機器人是一種非常簡單的機器,它可以在特定的任務中遵循相對結構化的對話,并且只在特定的預定義環境中使用,比如Facebook Messenger。而會話NLP(AI)是完全不同的。與Alexa類似,它們是無處不在的(無論你在哪里),可以處理多個應用程序(也稱為意圖),并且可以處理多種形式的回復,即使是同一個人對相同語句的不同回復。它們也可以快速地改變情境——比如從提供關于今天天氣的信息到餐館預訂。
現在已經存在多個開源平臺,允許團隊在合理的時間框架內構建一個功能性的(如果不夠完善)AI,帶來正的投資回報。蘋果、谷歌、微軟和亞馬遜等公司都投入了數億美元,依靠一些世界上最優秀的博士的努力,進入了先進的NLP界面。這些開源庫可以讓一個由3-4人組成的團隊在大約一年的時間內為一個簡單的會話AI構建一個基礎平臺,大約花費50萬美元。這個早期的平臺有一些簡單的應用程序,沒有對用戶的預先對話意識(因為這需要一個帶有安全系統的接口),也沒有對先前用戶會話的記憶。在這里,根據意圖的復雜性,可以提供從1萬美元(例如查詢天氣)的簡單應用程序到2.5萬美元(例如會議室預訂)的更為復雜的應用程序的新功能。
我們認為這個平臺是一項投資,可以在兩年的投資回報期內推廣。由于我們希望在此期間增加48個新的應用程序,如果選擇分期償還,則會給每個應用增加1萬美元的成本。這是我們為一個新應用控制成本的一種方式。例如,允許人們在丟失/被遺忘的密碼或其他簡單的IT問題上進行自助服務,可以節省至少一年的IT人員的時間。通過使用Excel中的IRR函數進行一些快速計算,假設這個角色每年花費10萬美元,那么這個“復雜”應用程序的一年期投資回報率就會達到260%,這就值得去做了。成本只是我們用來確定意圖構建的一個因素,有時我們甚至在沒有很高的ROI的情況下進行投資。但我們確實把它作為指導方針。
下表提供了一些值得研究的開源工具的概述:
終端用戶和開發人員的采用
一個會話AI平臺需要兩方面的采用才能成功。一個是終端用戶,另一個同樣重要的是開發人員。
大多數終端用戶采用一種新技術都是一個艱難的過程。當用戶不愿意放棄現有的工具以及根深蒂固的行為時,尤其困難。向消費者提供新技術的人都非常清楚這一點。他們在自己的商業模式中建立了大量的采用曲線和相關的營銷預算。但是,許多公司的開發人員,甚至是企業的產品經理,尤其是B2B市場的產品經理,對消費者采用曲線的經驗很少。開發人員沒有把它納入他們的計劃,同樣重要的是,他們的經理也不理解這條曲線。許多組織缺乏足夠的耐心和能力來獲得廣泛采用會話接口所需的持久消息傳遞和銷售技巧。
其結果是,許多前端NLP項目從未實現過采用,這限制了進一步的投資。
我的團隊通過我們的ABBY項目克服了這一挑戰,將ABBY的意圖部署到其它典型的新產品營銷問題上——我們安排了一個兼職產品營銷人員來開發和執行內部采用的營銷計劃。我們還發展了一組早期的采用者/測試者,他們明白他們的角色的一部分是向他們的同事宣傳新的意圖。最后,我們的整個團隊都有一個任務,就是在與組織中的人進行互動時,盡可能地宣傳ABBY的能力。就像其它所有獨立的小公司一樣,團隊中的每個人扮演銷售人員的角色。
但無論你在內部營銷上執行得多么好,前端NLP仍然是一個長期的發展過程,隨著開發人員、人工智能和終端用戶的交互,終端用戶的行為和人工智能的能力都將隨著時間的推移而不斷發展。正是出于這個原因,為組織中的開發人員開發一個NLP平臺是至關重要的。就像在一個開放的市場中一樣,沒有一個團隊能夠構想或構建所有對其他用戶或公司來說很重要的應用程序。增強采用的一種方法是讓很多團隊為會話前端構建NLP應用程序。因此,開發人員的采用是采用周期中的第二個關鍵元素。我們使用許多工具來促進這一過程。
我們通過團隊會議、一對一的會議和NLP特別興趣小組積極地接觸到開發人員。我們也有NLP項目可供我們定期進行季度“黑客馬拉松”活動。
功效和任務導向設計
這就引出了另一個設計問題——功效。投資的目的是使現有的經驗更有效率、更有成效,或者兩者兼而有之。如果人們使用人工智能對話反而需要更長的時間,那么人們就不會去使用。當終端用戶有著根深蒂固的行為習慣,需要強大的、有意識的額外努力才能讓他們改變行為的情況下,這一點尤其正確。在我們的例子中,我們的通訊錄項目是一項很好的投資,因為在以前,從我們的內部系統獲取一個人的聯系信息很耗費時間并且很不方便。一旦人們使用ABBY幫助查找通訊錄幾次,他們就開始轉換習慣。房間預訂也是如此。但是當用戶通過ABBY執行谷歌搜索時,我們得到了非常負面的反饋。人們認為我們投資一個app非常愚蠢,因為人們可以很方便地切換到瀏覽器并進行搜索,以一種他們能理解的格式獲取更強大的信息內容。
殺手級應用在哪里?
我經常會問這樣一個問題:“殺手級應用在哪里?”對話AI正在取得實質性進展的一個領域是客戶服務。但是自助客戶服務這個更廣泛的類的實例才可以被視為判斷標準。這類問題可能定義了什么可以或不可以成為對話AI的殺手級應用。向以任務為導向的用戶提出的問題是:“他們想要什么時候或者需要與人工智能進行詳細的討論,以完成一個目標?”答案是雙重的。一個方面是任務的解析需要用戶和“助手”之間的多次互動。第二個方面,當任務不確定時,需要很多的單詞來描述,因此用戶會試圖將一個“足夠接近”的描述串在一起,讓接收者在實際項目中進行猜測。計算機服務就是一個很好的例子。另一個例子是通過在線界面購買類似數據的復雜產品。第三個例子是數據的研究和數據表,可以被認為是“數據的診斷”,以確定信息的結果。在所有這些情況下,終端用戶必須進行“范圍內的練習”,他們從一個寬泛的概念或一組可能性開始,通過一系列的交互步驟,限制一系列的可能性,直到找到最終的結果或得出結論。
然而,現實是,可能沒有殺手級應用。幾乎沒有什么應用程序被每個人使用。考慮到像通訊錄這樣的通用意圖都需要改進,想象一下,要想獲得針對一組用戶的意圖是多么的困難。一個類比就是手機。在移動領域,幾乎沒有通用的應用程序。大多數人使用10-15個應用程序。但每個人具體的10-15個應用都是獨一無二的。應用程序的使用是非常特殊的。這與組織內的應用程序非常相似,需要注意的是,個人的角色與他們最感興趣的應用有著很強的相關性。這就是為什么擁有一個平臺,以及由開發人員采用是如此的重要。每個部門都可能有自己的“殺手級應用”,最終用戶會欣然接受,而在這種環境下,開發人員將最清楚地看到需求。
用戶體驗
AI有機會給人留下第一印象。
使用AI的用戶體驗是是否被采用的最關鍵的因素之一,而對于那些不擅長建造AI的人來說,這一評價是最低的。再一次,我們又回到了消費者產品設計的規則:你有機會給消費者留下第一印象,他們通常對有缺陷或不完整的功能幾乎零容忍。太多的團隊沒有直接經驗為消費者開發產品,他們會發布一個有缺陷的MVP,認為用戶會原諒界面,而注重表現更好的功能。事實恰恰相反。許多人工智能項目都失敗了,因為開發團隊在發布它之前,在所有已部署的平臺上都沒有足夠的接口(也就是說,移動設備與桌面非常不同)。用戶的體驗很差,就再也不會回來了。確保良好的體驗可以像項目經理把他或她自己放在新用戶的鞋子里一樣簡單,訓練所有可能在人工智能上使用的基本短語,并修復那些在發布之前無法理解的短語。
在我看來,人工智能項目失敗的最大原因是它們的創造者在發布之前沒有進行足夠的訓練和對話。
有一個類似人類的界面,但不要太人性化。
人工智能不需要和人一樣的能力。我的團隊不斷提醒我,人們應該做他們擅長的事情,而AI應該補充這一點。它們應該被創建來利用它們所運行的計算環境的優勢。
話雖如此,但獲得采用需要用戶與人工智能互動,這在他們看來是很自然的。這有三個方面:
1. 輸入和響應的靈活性。
人類并不總是用同樣的詞語來表達同樣的意思。他們對事物的反應取決于一天的時間,他們的情緒狀態,他們在與誰交談,以及其他許多因素。人工智能還必須能夠以這種方式做出反應,讓用戶看起來足夠聰明,從而讓用戶相信,與機器對話是值得的。一個特定短語可能會有十個變體,比如“我能幫你做什么?”似乎足以模仿人類語言的多樣性。
2. 情感背景。
與此同時,我們給ABBY設定了一個情感背景。因此,她不僅會說不同的短語,她的回答也會被一種情緒設定所左右,從快樂到悲傷,以及對隨機短語的影響。舉個例子,如果我說“早上好,ABBY”,當她被設定為開心時,她會回答“早上好,Arthur。今天天氣真不錯。”如果當天她的情緒設定是悲傷,她可能會回應“嗨,Arthur。遺憾的是,我今天很倒霉,但希望今天過得愉快。”
另一個情感背景的例子是,當有人對ABBY說不尊重的話,或對她咒罵,或者使用侮辱性的語言,冒犯任何員工或者是Acxiom公司的政策或文化規范時。在這種情況下,ABBY被訓練成以一名Acxiom員工的身份作出回應。開始,她會表現出惱怒的情緒:
“請不要那樣對我說話。我天生非常敏感,不喜歡辱罵或不恰當的語言。”
如果辱罵的語言繼續存在(這是因為用戶喜歡測試ABBY的極限),那么就會有一種不斷升級的對話流,伴隨著越來越多的情感內容。如果辱罵行為在幾個步驟之后沒有停止,ABBY就會給人力資源部門發送郵件,報告辱罵的語言,并通知用戶她已經向HR匯報。
3. 恰當地處理它不懂的東西。
我們經常提醒終端用戶,ABBY只有一歲半,他們應該明白她有理解的局限。可能有很多她不理解的短語,特別是在早期部署一個新的意圖,而這個意圖又很重要時。除非我們相應地設定他們的期望,否則他們可能會預料到她會像一個擁有完整語言能力的成年人一樣做出回應。因此,我們提醒用戶,她的能力是通過一個三步反應概要來限制的:
1. “很抱歉,我不明白這一點。你能重新措辭嗎?”
2. “很抱歉,我還是不明白。你能再試一次嗎?”
3. “我才一歲半,還有很多東西要學。請對我耐心點。我已經把這個談話記錄下來,供我的團隊審閱。請明天再來,試試你的問題。在你的幫助下,我應該能更好地回答你的問題。”
最后,我們會有意識地做出相應的設計,使ABBY不會顯得太人性化。谷歌最近了解到,制造一種不能與人區分的人工智能對很多人來說是“令人毛骨悚然的”。總有一天,智能自動化將會如此徹底地融入我們的日常生活中,我們會簡單地認為,最簡單的任務——比如餐廳預訂——將由機器來處理,而不是人。但在那之前,人們會想要知道他們什么時候在應對一個機器,而不是一個人。ABBY有一些內在的設定,表明她不是人,比如她的詞匯量是有限的,而且她的一些用詞故意聽起來有點像機器。
以任務為導向。
用戶不愿意與典型的商業AI閑聊,除非是在最初的10分鐘,他們主要是出于對人工智能的“類似人類”的好奇。除此之外,人們只是通過人工智能來完成任務并繼續其它工作。不要把太多的時間浪費在所謂的閑聊的意圖上。人們很少使用它們。把你的設計集中在盡可能有效地完成特定的任務上。不要要求人們記住特殊的代碼或輸入長字符串,尤其是在移動設備上。使用人類能理解的最短的文本。
例如,讓ABBY在移動設備上預訂會議室,你所需要輸入的就是“預訂房間”。這將為你找到一個從現在到半小時以后開放的房間。為什么?因為當人們在移動設備上輸入“預訂房間”時,他們通常會是大樓周圍跑來跑去,急切地尋找一個開放的房間。ABBY用自然語言很清楚地回答,所以用戶不需要猜測發生了什么(例如,開始時間或預訂的時間)。
“我已經為你預訂了 Mt. Shasta,時間為25分鐘,截止到今天下午3:30。它能容納4人,位于17樓東側。”這是一種優雅的、以任務為導向的用戶體驗,對用戶來說是高效的,并且讓ABBY看起來很智能。當然,如果用戶愿意的話,他們的命令也可以很冗長,而且對于那些喜歡精簡的人來說,也有一些簡短的代碼,比如“預訂房間T 2 1 SF”,意思是“今天下午2點在舊金山預訂一間房間,時間為一個小時”。
為無處不在而設計。
人工智能需要存在于我所在的任何地方——一個無處不在的伴侶——除非技術加速。因此,它需要在我可能工作的任何環境中都可用。Slack(企業聊天工具)這樣的應用程序是一個很棒的第一環境,因為終端用戶整天都在使用Slack,同樣重要的是,Slack還擁有一款應用于平板電腦和移動設備的應用,人們也經常使用。人們整天都在使用瀏覽器,所以在瀏覽器中或附加在瀏覽器上的界面也很重要。更普遍的是,在計算桌面的背景下,人工智能可以為許多應用程序提供一個接口。它可以存在于寫字樓的自動登記系統上,也可以存在在會議室外面墻上的平板電腦上。或者被動地待在像Bluejeans這樣的會議應用中,例如,用戶的請求(在這個特定的用例中)打開文檔或搜索谷歌的信息。最后一個例子展示了語境的力量。因為人們已經在說話了,所以對人工智能說的話是不中斷的。
以無處不在為目的的設計比在特定環境中的人工智能更重要。這也意味著在特定的環境下需要進行調整,從而做到對用戶來說是最有效的。
記憶在人工智能中的作用。
我們被稱為有“智慧”的一個關鍵因素是我們能夠記住我們過去所做的事情。如果你不記得昨天和某一個人的對話,那么今天和他交談時他會覺得你很奇怪。類似地,AI需要有能力記住過去與用戶的交互,原因如下。首先,它是智力、人工或其他方面的預期功能。第二,它暗示了對終端用戶的真實認可:“我認識你,因為我記得我們過去做過的所有事情。”第三,過去的交互歷史能夠為終端用戶帶來更有效的交互。
客戶希望人工智能能夠記住他們之前的交互和購買,這樣他們就可以很容易地回溯,從而節省了重復先前工作的時間。第四,過去的交互歷史能夠促進預測的改進、以及更智能、更有效的交互,更好的服務質量和更優的銷售方案。過去購買過某些商品的人可能更有可能在未來再次購買,或者以后可能會購買其他相關產品。
向人工智能添加內存是當前技術的前沿。我們將會在未來的12-24個月里看到AI出現重要的記憶。
結論
我們離擁有電影中所看到的質量的人工智能還有很長一段路要走,所以別指望Jarvis會在你的桌面上出現。但是,可否使用自然語言處理來構建應用程序和接口,以加快和簡化業務,同時提高客戶滿意度以獲得合理的成本?當然,這要感謝已經提供的開源工具的數量。
使用后端NLP技術和前端會話接口都有好處。每一個都為業務提供不同種類的功能。
NLP和人工智能只會成為我們企業的一項日益重要的技術,企業如果忽視它們將會很危險。
Arthur Coleman是Acxiom研究公司的總經理。他專注于利用自然語言處理、人工智能/機器學習、區塊鏈、數字指紋等新興技術加強跨渠道營銷。他還積極參與了IAB技術實驗室制定消費者隱私的行業標準。