我本科是在北京上的,記得2007年我大三的時候去德國電信實習,當時的崗位叫做技術支持,其實就算是客服了。我們當時的辦公區(qū)域前方有一個大屏幕,大屏幕上是德國電信在中國幾條骨干網(wǎng)的健康狀況,由綠色、黃色、紅色來表示,當上面的橫條變成紅色的時候,我們就需要打電話給工程師,讓他們?nèi)ヅ挪橐幌码U情。后來我們和工程師形成了默契,他們在接起電話后,我們都不用說話,他們直接回復說我知道了,電話就掛了。十年過去了,當我們今天在做外呼機器人產(chǎn)品的時候,我經(jīng)常會想起那段做客服的時光。我們的客戶有物流企業(yè),他們常常在后半夜收到訂單,在使用外呼機器人之前,他們要派幾十人的團隊值夜班,給各地的司機用戶打電話,協(xié)調(diào)指派訂單,通過我們的外呼機器人,他們減少了大量的夜班人員,外呼機器人讓大家晚上能睡個好覺,為客戶創(chuàng)造了價值。
外呼機器人是一種終極的人工智能' target='_blank'>人工智能產(chǎn)品形態(tài)
數(shù)據(jù)、信息、知識、決策、行動是數(shù)據(jù)系統(tǒng)發(fā)展的幾個重要階段,也是一個遞進關系。數(shù)據(jù)就是我們常說的0和1,是對物理世界的客觀表現(xiàn)。信息是融合了更多上下文的數(shù)據(jù),知識是信息中蘊含的規(guī)律,決策告訴你應該怎么做,而行動是決策的執(zhí)行。我們舉一個地理位置系統(tǒng)中的例子,比如地圖信息的采集,就是在數(shù)據(jù)層面;整理出來的地圖包含地名和經(jīng)緯度信息,在信息層面;根據(jù)用戶上傳的信息判斷道路的擁堵情況,屬于知識層面;大家開車用的地圖導航,在每一個路口告訴你下一步往哪個方向走,是決策系統(tǒng)的功能;最后,自動駕駛汽車,就是一個終極的產(chǎn)品形態(tài),因為它可以自動地把你從A點帶到B點。
同樣,在語音數(shù)據(jù)系統(tǒng)中也可以得出產(chǎn)品不同的進化思路,錄音數(shù)據(jù)在呼叫中心系統(tǒng)中保存下來,是數(shù)據(jù)層面的工作;將錄音數(shù)據(jù)與銷售代表打通,可以把同一個座席的所有錄音信息都找出來,這樣的系統(tǒng)就在信息層面;接下來如果我們做了一個統(tǒng)計分析的BI系統(tǒng),或者智能質檢系統(tǒng),這些都是知識層面的能力;外呼機器人是行動層面的產(chǎn)品,可以替代人工完成一段對話,所以說這是一種終極的產(chǎn)品形態(tài)。大家可能注意到,這里面決策層面的產(chǎn)品好像還是空缺的,在我們語音系統(tǒng)里面,有實現(xiàn)決策層面的產(chǎn)品嗎?我這里先賣一個關子,等下為大家揭曉。
終極產(chǎn)品形態(tài)是指在未來的幾十年甚至上百年的時間里,可能都會在這個產(chǎn)品上不斷投入,不斷進步。
外呼機器人的市場的崛起
2018年上半年的外呼機器人異常火爆,據(jù)不完全統(tǒng)計,已經(jīng)有50-100家企業(yè)上線了這個新產(chǎn)品,我們認為市場的崛起主要有以下三方面的原因。
一是人工智能技術的成熟。首先語音識別的準確率在過去的幾年中有了顯著的提升,實驗室環(huán)境下的語音識別準確率已經(jīng)從2013年的87%提高到了2017年的97%。另外在語義理解上,在2018年初也取得了突破,在由美國斯坦福大學組織的閱讀理解測試SQUAD中,人工智能第一次取得了比人類更好的成績。
二是來自于對商業(yè)價值的考慮。今天的互聯(lián)網(wǎng)流量越來越貴,電話反而成為了相對便宜的用戶觸達渠道,同時一些場景下人工智能能夠代替人工,進一步降低了通過這個方式獲客的成本。
三是由于電話本身的特點,智能電話首先是一個電話。今天在手機上,電話的打斷優(yōu)先級是最高的,電話可以打斷你在使用手機時候的一切行動,逼著你要對一個來電進行選擇。電話是一個同步的溝通方式,這種溝通方式在人們長時間的交流中形成了一種默契和禮貌規(guī)范,你直接問我問題的話,我不好意思不答。我也不方便在你說話的同時把電話掛斷,至少會讓你把句子說完,然后再掛電話。
外呼機器人的挑戰(zhàn)和風險
我們看到的示例可能都是千里挑一萬里挑一或者完全是人配合的結果,而真實的情況往往不那么美好。了解外呼機器人的挑戰(zhàn)和風險才能更加了解技術和產(chǎn)品的邊界,在降本增效的同時,盡量不影響用戶體驗。
首先是語音識別技術的挑戰(zhàn),前面說到實驗室環(huán)境下語音識別準確率已經(jīng)從2013年的87%提高到了2017年的97%,而在實際環(huán)境中,這個數(shù)字會降低到85%左右,因為實際環(huán)境中有大量的噪音、口音、聲源遠近等問題。在外呼機器人這個領域,短語音識別是一個難點,因為在缺少更多上下文信息的時候,語音識別很難確定你發(fā)的音和對應的字之間的關系,中文更是如此,因為中文是一個同音不同字的語言,還有音調(diào)的變化,比如我發(fā)一個音lao shi ,這在不同的語境下,可能代表這是一個教書育人的職業(yè),在另外的語境下,可能代表這個人的性格很老實。
來自于技術方面的第二個挑戰(zhàn)是多輪對話,人的自然語言從來都是含糊不清的,特別依賴上下文關系。比如說我想訂一個房間, 什么位置?, 中關村附近,什么時間?,周六… …這個例子里面,關于訂房間的信息是散落在多輪對話之間的。如何綜合全面考慮上下文信息一直是學術界的一項挑戰(zhàn)。
第三,人類的對話行為模型非常復雜。因為在外呼機器人場景下,人們期待的是和另一個人之間的交流而不是一臺機器。研究顯示,人們在和機器人對話的時候,會自然的放慢語速,發(fā)音會更清晰,也會用更加配合機器人的句式來交互。但是在和人溝通的場景中,人們的發(fā)音或更含糊,會在句子中省略很多字詞,也會在句子中突然修改前面的對話信息,這些都給語音識別,語義理解造成了極大的困難。
最后,我們目前的外呼機器人大部分都還是播放提前錄音,為了實現(xiàn)真正的人機語音對話系統(tǒng),我們需要讓機器能發(fā)出人的聲音,這就是語音合成技術。但是要合成出人自然對話中的抑揚頓挫,并且騙過人是一件非常困難的事情,人的耳朵對于音頻的敏感程度遠超過人眼對圖像的敏感程度,這也讓語音合成這件事情的難度更高。
綜上,外呼機器人是一個典型的技術驅動產(chǎn)品創(chuàng)新的項目,它的產(chǎn)品形態(tài)很簡單,最重要的是核心技術的優(yōu)化、發(fā)展和突破。
除了技術上的挑戰(zhàn)之外,在業(yè)務層面外呼機器人的產(chǎn)品形態(tài)也存在著諸多風險。
我們今天大部分的外呼機器人都是以營銷為主,如果外呼機器人普及而又沒有加以限制的話,一般用戶將不勝其擾,今天外呼機器人的接通率已經(jīng)很低了,接下來的情況可能更糟糕。一方面用戶被長期培養(yǎng)出來的習慣是只要是陌生電話就完全不接。另外國家也不會坐視不理,甚至可能出現(xiàn)一刀切的管理,讓整個行業(yè)都遭受重創(chuàng)。
我們也在思考,如何能讓這個產(chǎn)業(yè)持續(xù)發(fā)展?這里面的核心就是己所不欲勿施于人,把我們想象成客戶,如果你正在開發(fā)的外呼機器人連自己都不想聽的話,那你也不要給客戶打了。 另外作為行業(yè)內(nèi)部的人員也要自律,設定一些保證用戶體驗的規(guī)則并嚴格執(zhí)行,比如對撥打電話頻次、時間段、內(nèi)容等的規(guī)定,行業(yè)內(nèi)部需要形成共識。要主動尋求監(jiān)管,配合國家和各級部門對于話術、錄音的備案。最后我們要為客戶創(chuàng)造價值,互聯(lián)網(wǎng)廣告剛剛興起的時候,各種流量劫持,彈屏等讓用戶不堪其擾,但今天以千人千面為代表的更多定制化和更懂客戶的服務及廣告內(nèi)容正在逐漸被大家所接受,廣告主和用戶之間的關系更加和諧。
機器人和人之間的行為規(guī)范
外呼機器人可能是人類歷史上第一次,大規(guī)模的在不知情的情況下和機器進行對話,這是一種嶄新的交流方式。人和人之間交流的默契和行為規(guī)范,是否仍然適合于人和機器交流呢?我們是否應該發(fā)展出一種新的禮貌規(guī)范來約束人和機器之間的交流,繼而讓人的感受更好呢?比如說是否要在對話的一開始就自報家門,讓對方知道自己是機器人呢?或者是否至少通知對方這一通電話可能會被錄音呢?我們再往下想,接下來我的手機上可能會安裝一個人工智能小秘書,自動幫我把在通訊錄上的電話放進來,然后自動幫我接聽陌生來電,自動幫我記錄對話內(nèi)容,之后給我發(fā)一個會議紀要。再比如說可以像網(wǎng)站對待搜索引擎的檢索一樣,約定一個機制告訴對方,我不希望接聽任何機器人來電,請幫我自動過濾等等。
語音機器人' target='_blank'>語音機器人家族
說到這里,我們談的都是外呼機器人的問題,而外呼機器人不等于語音機器人,語音機器人的應用更加廣泛。我們一起來看一下語音機器人家族的其它成員。
教練機器人:
在座席和客戶溝通過程中,教練機器人會實時地給出對話的提示,包括階段話題的順序,問題的解答,客戶畫像的自動提取,實時質檢,客戶轉化率或者滿意度的評分。還記得我們最開始給出的那一個數(shù)據(jù)系統(tǒng)的發(fā)展階段路線圖嗎?當時留了一個懸念說在語音系統(tǒng)中,什么是決策層面的產(chǎn)品形態(tài)呢?我這里告訴大家,是AI教練,它是決策層的產(chǎn)品,因為它在你對話的過程中,實時告訴你,應該說什么怎么說。雖然它還不能代替你說,但我們認為這個產(chǎn)品是外呼機器人發(fā)展的必由之路,因為機器可以在真實對話中學習人類說話的方式,讓我們的外呼機器人越來越智能,能適應的情況越來越多。
陪練機器人:
外呼機器人的角度是模擬銷售代表給客戶打電話,陪練機器人的角度模擬客戶,陪銷售代表進行對練,適用于新人入職培訓的場景。
實體機器人:
不難想象當包括國內(nèi)的天貓、小米、京東等智能音箱,或者人形機器人變得越來越普及的時候,我們希望能夠直接通過他們得到某項產(chǎn)品的服務。這個時候語音是很關鍵的一項技術。
人類七萬年多前發(fā)明了語音,五千多年前發(fā)明了文字,語音是客戶溝通第一平臺。語音是最重要的溝通方式,無論是否是外呼,是否通過電話,語音作為一種溝通方式,都一定會長期存在,任何一家企業(yè)都應該有自己的語音智能系統(tǒng)和語音智能戰(zhàn)略規(guī)劃。
悟空話務電銷電話機器人' target='_blank'>電話機器人