葡萄智學(xué)韓異凡談“闖關(guān)”：AI產(chǎn)品模型更適合兒童英語賽道

2019-03-15 08:26:14發(fā)布來源：多知網(wǎng) 作者：黎珊

　　多知網(wǎng)3月15日消息，在【Open Talk】第十九期“AI英語老師‘躥紅’：耍把式還是有本事？”活動上，葡萄智學(xué)聯(lián)合創(chuàng)始人韓異凡分享了葡萄英語從選型、驗(yàn)證技術(shù)可行性到完善教學(xué)流程、不斷提升技術(shù)能力等打磨階段經(jīng)歷的事情?，F(xiàn)如今，市場上類似的產(chǎn)品正在增多，韓異凡提到，葡萄英語接下來要跑得更快，在技術(shù)和數(shù)據(jù)層面建立壁壘。

　　(葡萄智學(xué)聯(lián)合創(chuàng)始人韓異凡)

　　以下為韓異凡演講全文（經(jīng)多知網(wǎng)編輯）：

　　葡萄智學(xué)成立于2018年3月份，初創(chuàng)團(tuán)隊(duì)大部分來自于搜狗搜索，幾位聯(lián)合創(chuàng)始人基本都是從一畢業(yè)就進(jìn)入了搜狗，做了十幾年的搜索，在人工智能領(lǐng)域有著比較深入的認(rèn)知和技術(shù)上的積累。

　　現(xiàn)今的教育行業(yè)，有很多的痛點(diǎn)存在，比如教育資源的稀缺性，我們認(rèn)為人工智能能夠在很大程度上去解決這些問題。從另外一個維度上說，它也可以降低成本，讓更多的人能夠享受優(yōu)質(zhì)的教育資源。

　　葡萄智學(xué)成立后，選取了英語學(xué)科作為一個切入點(diǎn)。經(jīng)過半年時間左右的研發(fā)，第一款產(chǎn)品葡萄英語就上線了，我們希望用科技提升學(xué)習(xí)效率和教育資源的平衡。

　　當(dāng)前人工智能三大核心技術(shù)組成：圖像識別、語音技術(shù)、語義理解

　　在講述葡萄英語這款產(chǎn)品整個打磨歷程之前，我大概講一下人工智能技術(shù)有哪些。如今人工智能的核心應(yīng)用技術(shù)有三個：第一是圖像識別，第二是語音技術(shù),第三個是語意理解。

　　首先是圖像識別，圖像識別有幾個細(xì)分技術(shù)領(lǐng)域。比如文字識別，應(yīng)用到教育領(lǐng)域，大家看到的拍圖搜題，自動閱卷，都是用了文字識別的技術(shù)。

　　識圖搜索也是應(yīng)用的比較早期的一款技術(shù)。這種技術(shù)被應(yīng)用的場景是，你看到誰穿了一件衣服可以拍張照片，通過識圖找到這件衣服的購買鏈接，或者去找這件衣服的相似款。

　　人臉識別技術(shù)比較有價值的應(yīng)用也有很多，應(yīng)用到教育領(lǐng)域，可以分析孩子學(xué)習(xí)時候的注意力、興趣度、關(guān)注度等等，進(jìn)而調(diào)整后續(xù)的教學(xué)方法和內(nèi)容。

　　還有一些是圖像識別技術(shù)和其他人工智能的技術(shù)結(jié)合在一起做的應(yīng)用。比如像圖文翻譯、照片生成。

　　第二個人工智能的核心技術(shù)：語音技術(shù)。語音技術(shù)從大的應(yīng)用方向上講，語音識別、語音評測和語音合成這三個大的方向。其它比如有效語音判斷、語音增強(qiáng)和聲紋識別其實(shí)是為了輔助比如語音識別的正確性、準(zhǔn)確率去做的額外工作。

　　語音識別是把我們說的話能夠轉(zhuǎn)換成一種文字。我們做實(shí)際應(yīng)用的時候，在葡萄英語場景里面，我們需要識別孩子說的英文具體的含義是什么。在這個過程里，有效語音判斷、語音增強(qiáng)和聲紋識別這些分支的技術(shù)都會起到一些作用，比如說我們會發(fā)現(xiàn)孩子在學(xué)習(xí)英語的過程中家長會陪在旁邊，背景音會有家長聊天的聲音，這個時候就需要通過有效語言判斷，通過聲紋識別的技術(shù)把家長的聲音過濾掉，拿到孩子的聲音。

　　語音評測是指發(fā)音質(zhì)量的評測，對英語而言又有很多細(xì)分的項(xiàng)目。發(fā)音的準(zhǔn)確度，句子的發(fā)音流暢度、完整度等等。

　　語音合成其實(shí)是語音識別的一個反向應(yīng)用，它把文字轉(zhuǎn)變成語音輸出出來。語言合成再往上就是一種帶著情感遷移的語音合成，它可以合成出符合某個人的音色、音質(zhì)特征的語音出來。

　　第三個人工智能的核心技術(shù)是語意理解，語意理解是人工智能技術(shù)里面最難的一項(xiàng)技術(shù)。我通常會打比方說人工智能能做到一個什么樣的水平和一個真人做這件事情是否容易做一些類比。就像語意理解這件事情，我們可以設(shè)想兩個真人在做溝通，經(jīng)常會出現(xiàn)A說了一句話，B理解的時候很有可能就理解出來完全不同的一個意思。語意理解是非常困難的事情。

　　技術(shù)和內(nèi)容為打磨重點(diǎn)，葡萄智學(xué)相關(guān)團(tuán)隊(duì)人員占比80%

　　我覺得有一句話說的特別對，“因?yàn)橄嘈潘钥匆姟?，葡萄相信人工智能是提升教育質(zhì)量與公平的最有效解決方案。我們從教育最核心的三個元素入手，去構(gòu)建葡萄英語這款產(chǎn)品。內(nèi)容層面上來說，我們通過自己去構(gòu)建內(nèi)容的方式來最終達(dá)到因材施教。師資層面我們構(gòu)建了一個智能老師。技術(shù)層面，最終通過技術(shù)的方式能夠促進(jìn)教育的公平性。

　　團(tuán)隊(duì)對人工智能領(lǐng)域技術(shù)的深入理解和深厚積累，是打造葡萄英語的第一階段。

　　有了這樣的積累之后，要去做一款兒童英語學(xué)習(xí)的產(chǎn)品，我們面臨的第一個問題是選型。選產(chǎn)品形態(tài)，當(dāng)時有兩類，是1V1的真人教學(xué)，還是偏游戲的人機(jī)交互方式？

　　成人可以自學(xué)，但是孩子不可能一直坐著，按照機(jī)械的操作完成學(xué)習(xí)?？紤]到教育這件事情的嚴(yán)肅和嚴(yán)謹(jǐn)性，以及兒童學(xué)習(xí)的特點(diǎn)，我們選擇了1V1的教學(xué)方式，也是尊重教育的嚴(yán)肅性。

　　選擇完這樣一種產(chǎn)品形態(tài)之后，接下來面臨的是老師是用真人老師還是用虛擬形象？其實(shí)最早是想用虛擬形象，當(dāng)時有很多的想法，我們可以簽很多的IP，孩子可以選喜歡的IP形象，比如可以讓唐老鴨教他學(xué)英語，這對AI而言沒有任何的成本。

　　但是當(dāng)我們看了大量教學(xué)視頻之后，會發(fā)現(xiàn)英語教學(xué)里老師的語音、語調(diào)、表情、動作，對于整個教學(xué)質(zhì)量是至關(guān)重要的。它不是說你去構(gòu)建一個虛擬動畫形象的建模，給他生產(chǎn)幾套動作，就能夠?qū)崿F(xiàn)的。所以我們當(dāng)時就選擇了真人老師的方向，當(dāng)時選擇的時候，市面上還沒有這樣的方式。

　　確定了產(chǎn)品的形態(tài)之后，接下來我們驗(yàn)證我們所設(shè)想的技術(shù)可行性。首先驗(yàn)證的是，比如在語音識別這件事情上，我們能不能做到和真人一樣的及時反饋，以及整節(jié)課下來能不能真的逼近直播的互動效果。

　　在驗(yàn)證了技術(shù)是可以做到這一點(diǎn)之后，接下來我們做的是完善教學(xué)流程。

　　葡萄英語其實(shí)是非常重的一款產(chǎn)品，葡萄英語在主課之外會有預(yù)習(xí)環(huán)節(jié)，還有個性化的作業(yè)環(huán)節(jié)，我們?yōu)橹髡n配備了輔修課，還會為孩子生成個性化輔導(dǎo)課。個性化輔導(dǎo)課結(jié)合整個單元的課程報(bào)告，依托AI大數(shù)據(jù)分析，設(shè)計(jì)出針對孩子薄弱部分的專屬課程。

　　此外，我們還加了入學(xué)測試以及階段測試，給孩子輸出能力模型報(bào)告。在做教育這件事情上，我們還是很嚴(yán)謹(jǐn)?shù)模诮滩纳衔覀円肓伺＝虼髮W(xué)出版社《Let's Go》的版權(quán)，我們在中美英三地都建立了教研中心。在英國，我們聘請了英國劍橋的博士作為教研中心負(fù)責(zé)人，每堂課的課件都經(jīng)過審核。

　　現(xiàn)如今，技術(shù)和教研團(tuán)隊(duì)的規(guī)模占葡萄智學(xué)的80%，葡萄在技術(shù)和內(nèi)容層面的投入占比非常大。

　　前期的工作完成之后，接下來我們就重點(diǎn)提升技術(shù)實(shí)力，我們公司核心的基因還是技術(shù)。2月28號我們在線上換上了我們自己的引擎，這也是從去年我們就一直在研發(fā)的自有引擎，我們評估我們的自有語音引擎效果是兩倍于現(xiàn)在市面上所有的第三方語音引擎效果。

　　我們現(xiàn)在還在研發(fā)對話系統(tǒng)，我們希望未來孩子會有一個玩伴陪同他去學(xué)習(xí)，我們有一個IP形象叫淘淘，它會和孩子做口語聽力的對話訓(xùn)練，通過IP形象動畫互動的方式，讓孩子既不枯燥，也可以在玩中練了口語和對話。

　　葡萄英語這款產(chǎn)品會把人工智能的知識圖譜、語音識別和評測，對話系統(tǒng)、自適應(yīng)學(xué)習(xí)，個人的學(xué)習(xí)報(bào)告和能力模型的構(gòu)建等一系列的技術(shù)應(yīng)用在其中，并且會串聯(lián)在整個產(chǎn)品的每一個環(huán)節(jié)。

　　學(xué)生上主課里面做的每一個練習(xí)，每一個知識點(diǎn)的掌握程度，課后作業(yè)做的情況，以及對話系統(tǒng)的產(chǎn)品里面做的對話練習(xí)，這些數(shù)據(jù)我們都會記錄下來，去分析這個孩子的能力模型是什么，繼而去調(diào)整接下來這個孩子他的教學(xué)應(yīng)該是怎樣的。

　　未來方向：提供更定制化的AI課程，要在技術(shù)、數(shù)據(jù)上建立壁壘

　　AI老師在兒童英語學(xué)習(xí)上有哪些痛點(diǎn)？真人老師效果不穩(wěn)定，師資有限，好老師稀缺，這都是現(xiàn)實(shí)真實(shí)存在的問題，包括好老師的稀缺性推高了成本和價格，現(xiàn)在很多線上課是需要預(yù)約的，上課不靈活，以及難以針對每個學(xué)生去做因材施教，這都是現(xiàn)在教育存在的一些痛點(diǎn)。

　　而AI老師完全可以解決這些問題。AI老師效果穩(wěn)定，好老師無限復(fù)制，可以24小時在線，孩子可以無需預(yù)約隨時上課，更是可以提供千人千面的個性化教學(xué)。

　　葡萄英語已將AI技術(shù)貫穿到了整個英語教學(xué)的過程，通過AI定制1對1教學(xué)，讓每個孩子都能“因材施教”。目前我們產(chǎn)品已經(jīng)上了個性化測評課，我們通過一套孩子的練習(xí)反饋數(shù)據(jù)科學(xué)測量孩子的真實(shí)水平，并去匹配推薦最適合孩子的課程。葡萄英語還有一個單元大復(fù)習(xí)課，會根據(jù)本單元孩子的學(xué)習(xí)變化、知識能力掌握情況，量身定制個性化輔導(dǎo)課，讓孩子在游戲互動場景下進(jìn)行查缺補(bǔ)漏，邊玩邊學(xué)，吃透每個知識點(diǎn)。

　　葡萄英語AI定制課的虛擬老師也針對各種場景做了各種處理，甚至提前預(yù)埋了很多突發(fā)情況的解決方案。比如，當(dāng)孩子發(fā)音不標(biāo)準(zhǔn)的時候，當(dāng)孩子用中文回答的時候，當(dāng)孩子不想答，AI老師都會針對性的給出反應(yīng)，例如鼓勵孩子再來一次，再講解一次問題讓孩子做選擇等。葡萄英語的課程有很強(qiáng)的互動性，涵蓋聽說讀寫各種訓(xùn)練，課程整體時?；究刂圃?5分鐘左右。

　　我一直認(rèn)為未來的教育一定是因材施教的，每個孩子都不一樣，怎樣找到一種適合這個孩子的內(nèi)容以及適合這個孩子的教學(xué)方法，才能達(dá)到更高效的學(xué)習(xí)，這是AI老師未來可以做到的一點(diǎn)。葡萄英語是要“讓每一個孩子能夠公平且高效的學(xué)習(xí)”。

　　去年12月26號融資消息公布后，接下來就有很多類似的產(chǎn)品出來，在這樣的競爭環(huán)境下，我們只能做得更快。因?yàn)槲覀冎垃F(xiàn)在這款產(chǎn)品還有很大的潛力空間，我們自己知道我們未來要做成一個什么樣子，我們必須跑得更快，在技術(shù)和數(shù)據(jù)以及用戶心智層面建立壁壘。

　　【問答環(huán)節(jié)】

　　問：孩子比較喜歡現(xiàn)實(shí)生活的某一位老師，我想模擬一下現(xiàn)實(shí)中老師他的形態(tài)以及說話的方式，如果要實(shí)現(xiàn)，這個難度有多大？

　　韓異凡：技術(shù)難度不大，難度在數(shù)據(jù)層面。要擁有豐富的老師的大量視頻才可以把這個建模給建出來。

　　問：需要多少？

　　韓異凡：幾百小時這樣的視頻量，而且可能對于本身視頻的質(zhì)量還要有很高的要求?，F(xiàn)在在技術(shù)層面比較可行的一種方案是老師在專業(yè)的場景里面，就跟拍武打片類似的采集點(diǎn)，這樣效果會更好。如果僅僅是視頻的話，其實(shí)現(xiàn)在的技術(shù)做起來還是會有一定的困難。

商學(xué)院

Open Talk

葡萄智學(xué)韓異凡談“闖關(guān)”：AI產(chǎn)品模型更適合兒童英語賽道

相關(guān)閱讀