在打磨產(chǎn)品過(guò)程中,小猿口算一直在解決“準(zhǔn)確率”的難題。
文|王上
今天,猿輔導(dǎo)旗下拍照批改工具小猿口算誕生1年零10個(gè)月,首次召開(kāi)發(fā)布會(huì)亮出成績(jī)單。
在題為“AI進(jìn)化”的新聞發(fā)布會(huì)上,小猿口算APP負(fù)責(zé)人王向東披露:目前全國(guó)有超過(guò)三千萬(wàn)的小學(xué)家長(zhǎng)、老師用戶(hù)在使用小猿口算APP,每日拍照批改題目數(shù)量超2億道,其中橫式題目的批改準(zhǔn)確率已達(dá)到99.9%,超過(guò)了人類(lèi)平均水平。
小猿口算最初為解決小孩初學(xué)數(shù)學(xué)的痛點(diǎn),從工具切入,做了拍照批改作業(yè)和練習(xí)的產(chǎn)品功能,而今這款產(chǎn)品滿(mǎn)足了家長(zhǎng)、學(xué)生和學(xué)校三個(gè)極。
在打磨產(chǎn)品過(guò)程中,小猿口算一直在解決“準(zhǔn)確率”的難題。
(小猿口算APP負(fù)責(zé)人王向東)
準(zhǔn)確是拍照批改產(chǎn)品的第一生命線(xiàn)
拍照批改產(chǎn)品看起來(lái)簡(jiǎn)單,做起來(lái)難。
在去年初剛做好產(chǎn)品的興奮期還沒(méi)過(guò),王向東就意識(shí)到跳入了“坑里”。
小朋友們對(duì)新型手機(jī)應(yīng)用最有吸引力,小猿口算推出后,王向東正在上幼兒園大班的女兒用了后感覺(jué)非常神奇,覺(jué)得太強(qiáng)大了。但有一次,王向東的女兒用后發(fā)現(xiàn)有一道小猿口算給判錯(cuò)了,這讓小姑娘覺(jué)得很委屈。
小孩子的手寫(xiě)字體非常稚嫩,4寫(xiě)起來(lái)非常像9,10寫(xiě)起來(lái)像11,王向東的女兒的那道題本來(lái)做對(duì)了,但是軟件把“4”識(shí)別成了“9”,就判錯(cuò)了,當(dāng)時(shí)孩子臉就沉了,她說(shuō):“爸爸這個(gè)軟件太壞了,明明寫(xiě)對(duì)了批錯(cuò)了?!?/p>
在這個(gè)過(guò)程中,王向東給不同的家長(zhǎng)推介,他們也發(fā)出這樣的勉勵(lì):“再準(zhǔn)確一些就更好了,否則我們更浪費(fèi)時(shí)間?!?/p>
王向東這才意識(shí)到準(zhǔn)確的重要性,小猿口算團(tuán)隊(duì)開(kāi)始從技術(shù)拆解,發(fā)現(xiàn)拍照批改有三個(gè)步驟:檢測(cè)、識(shí)別、批改。
在拍照里有可能有口算題、有可能有題干、草稿或者其他東西,系統(tǒng)需要把這些東西分別檢測(cè)出來(lái),告訴后端模型說(shuō)這是口算題、選擇題、應(yīng)用題。
把這些題目檢測(cè)識(shí)別完以后,就要對(duì)它進(jìn)行批改。
如何保證批改準(zhǔn)確率?
很多小朋友字跡潦草、打草稿、涂抹,有的用鋼筆、鉛筆,寫(xiě)完會(huì)有背透,有各種角度,或者最終拍的時(shí)候字體模糊,這些都是極大的難題。
但是,必須要讓家長(zhǎng)有滿(mǎn)意的結(jié)果才能產(chǎn)生信任,這種信任帶來(lái)的責(zé)任是巨大的,在準(zhǔn)確率方面小猿口算進(jìn)行了很多輪的迭代。
這背后的技術(shù)就是系統(tǒng)接收用戶(hù)上傳的圖片后,會(huì)定位圖片中的普通算式、分?jǐn)?shù)計(jì)算、單位換算、豎式、脫式、解方程等常見(jiàn)題型,同時(shí)系統(tǒng)還會(huì)檢測(cè)表格、填空題、選擇題、判斷題、應(yīng)用題等口算衍生題目。然后,針對(duì)不同題型,系統(tǒng)采用專(zhuān)業(yè)的深度學(xué)習(xí)識(shí)別算法與批改策略,識(shí)別并批改用戶(hù)作答內(nèi)容。
針對(duì)在檢測(cè)或者識(shí)別方面,小猿口算下了很多苦功夫。
首先,機(jī)器需要識(shí)別大量的數(shù)據(jù)才能反哺回來(lái),2017年12月期間,小猿口算團(tuán)隊(duì)向家長(zhǎng)、學(xué)校老師回收了約2000冊(cè)小學(xué)生口算練習(xí)冊(cè),不同類(lèi)型的口算題,各種各樣的兒童字跡,用這種“笨”方法構(gòu)建了小猿口算的原始數(shù)據(jù)庫(kù),達(dá)到了上萬(wàn)份。
然后,針對(duì)易錯(cuò)的題型在后臺(tái)進(jìn)行標(biāo)注,這樣機(jī)器會(huì)自動(dòng)學(xué)習(xí):這個(gè)案例應(yīng)該是3,這個(gè)案例應(yīng)該是5。再經(jīng)過(guò)多次對(duì)比確認(rèn)以后跟這個(gè)類(lèi)似相關(guān)的就把它命名為3或者5。
解決不好的題型會(huì)不斷地標(biāo)注,這樣以來(lái),準(zhǔn)確率逐步提高。
上周,小猿口算在全國(guó)收集了家長(zhǎng)、老師批改過(guò)的小學(xué)生作業(yè)100余本,其中涉及橫式口算題目11萬(wàn)道,評(píng)測(cè)員使用小猿口算對(duì)作業(yè)進(jìn)行了二次批改,同時(shí)與標(biāo)準(zhǔn)答案進(jìn)行比對(duì)。
多知網(wǎng)在現(xiàn)場(chǎng)觀察到,在11萬(wàn)道題目中,人工檢查批改錯(cuò)誤的題目數(shù)量為1050道,AI批改錯(cuò)誤的題目數(shù)量為104道,AI的準(zhǔn)確率為99.9%,遠(yuǎn)大于人工批改的準(zhǔn)確率。在批改速度上,AI更是遠(yuǎn)勝一籌。據(jù)小猿口算相關(guān)工作人員介紹,小猿口算批改錯(cuò)誤的類(lèi)型主要是因?yàn)閷W(xué)生在答題過(guò)程中多次對(duì)題目和答案進(jìn)行涂改導(dǎo)致。
值得注意的是,小猿口算背后的研發(fā)團(tuán)隊(duì)就是來(lái)自猿輔導(dǎo)人工智能團(tuán)隊(duì)。
這支團(tuán)隊(duì)從2014年就開(kāi)始研究各種前沿科技,包括機(jī)器閱讀理解、圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言理解、數(shù)據(jù)挖掘、深度學(xué)習(xí)等領(lǐng)域。
2019年3月,在微軟MS MARCO(Microsoft MAchine ReadingCOmprehension)機(jī)器閱讀理解測(cè)試的官方排行中,猿輔導(dǎo)一舉超越百度、微軟等技術(shù)公司,坐上了頭把交椅。并且,猿輔導(dǎo)NLP在MSMARCO榜單中的成績(jī),首次超過(guò)了人類(lèi)水平。
小猿口算正是這個(gè)人工智能團(tuán)隊(duì)從開(kāi)發(fā)到應(yīng)用的完整落地產(chǎn)品。
解決批改和練習(xí)痛點(diǎn)
時(shí)間拉回到2017年,王向東看到了數(shù)學(xué)初學(xué)者遇到的種種問(wèn)題。
當(dāng)時(shí),王向東的女兒剛好5歲,正上幼兒園大班,每天有大量的口算題,孩子不知道怎么學(xué)習(xí),王向東也不知道如何輔導(dǎo),尤其還要檢查孩子的作業(yè)。
通過(guò)跟朋友交流,王向東發(fā)現(xiàn)這是初學(xué)數(shù)學(xué)孩子和家長(zhǎng)一個(gè)普遍的痛點(diǎn)。
在做了大量調(diào)研后,猿輔導(dǎo)發(fā)現(xiàn)當(dāng)時(shí)已經(jīng)有一款大熱的批改類(lèi)的產(chǎn)品,到底還做不做?猿輔導(dǎo)內(nèi)部引發(fā)了討論。
“這是否是一個(gè)剛性需求?”
“我們有沒(méi)有能力做?”
“我們做還有沒(méi)有機(jī)會(huì)?”
王向東認(rèn)為答案是肯定的。他體會(huì)到了也看到了家長(zhǎng)們?cè)谝惶旃ぷ髦髾z查大量口算題的痛苦,也了解到猿輔導(dǎo)的技術(shù)實(shí)力,而且,當(dāng)時(shí)做類(lèi)似產(chǎn)品的企業(yè)不多,還有很大的市場(chǎng)空間。
猿輔導(dǎo)管理層分析了王向東的調(diào)研結(jié)果后,2017年年底,小猿口算正式立項(xiàng)了。
王向東通過(guò)長(zhǎng)期輔導(dǎo)女兒數(shù)學(xué)發(fā)現(xiàn),小朋友本身是愿意學(xué)習(xí)的,但是,就是非常抵觸大量的、不斷的練習(xí),這樣的學(xué)習(xí)方式非??菰餆o(wú)味。
于是,這款產(chǎn)品就聚焦在檢查作業(yè)和練習(xí)兩個(gè)功能上。主要訴求就是:“讓檢查不再繁瑣,讓學(xué)習(xí)不再枯燥,讓批改變得高效?!?/p>
1個(gè)多月后,小猿口算正式上線(xiàn)。
小猿口算的界面簡(jiǎn)單清爽,主要功能就是檢查和練習(xí),其中最為常用的功能就是檢查,這也被放在了第一屏。最初小猿口算只支持加減乘除、四則混合運(yùn)算等題型。當(dāng)前,已經(jīng)支持25種數(shù)學(xué)題型。
識(shí)別題目后,綠色對(duì)勾表示題目解答正確,紅框表示題目解答存在問(wèn)題。平常家長(zhǎng)可能檢查口算作業(yè)需要半小時(shí),用了小猿口算之后,10分鐘完成。這對(duì)家長(zhǎng)來(lái)說(shuō)是極大的便利。
隨后的三個(gè)月,小猿口算在沒(méi)有進(jìn)行任何付費(fèi)推廣的情況下,用戶(hù)數(shù)一直在穩(wěn)步上漲,這讓王向東更加堅(jiān)定了之前的判斷。
“小猿口算APP在老師、家長(zhǎng)群中大熱,不僅因?yàn)橛行У亟档土思议L(zhǎng)的輔導(dǎo)壓力,同時(shí)也將老師從枯燥又重復(fù)性的勞動(dòng)中解放出來(lái),更標(biāo)志著小學(xué)生的基礎(chǔ)數(shù)學(xué)學(xué)習(xí)方式正在因?yàn)锳I的加入發(fā)生根本轉(zhuǎn)變?!蓖跸驏|說(shuō)道。
未來(lái)有望成為全科批改作業(yè)“神器”?
王向東并沒(méi)有闡述小猿口算對(duì)于猿輔導(dǎo)意味著什么,他眼里只有產(chǎn)品,并稱(chēng)將繼續(xù)迭代檢查和練習(xí)的功能。
小猿口算會(huì)通過(guò)家長(zhǎng)的反饋來(lái)升級(jí)產(chǎn)品,在小猿口算界面中有“聯(lián)系我們”按鈕,用戶(hù)可以添加微信直接跟小猿口算的運(yùn)營(yíng)人員進(jìn)行交流與反饋,運(yùn)營(yíng)人員會(huì)定期把重要建議匯總起來(lái)提交給產(chǎn)品經(jīng)理。
“離你越近的地方,路途越遠(yuǎn)?!?/p>
“最簡(jiǎn)單的音調(diào),需要最艱苦的練習(xí)?!?/p>
王向東一直拿這兩句話(huà)自我鞭策。
針對(duì)練習(xí)功能,小猿口算原本有口算手寫(xiě)練習(xí),今年小猿口算還上線(xiàn)了聽(tīng)算練習(xí)等功能,均是自主研發(fā)的針對(duì)兒童手寫(xiě)、語(yǔ)音的識(shí)別技術(shù),目前APP內(nèi)每天手寫(xiě)練習(xí)超過(guò)2000萬(wàn)道。
未來(lái),“小猿口算將繼續(xù)在25種類(lèi)型上迭代、進(jìn)化,達(dá)到更好的結(jié)果。現(xiàn)在主要聚焦在數(shù)學(xué)品類(lèi)做優(yōu)化迭代,數(shù)學(xué)品類(lèi)是小學(xué)家長(zhǎng)輔導(dǎo)階段給大家?guī)?lái)最多困擾的科目。未來(lái),也不排除英語(yǔ)、語(yǔ)文,但首先要做好數(shù)學(xué)?!?/p>
有意思的是,小猿口算并沒(méi)有主動(dòng)在學(xué)校和培訓(xùn)機(jī)構(gòu)進(jìn)行推廣,卻收獲了大量的老師用戶(hù),目前APP內(nèi)注冊(cè)在校老師數(shù)超100萬(wàn)人,根據(jù)教育部最新數(shù)據(jù)統(tǒng)計(jì),全國(guó)注冊(cè)?學(xué)數(shù)學(xué)老師162萬(wàn)人,也就是說(shuō)每?jī)蓚€(gè)?學(xué)數(shù)學(xué)?師中至少有一個(gè)使用過(guò)?猿?算批改作業(yè),每天平均為每位使用的老師節(jié)省批改時(shí)間約90分鐘。
至此,小猿口算在校內(nèi)校外聯(lián)動(dòng)起來(lái),打通了家長(zhǎng)、學(xué)生、老師三個(gè)極。
此外,小猿口算聯(lián)合沈陽(yáng)出版社出版的《5分鐘口算題卡》,不對(duì)外出售,也不主動(dòng)宣傳,但會(huì)在全國(guó)包括四川涼山、云南彝族、甘肅甘南等扶貧助學(xué)地區(qū)贈(zèng)送。目前,已經(jīng)送出去340萬(wàn)本練習(xí)冊(cè),全部免費(fèi)。
在口碑相傳下,小猿口算坐擁3000萬(wàn)用戶(hù)。大量的學(xué)習(xí)行為數(shù)據(jù),增大了未來(lái)的想象空間。
然而,小猿口算在商業(yè)化探索上非常克制,王向東沒(méi)去想快速盈利,甚至沒(méi)去想小猿口算之于猿輔導(dǎo)意味著什么。
問(wèn)起小猿口算和猿輔導(dǎo)的協(xié)同關(guān)系,王向東回答:我們是猿輔導(dǎo)內(nèi)部孵化的,猿輔導(dǎo)給人給錢(qián)給資源。
或許,正是這樣純粹和毫無(wú)包袱才使得小猿口算將“準(zhǔn)確”作為核心, 在產(chǎn)品上不斷打磨,并且不到兩年獲得3000萬(wàn)用戶(hù)。(多知網(wǎng) 王上)