“AI 是人類能力的擴(kuò)增,也會讓知乎社區(qū)變得更加精彩?!?/p>
多知網(wǎng)4月14日消息,在“2023知乎發(fā)現(xiàn)大會”(以下簡稱發(fā)現(xiàn)大會)上,知乎創(chuàng)始人、董事長兼CEO周源和知乎合伙人、CTO李大海在大會上共同宣布了知乎在AI大模型上的最新合作與應(yīng)用,正式發(fā)布“知海圖AI”中文大模型。
據(jù)介紹,知乎通過聯(lián)合研發(fā)與戰(zhàn)略投資的方式與國內(nèi)頂尖大模型團(tuán)隊面壁智能達(dá)成深度合作,共同開發(fā)中文大模型產(chǎn)品并推進(jìn)應(yīng)用落地。周源表示:“知乎以應(yīng)用層和數(shù)據(jù)層的獨特優(yōu)勢,將致力為中文互聯(lián)網(wǎng)的大語言模型添磚加瓦,成為新生產(chǎn)力的開發(fā)者,為中國在 AI 時代貢獻(xiàn)力量”。
目前,知乎和面壁智能合作開發(fā)的“知海圖AI”中文大模型,已經(jīng)運(yùn)用進(jìn)了知乎熱榜,知乎首個大模型功能“熱榜摘要”上線并開啟內(nèi)測,利用語言理解能力對知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶。
在隨后的群訪環(huán)節(jié),周源向媒體解釋了知乎利用大模型首先推出“熱榜摘要”這一功能背后的思考:“所有的公司都應(yīng)該首先想自己給用戶提供的價值是什么,能做的東西應(yīng)該在這個基礎(chǔ)上跟社會有一個交集。知乎本身是一個場景,經(jīng)過多輪產(chǎn)品升級、用戶使用,我們可以理解它是在不斷地通過用戶使用得到驗證的場景,場景其實是代表用戶的需求,它最核心的其實是討論,大家通過討論交換信息、分享自己的知識經(jīng)驗見解,這是我們一直以來所做的事。討論最后會形成一些大家比較熟悉的功能,ChatGPT就是,由討論產(chǎn)生,最后又聚集在某個地方,有更多用戶查看它,我們在這個基礎(chǔ)上也看到,當(dāng)然AI確實可以在這個場景(熱榜摘要)、這個功能里提升用戶的體驗。
其實10年前,知乎其實有一個產(chǎn)品功能叫‘回答總結(jié)’,開放給所有用戶,大家進(jìn)行編輯,把大家所有的回答做總結(jié),后來發(fā)現(xiàn)這個事情太困難了,回答數(shù)量多了以后成本非常高,而且效果并不好。我們非常好地看到了,現(xiàn)在可以通過技術(shù)的方式,幫人完成這件事情,你要加入一個討論,逮著離得最近的一個人,大概可以告訴你這個討論是關(guān)于什么的,你迅速知道一個梗概,再閱讀里面有價值的內(nèi)容。”
面壁智能聯(lián)合創(chuàng)始人、CTO 曾國洋在大會演講中表示,“經(jīng)過測試,在知乎熱榜的應(yīng)用場景下,知乎與面壁合作自研的大模型與GPT-4相比達(dá)到了持平的效果”。未來,知乎還將拓展更多AI大模型的應(yīng)用場景,為創(chuàng)作者賦能。
李大海在大會上介紹,經(jīng)過評估,面壁智能最新的CPM-Bee模型是視野范圍內(nèi)表現(xiàn)最好的中文大語言模型,其創(chuàng)始團(tuán)隊成員全部來自清華大學(xué)計算機(jī)自然語言處理與社會人文計算實驗室(清華大學(xué)NLP實驗室),在這個領(lǐng)域有很深的積累。“知乎與面壁智能在交流中發(fā)現(xiàn)彼此的產(chǎn)品觀和價值觀都很匹配,我們對面壁進(jìn)行了投資,并且展開了深入的模型共建過程”,李大海表示。
2023年,隨著ChatGPT出圈,AI 2.0成為大眾關(guān)注的重點,AI輔助加盟內(nèi)容平臺成為普遍趨勢。來自于清華大學(xué)NLP實驗室的面壁智能團(tuán)隊與知乎有著很深的淵源,曾國洋是知乎機(jī)器學(xué)習(xí)領(lǐng)域的優(yōu)秀答主,與知乎在 2018 年就曾有過學(xué)術(shù)上的合作。
曾國洋表示,知乎擁有非常專業(yè)的技術(shù)團(tuán)隊,對新技術(shù)非常敏銳,也是國內(nèi)最早看到大模型技術(shù)的重要性的公司之一。知乎和面壁智能的合作首先集中在更強(qiáng)的中文大模型上,在 CPM-Bee基礎(chǔ)上,新的模型有了更強(qiáng)的邏輯推理能力和更快的訓(xùn)練和推理速度,并逐步應(yīng)用在知乎更多應(yīng)用場景中。
早在2020年底面壁智能團(tuán)隊就發(fā)布了首個中文大語言模型 CPM-1,之后又陸續(xù)發(fā)布了 CPM-2、CPM-3 和 CPM-Ant 等模型。而知乎早在五年前就提出了智能社區(qū)的概念,把 AI 技術(shù)應(yīng)用在了社區(qū)的內(nèi)容生產(chǎn)、流通、治理和消費等環(huán)節(jié)。這些經(jīng)由真實“討論場”檢驗過的技術(shù)與模型,是構(gòu)建AI應(yīng)用場景和專用數(shù)據(jù)的信息流來源。
知乎擁有中文互聯(lián)網(wǎng)大量高質(zhì)量內(nèi)容,這正是其研發(fā)大語言模型的優(yōu)勢所在。在周源看來,在目前的 AI 研究中,AI 的生產(chǎn)力要素可以分為三層,從上到下依次是應(yīng)用場景、專有數(shù)據(jù)、基礎(chǔ)模型。知乎基于問答的“討論場”是與此契合的天然應(yīng)用場景;而不斷增長的內(nèi)容、關(guān)系和知識圖譜則是獨一無二的專有數(shù)據(jù);以GPT為代表的基礎(chǔ)模型層在快速發(fā)展,性能表現(xiàn)越來越好,成本快速下降。
未來,“知海圖AI”的能力將逐步應(yīng)用在對創(chuàng)作的賦能、對討論場的賦能和對信息獲取的賦能。“AI 是人類能力的擴(kuò)增,也會讓知乎社區(qū)變得更加精彩”,周源表示。
除了首個大模型功能“熱榜摘要”外,李大海還提及基于大語言模型的AI 2.0新技術(shù)對知乎社區(qū)用戶的三個賦能:第一個是生產(chǎn)力的提升,對創(chuàng)作者的賦能,通過給創(chuàng)作者提供各種智能工具,希望提升他們的創(chuàng)作質(zhì)量和創(chuàng)作效率,從而提高生產(chǎn)力;第二個是場景的優(yōu)化,對討論場的賦能,包括摘要功能、首答功能等,希望整體提升討論場的討論氛圍和討論質(zhì)量;第三個是工具的升級,對信息獲取的賦能,針對刷知乎和搜知乎的用戶,計劃利用大模型把知乎的搜索跟推薦兩個產(chǎn)品變得更聰明,從而讓用戶在使用搜索推薦的時候能夠更快、更準(zhǔn)地找到想要的內(nèi)容。”(多知網(wǎng) 哆啦)