該技術突破將在AI學習機的中英文作文輔導、中英文口語學習等方面帶來顯著提升。
多知網2月9日消息,近日,隨著ChatGPT在全球范圍內的迅速走紅,有投資者在投資者互動平臺向科大訊飛(002230.SZ)提問:語言模型的落地搶灘在全球范圍內已經是白熱化狀態(tài),隨著ChatGpt火出圈,谷歌馬上推出自已的Bard,百度三月要出文心一言??拼笥嶏w要怎么辦?公司在中文對話系統(tǒng)上是怎樣考慮的?將技術置入公司的教育學習和醫(yī)療服務產品中是否已啟動了?
對此,科大訊飛回應道,ChatGPT主要涉及到自然語言處理相關技術,屬于認知智能領域的應用之一,科大訊飛在該方向技術和應用具備長期深厚的積累: 科大訊飛主導承建了認知智能全國重點實驗室(科技部首批20家標桿全國重點實驗室之一),多年來始終保持關鍵核心技術處于世界前沿水平(例如,科大訊飛于2022年就獲得CommonsenseQA 2.0、OpenBookQA等12項認知智能領域權威評測的第一),同時已面向認知智能領域陸續(xù)開源了6大類、超過40個通用領域的系列中文預訓練語言模型,成為業(yè)界最廣泛流行的中文預訓練模型系列之一(在Github平臺的中文預訓練模型的星標數達13346位列第一,是第二名的2倍)。
公司已經在當前核心技術、產業(yè)場景、行業(yè)數據等深厚積累的基礎上,于2022年12月份進一步啟動生成式預訓練大模型任務攻關,科大訊飛AI學習機將成為該項技術率先落地的產品,將于2023年5月6日進行產品級發(fā)布,該技術突破將在AI學習機的中英文作文輔導、中英文口語學習等方面帶來顯著提升。
同時,科大訊飛還表示,2023年會持續(xù)升級該系列技術,并陸續(xù)應用于公司在教育、醫(yī)療、汽車、消費者等多個行業(yè)賽道的既有產品,持續(xù)提升核心技術效果和產品體驗。
這是科大訊飛就類ChatGPT技術相關布局的再次回應。在此前1月31日披露的投資者關系活動記錄表中,針對“訊飛在自然語言理解等認知智能技術中取得了非常好的效果。目前來看,海外已經產生了ChatGPT等一些爆款應用,請問公司是否已經有所布局?”這一問題,科大訊飛便已表示:
2018年起,預訓練模型范式就逐步開始在自然語言處理領域應用,包括谷歌、微軟、OpenAI、科大訊飛、智源、鵬城等單位陸續(xù)推出預訓練模型。科大訊飛在預訓練模型方面,有堅實的相關技術積累,成為業(yè)界最廣泛流行的中文預訓練模型之一。
2017年,科技部正式批復依托科大訊飛建設認知智能國家重點實驗室,這也是我國在人工智能高級階段——認知智能領域的首個國家級重點實驗室。2022年在國家重點實驗室重組后的首批20個國家標桿實驗室中,訊飛是唯一一家承建認知智能全國重點實驗室。同時,訊飛面向認知智能領域陸續(xù)開源了6大類、超過40個通用領域的系列中文預訓練語言模型,開源3年模型庫月均調用量超1000萬,成為業(yè)界最廣泛流行的中文預訓練模型之一,在Github平臺的中文預訓練模型的星標數達13346位列第一。2022年,訊飛進一步發(fā)布了面向多模態(tài)領域的兩個輕量級預訓練模型,實現多尺度層級預訓練、有監(jiān)督強化聚類表征、多預訓練任務聯(lián)合優(yōu)化框架等創(chuàng)新點,在參數量遠小于業(yè)界公開模型(參數量小20倍以上)的情況下識別效果提升了20~30%,效果上實現了業(yè)界領先,同時也獲得全球多模態(tài)閱讀理解評測冠軍等優(yōu)異成績。
科大訊飛同時表示,其有信心在預訓練認知智能大模型上代表中國實現突破。首先,科大訊飛承建了中國唯一的認知智能國家重點實驗室,具備算法實現和持續(xù)創(chuàng)新的能力,已經在眾多國際比賽中奪得冠軍;其次,公司的訓練服務器、推理服務器在國產自主平臺運行至關重要;第三,預訓練模型在專業(yè)領域,諸如在教育領域,醫(yī)療領域,如果能夠和行業(yè)場景深度結合,潛在商業(yè)價值的機會空間巨大。