“升級后的騰訊混元中文效果整體超過GPT3.5”。

騰訊混元大模型接入180個內(nèi)部業(yè)務,正式開放“文生圖”功能

2023-10-27 17:25:00發(fā)布     來源:多知網(wǎng)    作者:Penny  

  多知網(wǎng)10月27日消息,騰訊混元大模型10月26日全新升級,正式對外開放“文生圖”功能。騰訊表示,升級后的騰訊混元中文效果整體超過GPT3.5,代碼能力大幅提升20%。

  相比其他大模型,騰訊混元的文生圖應用著力于人像真實感、場景真實感,同時,在中國風景、動漫游戲等場景等生成上有優(yōu)勢。

  騰訊數(shù)據(jù)顯示,騰訊混元文生圖能力,目前已經(jīng)被用于素材創(chuàng)作,商品合成,游戲出圖等多項業(yè)務中,此外在廣告業(yè)務下的多輪測評中,騰訊混元文生圖的案例優(yōu)秀率和廣告主采納率分別達到86%和26%。

  過去一個月,騰訊混元大模型不僅各項能力均有升級,代碼、數(shù)學能力也大幅提升。

  經(jīng)過對32種主流語言代碼文件、各類計算機書籍和博客的學習增訓,騰訊混元代碼處理水平提升超過20%,代碼處理效果勝出ChatGPT 6.34%,在HumanEval公開測試集指標上全面超過Starcoder、Codellama等業(yè)界頭部開源代碼大模型。

  只需輸入簡單的指令如“幫我用前端語言實現(xiàn)一個貪吃蛇”,騰訊混元便能自動生成可運行的代碼,快速制作出一個貪吃蛇小游戲。此外,騰訊混元還支持Python、C++、Java、Javascript等多種語言的指令生成,比如輸入“用Python畫紅色的心形線”,騰訊混元會提供代碼庫選擇、安裝命令、繪制代碼等具體操作步驟的指引。

  騰訊內(nèi)部目前已經(jīng)有多個開發(fā)平臺接入了騰訊混元大模型,工程師們可以使用騰訊混元來進行代碼生成、代碼補全、代碼漏洞檢測和修復、表格數(shù)據(jù)處理、數(shù)據(jù)庫查詢等工作。

  比如,在IDE編程場景中,騰訊工蜂Copilot通過接入混元大模型,可根據(jù)注釋生成對應代碼,或基于上下文智能補全代碼,提高了編程效率?;煸竽P瓦€可以幫助用戶進行代碼漏洞檢測和修復,保障軟件開發(fā)過程中的安全性。

  目前,超過180個騰訊內(nèi)部業(yè)務已接入騰訊混元,包括騰訊會議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。服務公司外部零售、教育、金融、醫(yī)療、傳媒、交通、政務等多個行業(yè)客戶。

  據(jù)騰訊介紹,大模型文生圖的難點體現(xiàn)在對提示詞的語義理解,生成內(nèi)容的合理性以及生成圖片的效果,針對這三個技術難點,騰訊進行了專項的技術研究,提出了一系列原創(chuàng)算法,來保證生成圖片的可用性和畫質(zhì)。

  1、在語義理解方面,騰訊混元采用了中英文雙語細粒度的模型,模型同時建模中英文實現(xiàn)雙語理解,而不是通過翻譯,通過優(yōu)化算法提升了模型對細節(jié)的感知能力與生成效果,有效避免多文化差異下的理解錯誤。

  2、在內(nèi)容合理性方面,AI生成人體結構和手部經(jīng)常容易變形。混元文生圖通過增強算法模型的圖像二維空間位置感知能力,并講人體骨架和人手結構等先驗信息引入到生成過程中,讓生成的圖像結構更合理,減少錯誤率。

  3、在畫面質(zhì)感方面,混元文生圖基于多模型融合的方法,提升生成質(zhì)感。經(jīng)過模型算法的優(yōu)化之后,混元文生圖的人像模型,包含發(fā)絲、皺紋等細節(jié)的效果提升了30%,場景模型,包含草木、波紋等細節(jié)的效果提升了25%。

  在圖像生成上,騰訊還給出了prompt,比如你想生成一張更接近真人感的照片,或接近實拍的圖片。請使用“生成一張XX的圖片”或者“生成一張XX的照片”,并加上“真實感”或“攝影風”等描述效果會更好。

  如果想要特定風格的圖片,建議在提示詞中加入該風格的描述,如油畫風、賽博朋克風、水墨畫風格、像素風、日漫動畫風、兒童畫等,或者使用靈感發(fā)現(xiàn)中的特定風格,這樣會更接近需求。

  如果想要的畫面進行盡可能詳細的描述,并建議多次調(diào)整你的提示詞,比如“生成一副照片:亞洲女子,魅力,長發(fā),戴墨鏡,站在長城上,背景有紅葉”、“畫一幅亞洲女生的畫,黑色與綠色相間的中短發(fā),卡通人像,迪士尼風,民俗肖像,寧靜臉孔”。

  騰訊混元生成圖片的部分案例:

  1)真實感人像

  生成可愛的亞洲 4 歲女孩穿著棉質(zhì)連衣裙,大眼睛,古代中國,攝影風格,漢服

  1.png

  2)平面場景

  畫一幅畫:小企鵝在樹下行走,突然一個蘋果從樹上掉下

2.png

  03)3D氛圍感場景

  生成一張賽博朋克風格的圖片:一只立體的貓穿著賽博朋克風的衣服,周圍是燈紅酒綠的城市場景,潮濕的地面上反映了城市的倒影

3.png

  04)古詩詞

  幫我生成一張圖片:空山新雨后,天氣晚來秋,水墨風格

4.png