AI新資訊。

AI動態(tài) | 視頻擴展模型、游戲AI引擎、多模態(tài)大模型、AI原生地圖

2024-03-22 09:44:40發(fā)布     來源:多知網    作者:Charles  

  *Meta發(fā)布SceneScript

  *騰訊發(fā)布自家研發(fā)的游戲AI引擎GiiNEX

  *快手自主研發(fā)大型模型“快意”在綜合性能方面超越了GPT-3.5

  *淘寶天貓集團推出了自家研發(fā)的大型模型“淘寶星辰”

  *谷歌多模態(tài)大模型Gemini 1.5 Pro推出API

  *香港中文大學、上海AI實驗室和商湯科技共同推出MOTIA的視頻擴展模型

  *百度地圖宣布其“AI向導”用戶規(guī)模累計破億

  *多模態(tài)大模型公司「若愚科技」完成超5000萬天使輪融資

  1、Meta發(fā)布SceneScript,利用自回歸結構化語言模型重建場景

  據了解,該方法采用場景語言編碼器-解碼器架構,能夠直接從編碼的視覺數據中推斷出一組結構化的語言命令。

  為了訓練SceneScript,作者生成并發(fā)布了一個大規(guī)模的合成數據集,名為Aria Synthetic Environments,其中包含10萬個高質量的室內場景。這些場景具有以自我中心場景漫游的真實感,并且地面有真實標注的渲染圖像。

  2、騰訊發(fā)布自家研發(fā)的游戲AI引擎GiiNEX

  2024年的全球游戲開發(fā)者大會上,騰訊發(fā)布了自家研發(fā)的游戲AI引擎GiiNEX,該引擎利用大型模型和生成式AI技術,針對AINPC、場景制作、內容生成等方面提供了多樣化的AIGC能力,包括2D圖像、3D城市和劇情等。這一引擎有助于開發(fā)者提高高質量內容生成的效率。此外,GiiNEX還將決策AI技術應用于游戲研發(fā)測試和模擬玩法等方面。

  3、快手自主研發(fā)大型模型“快意”在綜合性能方面超越了GPT-3.5

  快手自主研發(fā)的大型模型“快意”在綜合性能方面已顯著超越了GPT-3.5,公司有信心在未來半年內達到GPT-4的水平。快手計劃將生成模型與生產者工具相結合,幫助創(chuàng)作者降低創(chuàng)作門檻,提高短視頻制作的質量和效率。

  4、淘寶天貓集團推出了自家研發(fā)的大型模型“淘寶星辰”

  淘寶天貓集團推出了自家研發(fā)的大型模型“淘寶星辰”,該模型已經在官網上線,成為該集團首個公開的自研大型模型。

  星辰大模型基于Transformer架構,使用半自研的Megatron-ama框架進行訓練,通過學習海量電商消費數據和公開數據,提供增強電商和生活服務場景的文案生成、多輪會話、知識問答和智能決策等功能。

  淘寶星辰大模型是以電商和生活服務為主要適用場景。提供商品文案編寫、商品商家運營、商品數據分析、市場營銷策略等經營場景下的智能服務。

  5、谷歌多模態(tài)大模型Gemini 1.5 Pro推出API

  谷歌向開發(fā)人員提供Gemini 1.5 Pro的API支持,鼓勵開發(fā)人員利用這一強大工具構建產品。Gemini 1.5 Pro模型具有出色的多模態(tài)處理能力,開創(chuàng)新可能性。此舉引發(fā)了蘋果內部考慮將Gemini引入iPhone軟件的討論,可能引發(fā)AI領域的變革。

  6、香港中文大學、上海AI實驗室和商湯科技共同推出MOTIA的視頻擴展模型

  據了解,該視頻擴展模型利用源視頻的固有數據特定模式和圖像/視頻生成,有效實現視頻擴展。MOTIA的主要階段包括輸入特定調整和模式感知擴展。提出了額外的策略,包括空間感知插入和噪聲傳播,以更好地利用擴散模型的生成先驗和從源視頻中獲取的視頻模式。

  7、百度地圖宣布AI原生地圖“AI向導”用戶規(guī)模累計破億

  全球首個AI原生地圖——百度地圖宣布其“AI向導”用戶規(guī)模累計破億,日均提供超千萬次對話。這是自2023年10月17日百度世界大會首發(fā)“AI向導”以來,百度地圖第一次披露該業(yè)務相關數據。

  百度地圖“AI向導”成為繼文心一言之后,國內又一個宣布用戶破億的大模型產品。

  8、多模態(tài)大模型公司「若愚科技」完成超5000萬天使輪融資

  本輪融資由東方精工領投,昆仲資本跟投,源合資本擔任獨家融資顧問。公司稱,資金將主要用于產品研發(fā),業(yè)務拓展以及團隊搭建等方面。

  公開資料顯示,若愚科技是一支源自哈工大的團隊,創(chuàng)立于2023年,旨在通過多模態(tài)大模型技術打造機器人大腦。在基座模型方面,目前若愚打造了自研的多模態(tài)大模型——若愚·九天,據介紹,九天大模型可以支持文本、圖片、 音頻、視頻多模態(tài)輸入和輸出 。目前,若愚·九天多模態(tài)大模型已經在垂直領域進行了細分應用,也針對機器人應用場景進行了專門的訓練。