英偉達(dá)推出VideoLDM模型配有41億個(gè)參數(shù)

2023-04-20 15:59:30 作者：來(lái)源：IT之家評(píng)論：0 　點(diǎn)擊：

　　4 月 20 日消息報(bào)道，英偉達(dá)和康奈爾大學(xué)的研究團(tuán)隊(duì)合作，近日推出了名為 VideoLDM 模型，可以根據(jù)文本描述，自動(dòng)生成最高分辨率 2048*1280、24 幀、最長(zhǎng) 4.7 秒的視頻。

　　英偉達(dá)表示該模型配有 41 億個(gè)參數(shù)，其中 27 億個(gè)經(jīng)過(guò)視頻訓(xùn)練，這符合現(xiàn)代生成式 AI 的標(biāo)準(zhǔn)。從博文中獲悉，英偉達(dá)表示通過(guò)高效的潛在擴(kuò)散模型（LDM），能夠創(chuàng)建多樣化、高質(zhì)量、高清晰度的視頻。

　　該模型還能創(chuàng)建駕駛場(chǎng)景的視頻，視頻分辨率為 1024 × 512 像素，最長(zhǎng) 5 分鐘。英偉達(dá)表示目前該項(xiàng)目處于研究階段，暫時(shí)不會(huì)向公眾開(kāi)放。

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn)，與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立，不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考，并請(qǐng)自行承擔(dān)全部責(zé)任。

下一篇:最后一頁(yè)

相關(guān)閱讀：