您當(dāng)前的位置是:  首頁(yè) > 技術(shù) > 技術(shù)動(dòng)態(tài) >
 首頁(yè) > 技術(shù) > 技術(shù)動(dòng)態(tài) > 英偉達(dá)推出VideoLDM模型 配有41億個(gè)參數(shù)

英偉達(dá)推出VideoLDM模型 配有41億個(gè)參數(shù)

2023-04-20 15:59:30   作者:   來(lái)源:IT之家   評(píng)論:0  點(diǎn)擊:


  4 月 20 日消息報(bào)道,英偉達(dá)和康奈爾大學(xué)的研究團(tuán)隊(duì)合作,近日推出了名為 VideoLDM 模型,可以根據(jù)文本描述,自動(dòng)生成最高分辨率 2048*1280、24 幀、最長(zhǎng) 4.7 秒的視頻。

  英偉達(dá)表示該模型配有 41 億個(gè)參數(shù),其中 27 億個(gè)經(jīng)過(guò)視頻訓(xùn)練,這符合現(xiàn)代生成式 AI 的標(biāo)準(zhǔn)。從博文中獲悉,英偉達(dá)表示通過(guò)高效的潛在擴(kuò)散模型(LDM),能夠創(chuàng)建多樣化、高質(zhì)量、高清晰度的視頻。

  該模型還能創(chuàng)建駕駛場(chǎng)景的視頻,視頻分辨率為 1024 × 512 像素,最長(zhǎng) 5 分鐘。英偉達(dá)表示目前該項(xiàng)目處于研究階段,暫時(shí)不會(huì)向公眾開(kāi)放。

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

相關(guān)閱讀:

專題

CTI論壇會(huì)員企業(yè)