新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)5月16日,騰訊發(fā)布最新混元圖像2.0模型(Hunyuan Image2.0),基于模型架構(gòu)創(chuàng)新,該商業(yè)化文生圖模型達(dá)到了毫秒級(jí)響應(yīng),在行業(yè)內(nèi)率先實(shí)現(xiàn)了實(shí)時(shí)生圖。模型于即日起在騰訊混元官方網(wǎng)站上線,并對(duì)外開(kāi)放注冊(cè)體驗(yàn)。
相比前代模型,騰訊混元圖像2.0模型參數(shù)量提升了一個(gè)數(shù)量級(jí),得益于超高壓縮倍率的圖像編解碼器以及全新擴(kuò)散架構(gòu),其生圖速度顯著加快,在同類(lèi)商業(yè)產(chǎn)品每張圖推理速度需要5到10秒的情況下,騰訊混元可實(shí)現(xiàn)毫秒級(jí)響應(yīng),支持用戶一邊打字一邊出圖,改變了傳統(tǒng)“抽卡—等待—抽卡”的方式,帶來(lái)了新的交互體驗(yàn)。
騰訊混元圖像2.0模型還發(fā)布了實(shí)時(shí)繪畫(huà)板功能,基于模型的實(shí)時(shí)生圖能力,用戶在繪制線稿或調(diào)整參數(shù)時(shí),預(yù)覽區(qū)同步生成上色效果,突破了傳統(tǒng)“繪制-等待-修改”的線性流程,可助力專(zhuān)業(yè)設(shè)計(jì)師的創(chuàng)作。
發(fā)布會(huì)上,騰訊混元也劇透了即將發(fā)布的原生多模態(tài)圖像生成大模型,新模型在多輪圖像生成、實(shí)時(shí)交互體驗(yàn)等方面有突出表現(xiàn)。
混元圖像2.0模型生圖效果
編輯 胡萌
校對(duì) 穆祥桐