吉利汽車集團(tuán)與其科技生態(tài)戰(zhàn)略合作伙伴階躍星辰近日共同宣布了一項(xiàng)重大舉措:將雙方攜手研發(fā)的階躍Step系列多模態(tài)大模型向全球開(kāi)發(fā)者全面開(kāi)源。此次開(kāi)源的兩大模型,不僅在技術(shù)上實(shí)現(xiàn)了突破,更標(biāo)志著中國(guó)在AI大模型領(lǐng)域向全球開(kāi)源社區(qū)貢獻(xiàn)的重要力量。
其中,階躍Step-Video-T2V作為目前全球參數(shù)量最大、性能最優(yōu)的開(kāi)源視頻生成模型,其參數(shù)量高達(dá)300億。該模型能夠直接生成204幀、分辨率為540P的高質(zhì)量視頻,這一技術(shù)成就無(wú)疑為視頻生成領(lǐng)域樹立了新的標(biāo)桿。據(jù)階躍星辰透露,經(jīng)過(guò)嚴(yán)格的測(cè)評(píng),Step-Video-T2V在各項(xiàng)性能指標(biāo)上均表現(xiàn)出色,充分證明了其在開(kāi)源視頻生成大模型中的領(lǐng)先地位。
另一款開(kāi)源模型階躍Step-Audio,則是行業(yè)內(nèi)首個(gè)達(dá)到產(chǎn)品級(jí)標(biāo)準(zhǔn)的開(kāi)源語(yǔ)音交互大模型。它能夠根據(jù)場(chǎng)景需求靈活調(diào)整情緒、方言、語(yǔ)種、歌聲以及個(gè)性化風(fēng)格,實(shí)現(xiàn)與用戶的高質(zhì)量自然對(duì)話。Step-Audio生成的語(yǔ)音不僅具有超自然的音質(zhì),還展現(xiàn)出高情商的對(duì)話能力,同時(shí)支持高質(zhì)量的音色復(fù)刻。用戶現(xiàn)在即可通過(guò)階躍星辰推出的躍問(wèn)App體驗(yàn)這一創(chuàng)新功能。
在階躍Step系列大模型的研發(fā)過(guò)程中,吉利汽車集團(tuán)與階躍星辰展開(kāi)了深入的合作。雙方在算力算法、場(chǎng)景訓(xùn)練等領(lǐng)域?qū)崿F(xiàn)了優(yōu)勢(shì)互補(bǔ),共同推動(dòng)了多模態(tài)大模型性能的大幅提升。階躍星辰表示,此次開(kāi)源的初衷是希望與全球開(kāi)發(fā)者共享最新的多模態(tài)大模型技術(shù)成果,共同推動(dòng)AI技術(shù)的發(fā)展。
階躍星辰,這家成立于2023年的人工智能大模型公司,總部位于中國(guó)上海。由前微軟全球副總裁姜大昕創(chuàng)辦,階躍星辰自成立以來(lái)便專注于AI大模型的研發(fā)和應(yīng)用。在2024年3月,階躍星辰成功發(fā)布了Step系列大模型,并在此基礎(chǔ)上推出了兩款A(yù)I應(yīng)用產(chǎn)品:躍問(wèn)和冒泡鴨。這些產(chǎn)品的推出,不僅豐富了階躍星辰的產(chǎn)品線,也進(jìn)一步展示了其在AI技術(shù)領(lǐng)域的創(chuàng)新實(shí)力。
Copyright 2025 //m.ahlmtdl.com/ 版權(quán)所有 豫ICP備2021037741號(hào)-1 網(wǎng)站地圖