我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
通義千問(wèn)發(fā)布了首個(gè)開(kāi)源圖像生成基礎(chǔ)模型Qwen-Image,Qwen-Image是一個(gè)200億參數(shù)的MMDiT模型,是通義千問(wèn)系列中首個(gè)圖像生成基礎(chǔ)模型。
該模型在文本渲染方面表現(xiàn)卓越,支持中英文多行段落級(jí)高保真文本渲染,對(duì)復(fù)雜場(chǎng)景和細(xì)粒度細(xì)節(jié)處理能力強(qiáng)。Qwen-Image具備一致性的圖像編輯能力,通過(guò)增強(qiáng)的多任務(wù)訓(xùn)練范式,在編輯過(guò)程中能保持內(nèi)容的一致性。
在GenEval、DPG、OneIG-Bench、GEdit、ImgEdit、GSO等多個(gè)公開(kāi)基準(zhǔn)測(cè)試中,Qwen-Image均取得了最先進(jìn)(SOTA)的性能。特別是在LongText-Bench、ChineseWord和TextCraft等文本渲染基準(zhǔn)上,Qwen-Image表現(xiàn)突出,尤其是在中文文本渲染方面大幅領(lǐng)先現(xiàn)有模型。Qwen-Image能夠準(zhǔn)確渲染海報(bào)、PPT頁(yè)面等多種包含復(fù)雜文本和圖像組合的場(chǎng)景。
通義千問(wèn)推出系列中首個(gè)圖像生成基礎(chǔ)模型Qwen-Image 09:17:20
無(wú)人機(jī)用上“空中高德”高密度飛行也不怕撞 09:35:06
健康新見(jiàn)解:80 年前真菌復(fù)活對(duì)比,推動(dòng)跨學(xué)科解決全球食品危機(jī) 09:29:09
DeepSeek下一代技術(shù)提前曝光,梁文鋒署名論文獲ACL2025最佳論文 09:26:37
商業(yè)利益超越宏大使命,個(gè)人訴求主宰太空雄心,NASA如何跌落“神壇” 09:24:02
星辰聚智·才啟未來(lái):2025世界人工智能大會(huì)中國(guó)電信發(fā)布系列前沿能力及AI產(chǎn)品 09:21:15