字節(jié)跳動旗下的智能AI助手豆包近期迎來了文生圖功能的全新升級,這一改進使得用戶能夠輕松實現(xiàn)一鍵生成附帶指定文本的圖片。在生成圖片的提示詞中,用戶只需簡單輸入如“一張帶有‘新年快樂’的圖片”,系統(tǒng)即可迅速響應,生成一張包含用戶指定文字的圖片。目前,這一功能已在豆包APP內(nèi)開啟測試,同時,即夢應用也在小范圍內(nèi)進行了測試。
文生圖技術中,精準地在圖像中生成文字一直是一個技術難點,尤其是針對中文文字,亂碼現(xiàn)象時有發(fā)生。相較于英文字母,漢字的結構更為復雜,且字符數(shù)量遠超前者兩個數(shù)量級。豆包大模型團隊的相關負責人透露,豆包的文生圖模型通過整合LLM和DIT架構,顯著提升了其原生中文數(shù)據(jù)的學習能力。在此基礎上,團隊還進一步強化了漢字的生成能力,從而大幅提高了生成效果。
隨著這一功能的推出,眾多用戶開始嘗試利用它制作表情包、梗圖漫畫,甚至輔助生成海報,并在社交媒體上分享自己的創(chuàng)作。不過,目前該功能僅支持在生成圖片時添加文字,暫不支持從已有圖片中提取或生成文字。
在社交媒體上,已有即夢內(nèi)測用戶發(fā)布了使用這一功能生成的圖片,引發(fā)了廣泛關注和討論。
豆包的負責人表示,盡管該功能剛剛推出,還在不斷完善和優(yōu)化中,但在絕大多數(shù)情況下,豆包已經(jīng)能夠準確生成用戶指定的文字。然而,仍有個別情況會出現(xiàn)錯字、漏字或小字亂碼等問題。他強調(diào):“無論是文字、圖片還是音樂生成功能,豆包始終致力于降低創(chuàng)作門檻,幫助用戶更好地表達和創(chuàng)造。”
豆包網(wǎng)頁版及電腦版也將在不久的將來上線這一功能,為用戶提供更多樣化的創(chuàng)作平臺。