近日,腾讯宣布,混元大模型迎来全新升级,并正式对外开放“文生图”功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。

腾讯混元

文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。

腾讯最早在广告场景进行AI自动生成图像的探索,在此过程中积累了深厚的研发能力。据介绍,相比其他大模型,腾讯混元的文生图应用,在人像真实感、场景真实感上有比较明显的优势,同时,在中国风景、动漫游戏等场景等生成上有较好的表现。

在业界公认难度较高的人脸画像生成上,腾讯混元也交出了令人满意的作品。比如,输入提示词“生成可爱的亚洲 4 岁女孩穿着棉质连衣裙,大眼睛,古代中国,摄影风格,汉服”,腾讯混元大模型生成如下:

腾讯混元

可以看到,腾讯混元大模型可以很好地理解提示词中提到的“棉质连衣裙”“汉服”等内容,同时在风格上,也通过建筑和风景等衬托,很好的展示了“古代中国”的风格要求。

作为实用级的通用大模型,腾讯混元大模型的应用场景丰富多样。目前,超过180个腾讯内部业务已接入腾讯混元,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。最近,QQ浏览器还基于腾讯混元推出了“PDF阅读助手”,具备智能摘要、智能问答和多轮提问等功能。

免责声明:素材源于网络,如有侵权,请联系删稿。