首页 > 科技创作 > 科技创作 > 快手发布大模型产品“可图”,使用扩散模型以提升画质

快手发布大模型产品“可图”,使用扩散模型以提升画质

发布时间:2024-06-01 17:12:54 来源: 152102

5月31日消息,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。值得注意的是,可图只需一张图片和几秒钟时间,便可生成一套AI图像。

在2024年一季度财报电话会上,快手首席执行官程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。

从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可保留人像的自然特征,一键生成各种风格的人像作品。目前,可图已上线10余种AI形象定制风格玩法。另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、创意十足的绘画作品。用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。

可图文生图作品。图|受访者供图

快手大模型团队的技术能力为产品提供了支撑。据官方介绍,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,引入了经过优质专家标注的图文数据集,以提升模型性能表现。

去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。

科技创作更多>>

同样15万,马自达CX-50和比亚迪宋Pro怎么选?答案很直接 全新博越十周年冠军版上市, 打造10万内预算家用SUV首选 问界M9被极氪9X搅局,谁能做国产豪车中的“苹果”? 领汇x车胜惠迪合作签约暨领汇汽车集中交付仪式圆满落幕 DeepSeek被曝融资500亿 30万选X9还是梦想家?有娃家庭必看真体验 红旗天工08单电机高功率版现身工信部 动力升级引关注 特斯拉旗舰车型今日停产,弗里蒙特工厂开启Optimus量产时代 新款传祺M6 MAX现身,前脸变化大,换装电子怀挡+悬浮式大屏 硬实力拉满!东风奕派M8入局大六座新能源SUV市场 全系900V配Momenta智驾,预售28.98万起的奥迪E7X怎么选? 尊界S800 Grand Design高定版申报图曝光 金色专属饰条彰显尊贵 利润暴跌超90%!保时捷卖了布加迪 非官方渠道购车风险频发,极氪发布安全声明捍卫用户权益 兰博基尼发布:Fenomeno敞篷版,V12引擎+三电机 空间与智能的较量:四款20万级纯电SUV谁更懂你? 八排气?阿斯顿·马丁Vanquish S谍照曝光,超850马力V12发动机 15万买华为全套智驾+全尺寸大六座SUV,高质价比看华境S就够了 告别双联屏,理想L9 Livis内饰公布,能否再成爆款? 满大街都是新能源SUV,路虎卫士这种燃油硬派越野还值得入手吗? 日产NX8:在合资新能源困局中能否寻到突围之路 充电桩反超加油站,新能源渗透率60.6%,日系合资销量跌回十年前 二代刀片电池上市后,磷酸铁锂和三元锂电池胜负已分! 斯柯达畅销七人座SUVKodiaq特别登场!大棕熊配备升级 DeepSeek正式跨入图文交互时代 同价位该买奥迪还是买小米 百度正式发布文心大模型5.1 华境S让华为全家桶进入15万时代 微信重大更新 电脑版有多个新功能 7.5升/669马力,当经典奔驰C126成为V12“猛兽”,会发生什么?