字节豆包通用图像编辑模型 SeedEdit 开启测试,引领图像编辑新潮流

发布时间:2024-11-12 来源:时事 作者:通悟AI

一、引言

2024 年 11 月 11 日,字节在豆包大模型团队官网上公布了最新通用图像编辑模型 SeedEdit,这一消息犹如一颗重磅炸弹,在图像编辑领域引起了巨大的轰动。SeedEdit 的出现,为用户带来了全新的图像编辑体验,让用户可以通过一句话轻松改图。


二、SeedEdit 的强大功能

SeedEdit 支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作。用户只需通过简单的自然语言即可驱动模型编辑任意图像。例如,用户在生成一张“小狗在草地奔跑”的图片后,可以直接输入“背景换成海边”等指令,获得一张基于原图片的微调图。

目前,该模型已经在豆包 PC 端及即梦网页端开启测试。用户可以在豆包生成图片后,点击继续编辑按钮,输入简单的文本指令对图片背景或主体进行轻松调整,实现一句话改图。此外,用户也可以尝试在豆包 PC 或即梦的图像生成功能中自行上传参考图并进行二次加工。


三、SeedEdit 的技术优势

SeedEdit 是国内首个实现产品化的通用图像编辑模型。在模型数据生产中,SeedEdit 针对数据稀缺问题,重新设计模型架构,并且采用多模型、多尺度和多标准的数据制造方案,很大程度上解决了数据量、数据多样性和数据质量的问题。

作为一款专为图像编辑任务设计的模型,SeedEdit 在通用性、可控性、高质量等方面取得了一定突破。此前业界技术主要针对单个专家任务进行优化,而 SeedEdit 作为通用的图像编辑模型,适用各类编辑任务,支持用户脑洞大开的奇思妙想,无需再训练微调即可快捷应用。它与业界同类方法对比(如 EMU Edit 和 Ultra Edit),取得显著更优的性能指标。


四、SeedEdit 在不同任务中的表现

即便在常规任务中,相比专家模型,SeedEdit 也有一定优势。比如,在“抠图”换背景等用户最常用到的图像分割任务中,SeedEdit 编辑生成后的图像风格自然,无“贴图感”;在局部涂抹、编辑、添加和删除元素等任务中,相比手动涂抹编辑,SeedEdit 通过语言指定,大大节省了用户涂抹的时间,尤其针对裂纹、发丝等相对精细的涂抹区域。


五、SeedEdit 的未来发展

基于豆包文生图大模型,目前 SeedEdit 支持中文和英文输入,还可以对中文成语和专有名词进行精准响应。下一步,SeedEdit 还将开放多轮复杂编辑的功能。

豆包大模型团队表示,现阶段 SeedEdit 对模型生成图片的编辑效果要好于输入真实图片,同时在更复杂和更精细的控制上仍有改进空间。未来,SeedEdit 会在真实图片保真、ID 保持、编辑精确性、以及长时序的故事类、漫画类生成方面做进一步的优化和探索,提升编辑可用率和用户体验,支持用户更高效地创作有趣的内容。


六、总结

字节豆包通用图像编辑模型 SeedEdit 的开启测试,为用户带来了前所未有的图像编辑体验。它的强大功能和技术优势,使其在图像编辑领域脱颖而出。相信在未来,SeedEdit 将不断优化和发展,为用户提供更加优质的服务,引领图像编辑新潮流。


上一篇: 百度推出无代码工具‘秒哒’,开启创意赚钱新时代 下一篇: 谷歌推出 AI 视频编辑应用 Google Vids