两秒钟,就能将你的想象变成“现实”。
在商汤技术日上,商汤“日日新SenseNova”大模型体系正式问世,基于该体系的AI内容创作社区平台“商汤秒画SenseMirage”也一并亮相。
商汤科技董事长兼CEO徐立现场演示了“商汤秒画SenseMirage”基于商汤自研AIGC模型的作画能力;也介绍了秒画平台基于商汤大装置的GPU算力支撑,可帮助用户免除本地化部署流程,既能使用商汤自研作画模型高效地生成高质量内容,也可以将本地模型及其他第三方开源模型一键导入,生成更多样的内容。
秒画还提供特异性推理优化服务,开源模型导入后会自动采用秒画底层的模型编译技术进行加速,实测在本地RTX3070显卡需要10秒生成的图片通过秒画加速技术只需要2秒就可以生成。
此外,秒画还支持用户上传本地图像,结合商汤自研作画模型或者开源模型来训练定制化LoRA模型,来高效地生成个性化内容。(LoRA, 用于通过小数据继续训练,将大模型的能力适应到某个垂类领域,但会影响大模型的泛化能力)
·MH Team: MiaoHua Team,商汤秒画团队创作模型
·最近创作:用户使用商汤自研作画模型最新创作并分享到广场的图画作品
·精选模型:用户可通过收藏,将商汤自研模型或开源模型添加至用户“精选模型”列表中,方便需要时访问和调用
·Civitai:是社区开源模型分享网站
·Hugging Face:为AI开源软件公司,主要提供模型托管及GPU算力支持服务
“商汤秒画SenseMirage”平台,为各类创作者带来便利,同时也能充分借助社区力量,集结内容创意,通过内容共创,推动AI文生图技术与应用的生态构建。
超10亿参数,多种风格秒生成
商汤自研的AIGC文生图大模型拥有超10亿参数,支持二次元、三次元等多种生成风格。用户无需复杂的编程知识,只需给定提示词,即可生成相应图像,最高可实现6K高清图。
无论是写实照片、脑洞大开的艺术画作,还是未来科幻场景,模型生成的图像都能根据用户需求,带来真实的光影效果以及丰富的细节内容。凭借超快的推理性能,商汤自研作画模型的文生图能力,每2秒就能生成1张512*512分辨率的图片。
自研AIGC模型,高效释放图像生成“巧实力”
相比于Stable Diffusion,商汤作画大模型基于19年开始研发的通用大模型设计体系,采用更先进的大模型结构设计与大batch训练优化算法,模型参数量大小为前者数倍。
核心技术包含了自研的 hierarchical inference experts, mixture of token experts, image quality-aware distributed training, texture-guided cross-attention learning等算法,使其具备更优的文本理解泛化性、图像生成风格广度以及图像高质量生成细节。
此外,目前市面上所有的LoRA模型都是基于Stable Diffusion或者其变体训练的,依托商汤基模型本身强大的泛化能力,使用其替代Stable Diffusion模型可以基于更少量数据快速训练出质量更高的LoRA模型,实现更优的风格定制化图像生成,这样的功能在秒画平台通过5分钟即可实现。
模型导入+训练,摆脱算力掣肘满足进阶创意需求
对于有进阶需求的模型创作者, “商汤秒画SenseMirage” 平台也可支持自行上传数据集进行finetune、自训练等功能,定制训练属于自己风格的LoRA模型,通过拖拽20张图片训练集,仅需5分钟就能完成训练,显著降低模型的训练门槛。
同时,用户也可以一键导入 Hugging Face, Civitai, GitHub 等第三方社区的开源模型进行体验,让用户免除本地化部署的繁琐流程,通过商汤AI大装置SenseCore强大的GPU算力集群、推理加速功能,即可高效生成更多样的内容,创作更便利。
不仅如此,商汤还将面向B端开放API接口,结合商汤AI大装置SenseCore提供的算力,为客户提供便利、高效的服务,打造多样性的平台和社区生态。
在大模型的驱动下,AI文生图技术快速发展,可以广泛应用于设计、营销、游戏动画、工程建筑、医学、教育科普等领域,帮助人们提高创造力。
“商汤秒画SenseMirage”平台的推出,在为创作者打造低门槛、高效率的创作服务的同时,还能够充分整合社区力量连接更多资源,带来更加便利、完善的内容生产创作工具,让每一位创作者都能轻松地将想象变为现实。