生成

MineWorld

MineWorld是由微软研究院开发的基于《我的世界》的实时交互式AI模型,采用视觉-动作自回归Transformer架构,实现高保真、可控性强的场景生成。通过并行解码算法,模型可在每秒4至7帧的速度下实现实时交互,适用于具身智能、强化学习、游戏代理及视频生成等场景。其核心技术包括图像与动作标记器、Transformer解码器以及优化的训练与推理流程。

妙刷

妙刷是一款由美团推出的AI创作工具,支持修图、文本生图、音频生图及视频生成等功能,可将日常素材转化为艺术作品,如拟人化宠物、魔幻风景等,同时定期更新玩法和特效以保持新鲜感。

Shakker

Shakker 是一款基于 AI 技术的图像生成与编辑平台,提供 Stable Diffusion 模型支持,具备图像局部修改、合成、背景去除、动作调整等功能。支持多种风格图像生成,包括动漫、肖像及表情包制作。适用于设计师、艺术家及游戏开发者,提供直观的操作界面,广泛应用于社交媒体营销、数字艺术创作及个性化礼物定制等领域。

SketchVideo

SketchVideo是一款基于草图和文本提示的视频生成与编辑框架,由多所高校与企业联合研发。它利用DiT模型和草图控制网络,实现对视频内容的精细控制,支持动态调整与细节保留。该工具适用于多种场景,如影视制作、教育、游戏开发等,具备高效生成与高质量输出能力。

燕雀智造

燕雀智造是一款依托于AI技术开发的在线设计平台,主要服务于企业及个人品牌建设需求。它能够提供包括LOGO设计、VI系统构建在内的多项专业服务,并通过智能化流程简化了复杂的品牌设计过程。用户仅需简单几步即可获得高度适配自身需求的专业级LOGO方案,同时支持后续编辑与下载,广泛适用于公司、机构乃至个体经营者等各类场景。

Vision Search Assistant

Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架,旨在提升模型对未知视觉内容的理解能力。它通过网络检索,使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色,支持图像描述生成、网络知识搜索、协作生成等功能,可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。

可灵2.0

可灵2.0是快手推出的AI视频生成模型,支持文生视频和图生视频,具备复杂动态生成、动作流畅性和多模态编辑能力。它能根据用户输入的文字或图片生成高质量视频,提升视频的真实感和沉浸感,适用于影视、广告、教育、游戏等领域,提高创作效率与灵活性。

新言意码

新言意码是一家专注于AI编程应用开发的科技公司,提供代码生成、补全、审查、优化、测试及智能搜索等功能,支持多语言开发。其产品适用于软件开发、教育学习、代码维护、团队协作及快速原型构建等多种场景,旨在提升开发效率和代码质量。公司成立于2024年,已获得多轮投资,估值达8000万美元。

Creatus.AI

Creatus.ai 是一个允许您使用人工智能从文本输入生成引人入胜的视频内容的平台。无论您是想为社交媒体渠道、网站、博客还是在线课程制作视频,Creatus.ai 都可以帮助您轻松高效地完成。

AdaCache

AdaCache是一种开源的自适应缓存技术,由Meta开发,用于加速AI视频生成。它通过动态调整计算资源和引入运动正则化策略,优化视频生成过程中的缓存决策,显著提升生成速度,同时保持视频质量。AdaCache无需重新训练即可轻松集成到现有模型中,并适用于多GPU环境,广泛应用于影视制作、视频编辑、在线平台及虚拟现实等领域。