注意力机制

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架，采用区域注意力机制实现对图像中实体的精确控制，支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练，具备强大泛化能力，适用于虚拟场景、角色设计、数据合成及产品展示等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 802 浏览

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型，具备检索增强、上下文学习及超分辨率技术，能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值，同时支持学术研究和技术探索。

AI项目与工具 2025年06月12日 96 点赞 0 评论 802 浏览

StoryDiffusion

StoryDiffusion 是一种基于 AI 的图像和视频生成框架，通过 Consistent Self-Attention 和 Semantic Motion Predictor 技术，实现从文本到连贯图像和视频的转化，支持用户高效生成高质量视觉内容，广泛应用于动漫、教育、广告及影视等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 817 浏览

StoryWeaver

StoryWeaver是一款基于AI的故事可视化工具，利用知识图谱Character Graph和创新技术如CCG及KE-SG，实现高质量的角色定制和故事图像生成。它支持单角色与多角色场景，确保图像与文本语义的一致性，并适用于教育、漫画创作、游戏设计等多个领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 851 浏览

PersonaTalk

PersonaTalk是一种基于注意力机制的两阶段框架，用于实现高保真度和个性化的视觉配音。其核心技术包括风格感知音频编码、唇形同步几何生成、双注意力面部渲染等，能够确保视频中人物的嘴型动作与输入音频精准匹配，同时保留说话者的独特风格和面部特征。相比现有技术，PersonaTalk在视觉质量和唇形同步方面表现更优，适用于电影、游戏、虚拟助手等多个领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 851 浏览

PixVerse V2

PixVerse V2是一款基于Diffusion+Transformer（DiT）架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频，单个片段最长可达8秒，且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频，适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。

AI项目与工具 2025年06月12日 47 点赞 0 评论 1008 浏览

注意力机制

首页

注意力机制

列表

默认

浏览次数

发布日期

EliGen

ColorFlow

StoryDiffusion

StoryWeaver

PersonaTalk

PixVerse V2

注意力机制 首页 注意力机制

列表 默认 浏览次数 发布日期

EliGen

ColorFlow

StoryDiffusion

StoryWeaver

PersonaTalk

PixVerse V2

注意力机制

首页

注意力机制

列表

默认

浏览次数

发布日期