多模态技术

S2V

S2V-01是MiniMax研发的视频生成模型，基于单图主体参考架构，可快速生成高质量视频。它能精准还原图像中的面部特征，保持角色一致性，并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出，具备电影感镜头效果，适用于短视频、广告、游戏、教育等多种场景，具有高效、稳定和高自由度的特点。

AI项目与工具 2025年06月12日 100 点赞 0 评论 587 浏览

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型，支持多语言和多种音乐风格，如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案，解决长上下文处理与音乐生成难题，生成结构连贯、旋律优美的歌曲。模型完全开源，用户可自由使用和定制，适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 753 浏览

DreamFit

DreamFit是由字节跳动与高校联合研发的虚拟试衣框架，专注于轻量级服装图像生成。通过优化文本提示与特征融合技术，提升图像质量与一致性，降低模型复杂度和训练成本。支持姿势控制、多主题服装迁移等功能，适用于虚拟试穿、服装设计、广告制作等多个场景，具备良好的泛化能力和易用性。

AI项目与工具 2025年06月11日 89 点赞 0 评论 856 浏览

Paper2Poster是由加拿大滑铁卢大学、新加坡国立大学等机构推出的学术框架，基于多模态自动化技术从科学论文生成海报。它通过Parser、Planner和Painter–Commenter系统实现内容压缩、布局优化和视觉质量提升，支持将长篇论文转化为结构化视觉海报。Paper2Poster引入PaperQuiz评估方法，确保海报有效传达核心内容，提高生成效率，适用于学术会议、报告、科研展示及教

AI项目与工具 2025年06月11日 34 点赞 0 评论 611 浏览

星野app

星野app是一款功能强大的AI聊天机器人和智能对话工具，有趣的开放剧情和逼真的AI聊天，让你体验真正的聊天互动。

3D&游戏 2025年06月05日 83 点赞 0 评论 597 浏览

多模态技术

首页

多模态技术

列表

默认

浏览次数

发布日期

S2V

YuE

DreamFit

Paper2Poster

星野app

多模态技术 首页 多模态技术

列表 默认 浏览次数 发布日期

S2V

YuE

DreamFit

Paper2Poster

星野app

多模态技术

首页

多模态技术

列表

默认

浏览次数

发布日期