ToonCrafter ToonCrafter是一个展示平台,它利用先进的生成对抗网络(GAN)技术,将用户的原始动漫帧转化为一系列风格一致、过渡自然的画面。 Ai视频生成 1970年01月01日 0 点赞 0 评论 287 浏览
TimeSuite TimeSuite是一种由上海AI Lab开发的框架,专注于提升多模态大型语言模型在长视频理解任务中的表现。它通过引入高效的长视频处理框架、高质量的视频数据集TimePro和Temporal Grounded Caption任务,提升了模型对视频内容的时间感知能力,减少了幻觉风险,并显著提高了长视频问答和时间定位任务的性能。其核心技术包括视频令牌压缩、时间自适应位置编码、U-Net结构及多样化任务 AI项目与工具 2025年06月12日 78 点赞 0 评论 287 浏览
妙构 妙构是一款基于AI技术的视频内容分析工具,能够从视觉、音频和创意结构等多个维度对视频进行深度解析,提供专业的优化建议。其功能包括趋势分析、案例学习、智能反馈等,适用于视频创作者、内容策划及营销人员,帮助提升视频质量与传播效果。 AI项目与工具 2025年06月11日 86 点赞 0 评论 287 浏览
S2V S2V-01是MiniMax研发的视频生成模型,基于单图主体参考架构,可快速生成高质量视频。它能精准还原图像中的面部特征,保持角色一致性,并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出,具备电影感镜头效果,适用于短视频、广告、游戏、教育等多种场景,具有高效、稳定和高自由度的特点。 AI项目与工具 2025年06月12日 100 点赞 0 评论 288 浏览
WorldSense WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具,用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对,覆盖8大领域及26类认知任务,强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证,确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域,推动AI模型在多模态场景下的性能提升。 AI项目与工具 2025年06月12日 61 点赞 0 评论 288 浏览
Magma Magma是微软研究院开发的多模态AI基础模型,具备理解与执行多模态任务的能力,覆盖数字与物理环境。它融合语言、空间与时间智能,支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练,Magma在零样本和微调设置下表现优异,适用于网页操作、机器人控制、视频理解及智能助手等多个领域。 AI项目与工具 2025年06月12日 100 点赞 0 评论 289 浏览
Qihoo Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型,基于代理标记化扩散 Transformer(PT-DiT)架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度,支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性,适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。 AI项目与工具 2025年06月12日 26 点赞 0 评论 289 浏览
Shedevrum Shedevrum是由Yandex推出的AI图像生成工具,支持文本到图像和视频的生成,具备多种艺术风格模仿能力。用户可通过输入描述性文本,快速生成高质量、高分辨率的图像,并进行个性化调整。该工具适用于艺术创作、内容制作、教育及品牌营销等多个领域,提供便捷的视觉内容生成方案。官网提供免费版本,支持多语言输入,适合各类用户使用。 AI项目与工具 2025年06月12日 96 点赞 0 评论 290 浏览