模型 - 智狐AI导航

MagicVideo

MagicVideo-V2是一款由字节跳动公司团队开发的AI视频生成模型和框架。该模型通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块，实现了从文本到高保真视频的转换。生成的视频不仅具有高分辨率，而且在视觉质量和运动流畅度方面表现出色，为用户提供卓越的观看体验。

AI项目与工具 2024年01月01日 56 点赞 0 评论 981 浏览

TrikAI

TrikAI是小红书旗下AI绘画平台，输入描述即可为你生成图片，尤其是国风风格。

Ai绘画生成 2025年06月05日 68 点赞 0 评论 982 浏览

Agent Laboratory

Agent Laboratory是由AMD与约翰·霍普金斯大学合作开发的基于大型语言模型的研究辅助工具，支持从文献综述到报告撰写的全流程科研任务。它具备实验设计、代码生成、结果分析等功能，并通过多代理协作和用户反馈机制提升研究质量。实验表明其可显著降低研究成本，适用于机器学习、生物医学等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 984 浏览

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架，涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域，包含1,130个问题，每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标，全面衡量模型推理能力，并揭示当前模型在反思机制和感知任务上的不足，为模型优化和研究提供重要参考。

AI项目与工具 2025年06月12日 36 点赞 0 评论 984 浏览

Astria AI

Astria是一个利用生成AI创建定制图像的平台。Astria AI允许用户上传一组主题的图像，然后根据文本提示生成新图像。

Ai绘画生成 2025年06月05日 28 点赞 0 评论 988 浏览

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具，具备文本到视频生成、图像到视频转换等功能，支持高清视频输出及音效匹配。它通过三维变分自编码器（3D VAE）、Transformer架构等技术手段，提升了视频生成的质量与效率，适用于内容创作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 990 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 991 浏览

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型，拥有 130 亿参数，可在消费级显卡上高效运行，生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节，具备多尺度渲染和高压缩率技术，适用于影视、广告、游戏、教育等多个领域，提升内容创作效率与质量。

AI项目与工具 2025年06月11日 18 点赞 0 评论 992 浏览

明岐

明岐是上海交通大学LoCCS实验室开发的医学多模态大模型，专注于罕见病精准诊断。它整合影像、病历与化验数据，采用双引擎架构实现高精度、可解释的诊断，准确率超92%。通过模型优化技术，支持低成本本地化部署，适用于基层医疗、远程服务及科研教学，助力医疗资源均衡发展。

AI项目与工具 2025年06月11日 28 点赞 0 评论 993 浏览

VidTok

VidTok（Video Tokenizer）是一款由微软开发的开源视频处理工具，通过高效的算法将视频内容转化为“视频词”，支持连续与离散分词化，具有灵活的压缩率和多样的隐空间，适用于视频生成、内容建模及数据压缩等场景。其混合模型架构结合卷积与采样模块，辅以有限标量量化技术，实现了高质量视频重建与高效数据处理。

AI项目与工具 2025年06月12日 54 点赞 0 评论 993 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期