模型 - 智狐AI导航

MagicVideo

MagicVideo-V2是一款由字节跳动公司团队开发的AI视频生成模型和框架。该模型通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块，实现了从文本到高保真视频的转换。生成的视频不仅具有高分辨率，而且在视觉质量和运动流畅度方面表现出色，为用户提供卓越的观看体验。

AI项目与工具 2024年01月01日 56 点赞 0 评论 834 浏览

OmniEdit

OmniEdit是一款基于多专家模型监督训练的先进图像编辑工具，支持七种核心图像编辑任务，包括对象替换、移除、添加、属性修改、背景替换、环境变化和风格转换。它能够处理不同宽高比和分辨率的图像，采用EditNet架构，提升了编辑的成功率和图像保真度。OmniEdit在自动与人工评估中表现优异，适用于专业设计、社交媒体内容创作、电子商务、新闻媒体等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 833 浏览

BriefGPT AI论文速递

BriefGPT AI是一个AI论文速递网站，它可以帮助研究人员快速发现AI领域的最新研究进展。BriefGPT AI每天持续更新顶级会议和期刊上发表的AI相关论文，并提供论文标题、简要摘要以及论文PDF下载链接。

教育学习 2025年06月05日 80 点赞 0 评论 832 浏览

Text2CAD

Text2CAD 是一款基于人工智能的在线 CAD 设计工具，能够将自然语言描述快速转换为高精度的 CAD 模型。支持多种格式导出，具备快速设计、精准转换、易修改、云存储与协作等功能，适用于工业设计、教育、原型开发、VR/游戏设计及个性化定制等多个领域。平台提供不同版本的订阅服务，满足不同用户需求。

AI项目与工具 2025年06月11日 22 点赞 0 评论 831 浏览

JoyVASA

JoyVASA是一个基于扩散模型的音频驱动数字人头项目，能够生成与音频同步的面部动态和头部运动。其主要功能包括唇形同步、表情控制及动物面部动画生成，支持多语言和跨物种动画化。项目采用两阶段训练方法，结合解耦面部表示与扩散模型技术，生成高质量动画视频，广泛应用于虚拟助手、娱乐媒体、教育、广告等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 829 浏览

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型，具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务，适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

AI项目与工具 2025年06月12日 50 点赞 0 评论 827 浏览

同花顺·问财

同花顺·问财大模型是一款集合了实时数据获取、深度语义理解、专业投资建议、数据可视化和内容安全控制等多功能的智能投顾工具。

创作工具 1970年01月01日 0 点赞 0 评论 827 浏览

AndroidGen 是一个基于大语言模型（LLM）的智能代理框架，专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练，结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块，增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色，适用于自动化任务处理、

AI项目与工具 2025年06月12日 31 点赞 0 评论 827 浏览

Goedel

Goedel-Prover是一款由多所高校联合开发的开源大型语言模型，专注于自动化数学问题的形式化证明生成。它通过将自然语言数学问题转化为形式语言（如Lean 4），生成准确且完整的证明过程。采用专家迭代方法持续优化模型性能，在多项基准测试中表现优异。该工具可应用于数学研究、教学、软件验证及AI算法验证等领域，具备强大的数学推理能力和广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 827 浏览

TokenSwift

TokenSwift是由北京通用人工智能研究院开发的超长文本生成加速框架，可在90分钟内生成10万Token文本，效率较传统模型提升3倍，且保持输出质量。其核心优势包括多Token并行生成、动态KV缓存管理、上下文惩罚机制等技术，支持多种模型架构。适用于内容创作、智能客服、学术研究及编程辅助等场景。

AI项目与工具 2025年06月12日 98 点赞 0 评论 826 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期