模型 - 智狐AI导航

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架，基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量，并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术，适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 1032 浏览

Megrez

Megrez-3B-Omni是一款具备全模态理解能力的开源模型，支持图像、音频和文本的综合处理，具备强大的推理效率和多模态交互功能。它能够在多个权威测试集中展现卓越性能，尤其擅长场景理解、OCR识别及语言生成等任务，同时通过智能WebSearch调用增强问题解答能力，适用于个人助理、智能家居、车载系统等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 1036 浏览

AIFlowy

AIFlowy 是一款基于 Java 的开源 AI 应用开发平台，支持智能对话机器人、私有知识库构建、AI 工作流编排及大模型管理等功能。平台提供完善的系统管理模块，适用于企业级应用开发与部署，助力提升业务流程智能化水平。

AI项目与工具 2025年06月11日 41 点赞 0 评论 1041 浏览

星图比特StarBitech

一站式应用AI模型全生命周期服务商

创业营销 2026年07月28日 0 点赞 0 评论 1044 浏览

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型，具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务，适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

AI项目与工具 2025年06月12日 50 点赞 0 评论 1050 浏览

NodeTool

NodeTool是一款开源的AI工作流可视化构建工具，通过图形化界面和无代码开发环境，用户可以便捷地集成并运行多种AI模型。它支持本地GPU运行、云服务扩展以及多模态数据处理，适用于图像生成、音乐创作、音频转视觉艺术等多个领域，为非技术用户提供高效且灵活的AI解决方案。 ---

AI项目与工具 2025年06月12日 57 点赞 0 评论 1050 浏览

DynVFX

DynVFX是一种基于文本指令的视频增强技术，能够将动态内容自然地融入真实视频中。它结合了文本到视频扩散模型与视觉语言模型，通过锚点扩展注意力机制和迭代细化方法，实现新内容与原始视频的像素级对齐和融合。无需复杂输入或模型微调，即可完成高质量的视频编辑，适用于影视特效、内容创作及教育等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 1051 浏览

Text2CAD

Text2CAD 是一款基于人工智能的在线 CAD 设计工具，能够将自然语言描述快速转换为高精度的 CAD 模型。支持多种格式导出，具备快速设计、精准转换、易修改、云存储与协作等功能，适用于工业设计、教育、原型开发、VR/游戏设计及个性化定制等多个领域。平台提供不同版本的订阅服务，满足不同用户需求。

AI项目与工具 2025年06月11日 22 点赞 0 评论 1053 浏览

BlueLM

BlueLM-V-3B是一种针对移动设备设计的多模态大型语言模型，结合了高效算法与系统优化，支持快速、低功耗的文本与图像处理。其主要特性包括多模态理解、实时响应、隐私保护、高效率部署及跨语言能力。该模型通过动态分辨率调整、批量图像编码及令牌下采样等技术，实现了在有限资源下的高性能表现。

AI项目与工具 2025年06月12日 62 点赞 0 评论 1055 浏览

OpenELM

OpenELM是苹果公司推出的一系列高效开源语言模型，涵盖从2.7亿到30亿参数规模的不同版本。该模型基于Transformer架构，采用层间缩放策略优化参数分配，使用分组查询注意力（GQA）和SwiGLU激活函数等技术。OpenELM在公共数据集上预训练，并在多项自然语言处理任务中展现出色性能。模型代码和预训练权重已公开，旨在促进开放研究和社区发展。

AI项目与工具 2024年01月01日 99 点赞 0 评论 1055 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期