实时 - 智狐AI导航

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架，基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量，并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术，适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 989 浏览

ChatGPT Projects

ChatGPT Projects是OpenAI推出的一项多功能集成工具，支持文件上传、个性化指令设置、对话组织及实时协作等功能，通过项目管理、数据存储和版本控制优化用户体验。该工具适用于项目管理、内容创作、编程开发、教育学习等场景，提供强大的文件管理和数据分析能力，助力用户高效完成多样化任务。

AI项目与工具 2025年06月12日 45 点赞 0 评论 983 浏览

Mini-Omni 是一个开源的端到端语音对话模型，具备实时语音输入和输出的能力，能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别（ASR）或文本到语音（TTS）系统，直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法，通过批量并行策略提高性能，同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能，适用于智能助手、客户服务

AI项目与工具 2025年06月12日 93 点赞 0 评论 967 浏览

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型，具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色，适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理，旨在提供高质量的语音交互体验。

AI项目与工具 2025年06月12日 22 点赞 0 评论 963 浏览

Sloyd AI

Sloyd,一个 3D 建模平台，我们的文本转 3D 模型 AI 生成器专门用于将文本提示转换为详细的 3D 模型，可简化创建 3D 模型的过程。

3D&游戏 2025年06月05日 43 点赞 0 评论 959 浏览

Kuse AI

Kuse AI 是一款基于AI技术的智能工具，提供无边界的画布，支持多种格式内容的自由组织和呈现。其AI智能助手可自动总结、生成内容并提供建议，提升工作效率。支持实时协作，适合团队头脑风暴和创意发想，同时具备多媒体整合、透明引用与信息验证、定制化工作流等功能，适用于项目管理、创意发想、学术研究、教育学习和市场营销等场景。

AI项目与工具 2025年06月11日 79 点赞 0 评论 949 浏览