实时交互 - 智狐AI导航

EMO

EMO通过其先进的音频驱动视频生成技术，为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情，还能根据音频内容自然地驱动头部动作，为...

Ai平台模型 2026年06月29日 0 点赞 0 评论 374 浏览

全响AI

一个支持专有知识库投喂和训练的系统，i-Avatar数字人平台能够根据用户的不同需求定制企业或个人的数字人员工。

Ai视频生成 2025年06月05日 84 点赞 0 评论 448 浏览

51数字人

一款专注于AI直播和短视频制作的解决方案，51数字人提供全自动的数字人代运营服务，适用于新闻、教育、企业宣传等多种场景。

Ai视频生成 2025年06月05日 40 点赞 0 评论 583 浏览

新畅元 | 创视元数字人

创视元，一键孪生数字人，多模态驱动视频内容创作，生成快、场景多、易操作、质量高。

AI服务商 2025年06月05日 96 点赞 0 评论 874 浏览

Graphiti

Graphiti 是一个为动态环境设计的 AI 知识图谱生成框架，支持实时摄取和处理结构化与非结构化数据，具备时间感知能力、动态数据整合、混合检索、状态推理与自动化等功能。它适用于 AI 智能体记忆层、实时交互系统和企业知识管理等场景，提供强大的动态记忆和推理能力，助力实现更智能、高效的 AI 应用。

AI项目与工具 2025年06月11日 99 点赞 0 评论 667 浏览

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架，支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略，实现长上下文处理与主动响应。项目配套发布Stream-IT数据集，包含60万样本，适用于多种视频理解任务，展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 757 浏览

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型，支持实时交互与动态世界生成，确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠，有效解决多人游戏中的同步难题。模型训练成本低，可在普通PC上运行，且项目全面开源，适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 839 浏览

OmniTalker

OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术，支持文本、图像、音频和视频的同步处理，并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术，实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景，具有高实时性与稳定性。

AI项目与工具 2025年06月12日 59 点赞 0 评论 723 浏览

ChatAnyone

ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具，基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型，支持实时交互与风格化控制，适用于虚拟主播、视频会议、内容创作等多种场景，具备高度可扩展性和实用性。

AI项目与工具 2025年06月12日 72 点赞 0 评论 630 浏览

GaussianCity

GaussianCity是由南洋理工大学S-Lab团队开发的高效3D城市生成框架，基于3D高斯绘制技术，采用紧凑的BEV-Point表示方法降低显存和存储需求。其空间感知的BEV-Point解码器可生成高质量3D城市场景，支持多样化视角和实时渲染，适用于游戏、影视、城市规划等领域。相比现有方法，其生成速度提升60倍，兼具高效与高质量特性。

AI项目与工具 2025年06月12日 80 点赞 0 评论 642 浏览

实时交互

首页

实时交互

列表

默认

浏览次数

发布日期

EMO