Multimodal Live API Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口,具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动,并支持会话记忆和外部功能调用,广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。 AI项目与工具 2025年06月12日 51 点赞 0 评论 510 浏览
LMMs LMMs-Eval 是一个用于多模态AI模型的统一评估框架,提供标准化、广泛覆盖且成本效益高的性能评估解决方案。它支持超过50个任务和10多个模型,并通过透明和可复现的评估流程帮助研究者和开发者全面了解模型能力。LMMs-Eval 还引入了 LMMs-Eval Lite 和 LiveBench,分别通过精简数据集降低评估成本并动态更新评估数据集,以确保模型泛化能力的有效评估。 AI项目与工具 2025年06月12日 86 点赞 0 评论 504 浏览
Tavus – AI视频生成平台,支持数字人克隆和实时对话 Tavus 是一个先进的 AI 视频生成平台,提供逼真的数字人克隆和实时对话式视频。基于 Phoenix-2 模型和对话式视频接口(CVI),Tavus 支持企业快速部署 AI 视频产品,提升用户体验并确保安全合规。主要功能包括 AI 视频生成、实时对话、开发者文档和工具,适用于客户服务、个性化营销、虚拟助手、教育和产品演示等多种应用场景。 AI项目与工具 2025年01月28日 44 点赞 0 评论 474 浏览
创造者日报 一个独立开发者和创业者展示产品和交流的社区,每天分享和发现有趣的产品。用户可以在创造者日报分享产品设计想法,获取反馈和种子用户。 独立开发 2025年06月05日 57 点赞 0 评论 473 浏览
Skywork o1 Skywork o1是一款具备中文逻辑推理能力的大规模预训练模型,其核心优势在于内嵌思考、规划和反思能力,显著提升了复杂任务的推理性能。该模型基于开源Llama架构,同时提供增强版以满足更高要求的应用场景。它适用于技术开发者、企业决策者、教育工作者、内容创作者及客户服务等多个领域,助力创新应用开发和高效决策支持。 --- AI项目与工具 2025年06月12日 73 点赞 0 评论 472 浏览
Fellou AI浏览器 由中国95后创业者谢扬及其团队推出的全球首个行动型浏览器,它将浏览器、AI Agent和工作流自动化相结合。 Ai办公效率 2025年06月05日 72 点赞 0 评论 467 浏览
AI4S AI4S是一个旨在呈现最新、最有价值智能AI站点和工具的在线导航平台。不断收集和整合全球智能AI相关站点,我们的目标是为您提供最新的技术和行业信息。 Ai学习资源 2025年06月05日 61 点赞 0 评论 464 浏览