多模态 - 智狐AI导航

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型，具备深度推理能力，可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式，拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异，适用于学术研究、软件开发、创意工作和企业应用等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 699 浏览

Webdraw

Webdraw 是一款无代码 AI 应用开发平台，支持图像生成、视频制作、聊天助手等功能，用户可通过自然语言或可视化工具快速构建应用。平台集成多种 AI 模型，支持多模态内容创作，具备文件共享、实时协作和一键部署能力，适用于创意设计、个性化工具开发、教育及企业场景，降低 AI 技术使用门槛。

AI项目与工具 2025年06月12日 99 点赞 0 评论 700 浏览

Realtime API

Realtime API是一款由OpenAI研发的低延迟、多模态对话式API，支持文本与音频输入输出，具备实时语音处理、自然语音合成及多模态交互等功能。通过WebSocket协议实现持久连接，支持事件驱动的交互模式，适用于客户服务、语言学习、游戏娱乐等多种应用场景。

AI项目与工具 2025年06月12日 41 点赞 0 评论 700 浏览

PixWeaver

PixWeaver是一个基于人工智能的图像创作平台。它能帮助用户无需学习复杂的设计软件,通过语音或文字描述就可以生成理想中的图像。

Ai绘画生成 2025年06月05日 47 点赞 0 评论 700 浏览

Mochii AI

Mochii AI 是一款多功能AI助手，支持智能对话、文档分析、网页总结、图像识别等功能，兼容多种AI模型。用户可跨平台使用，适用于文档处理、内容创作、代码生成及数据分析等场景，具备个性化定制和上下文理解能力，提升工作效率与体验。

AI项目与工具 2025年06月12日 80 点赞 0 评论 701 浏览

ChatEDU

多模态教育工具，通过借助生成式 AI成为学生的 “第二大脑”。提供包括知识图谱、动态知识档案和任务型学习代理三大核心功能。

教育学习 2025年06月05日 10 点赞 0 评论 701 浏览

EVI 3是Hume AI推出的全新语音语言模型，能够同时处理文本和语音标记，实现自然、富有表现力的语音交互。它支持高度个性化，根据用户提示生成任何声音和个性，并实时调节情感和说话风格。在与GPT-4o等模型的对比中，EVI 3在情感理解、表现力、自然度和响应速度等方面表现更优，具备低延迟响应能力，可在300毫秒内生成语音回答。EVI 3适用于智能客服、语音助手、教育辅导、情感支持和内容创作等多个

AI项目与工具 2025年06月11日 45 点赞 0 评论 701 浏览

达闼RobotGPT多模态大模型

达闼RobotGPT多模态大模型是一个创新的AI工具，它通过整合多模态数据处理能力，为机器人在多样化的应用场景中提供了强大的交互和行为生成能力。

创作工具 1970年01月01日 0 点赞 0 评论 702 浏览

商量智能助手

商汤科技研发的一款基于自然语言处理技术的人工智能大语言模型。它具备强大的语言理解和生成能力，能够高效地解答用户的问题，提供定制化建议，并辅助创作高质量文本。

AI写作对话 2025年06月05日 47 点赞 0 评论 703 浏览

OpenBioMed

OpenBioMed是由清华大学智能产业研究院与水木分子联合开发的开源平台，专注于AI在生物医学中的应用。它支持多模态数据处理，涵盖分子、蛋白质、单细胞等多种类型，并提供20多个深度学习模型和计算工具，适用于药物研发、精准医疗、知识图谱构建等领域。平台具备统一的数据处理框架和预训练模型，支持快速迁移和智能体设计，助力科研人员提升研究效率。

AI项目与工具 2025年06月12日 45 点赞 0 评论 703 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期