文心大模型4.5 Turbo 文心大模型4.5 Turbo 文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型,支持文本、图像、视频等多种输入形式,具备强大的逻辑推理与去幻觉能力,可辅助代码编写。相比前代产品,其速度更快、成本更低,适用于内容创作、智能客服、电商营销、教育及办公自动化等多个场景,已在文心一言平台上线。 AI项目与工具 2025年06月11日 19 点赞 0 评论 401 浏览
Codex CLI Codex CLI Codex CLI 是一款基于 OpenAI 模型的轻量级 AI 编程工具,支持通过自然语言指令生成代码、执行文件操作、进行数据库迁移等。它具备代码重构、测试生成、解读及多模态处理能力,适用于开发者在终端中高效完成多种编程任务。工具兼容主流操作系统,提供安全的沙盒执行环境,并支持个性化配置。 AI项目与工具 2025年06月11日 14 点赞 0 评论 392 浏览
Quasar Alpha Quasar Alpha Quasar Alpha是一款预发布AI模型,具备100万token的超大上下文窗口,可高效处理长文本和复杂文档。其在代码生成、指令遵循、多模态处理等方面表现出色,支持联网搜索以增强信息准确性。适用于代码开发、长文本分析、创意写作及智能问答等多种场景,目前可通过OpenRouter平台免费使用,存在一定请求限制。 AI项目与工具 2025年06月12日 96 点赞 0 评论 502 浏览
OmniTalker OmniTalker OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术,支持文本、图像、音频和视频的同步处理,并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术,实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景,具有高实时性与稳定性。 AI项目与工具 2025年06月12日 59 点赞 0 评论 358 浏览
OlympicArena OlympicArena OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架,包含11,163道国际奥赛双语题目,覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估,全面衡量AI模型的逻辑与视觉推理能力,支持多模态输入并具备数据泄漏检测机制,适用于AI模型评估、训练优化、教育辅助及科研应用。 AI项目与工具 2025年06月12日 58 点赞 0 评论 343 浏览
Gemini 2.5 Pro Gemini 2.5 Pro Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型,具备深度推理能力,可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式,拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异,适用于学术研究、软件开发、创意工作和企业应用等多个领域。 AI项目与工具 2025年06月12日 75 点赞 0 评论 435 浏览
龙猫LongCat 龙猫LongCat 龙猫LongCat是美团自主研发的生成式AI大模型,具备多模态处理能力,可支持文本、图像等内容生成任务。其核心功能涵盖智能编程、会议记录、文档编辑、图形设计与视频脚本生成等,适用于多种办公场景。通过大规模预训练与混合训练策略,龙猫在实际应用中展现出高效、精准的特点,有效提升工作效率与创新能力。 AI项目与工具 2025年06月12日 70 点赞 0 评论 310 浏览
UniFluid UniFluid UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架,支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入,结合Gemma模型和VAE技术,实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色,具备良好的下游任务迁移能力,适用于创意设计、内容创作等多个领域。 AI项目与工具 2025年06月12日 54 点赞 0 评论 255 浏览
GR00T N1 GR00T N1 GR00T N1 是英伟达推出的开源人形机器人基础模型,支持多模态输入并具备复杂任务执行能力。采用双系统架构,结合视觉-语言模型与扩散变换器,实现精准动作控制。基于大规模数据训练,适应多种机器人形态和任务场景,广泛应用于物流、制造、医疗等领域,提升自动化水平与操作效率。 AI项目与工具 2025年06月12日 62 点赞 0 评论 317 浏览
Mistral Small 3.1 Mistral Small 3.1 Mistral Small 3.1 是一款由 Mistral AI 开发的开源多模态 AI 模型,拥有 240 亿参数,支持文本与图像处理,具备长达 128k tokens 的上下文窗口和每秒 150 token 的推理速度。采用 Transformer 架构与 MoE 技术,提升计算效率,支持多语言和本地部署。适用于文档处理、图像分析、质量检测、虚拟助手等多种场景。 AI项目与工具 2025年06月12日 58 点赞 0 评论 133 浏览