检索
Voyage Multimodal
Voyage Multimodal-3 是一款多模态嵌入模型,能够处理文本、图像以及它们的混合数据,无需复杂文档解析即可提取关键视觉特征。它在多模态检索任务中的准确率显著高于现有最佳模型,支持语义搜索和文档理解,适用于法律、金融、医疗等多个领域的复杂文档检索任务。
TextHarmony
TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。
Minion Agent
Minion Agent 是一款基于代理框架的多功能 AI 工具,支持浏览器操作、MCP 协议、自动规划和深度研究等功能。用户可通过简单 API 快速部署,实现信息检索、数据分析等任务。其动态规划机制确保任务高效执行,同时支持多种模型和灵活配置,适用于信息研究、自动化任务、智能助手开发等多个场景。
