多模态输入
Gemini 2.0
Gemini 2.0 是谷歌推出的原生多模态AI模型,具备快速处理文本、音频和图像的能力,支持多语言输出和实时音视频流输入。通过Agent技术和工具调用,Gemini 2.0 能够自主理解任务并提供解决方案,已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用,计划逐步开放更多功能。
Augment Agent
Augment Agent 是一款 AI 编程助手,支持 VS Code 和 JetBrains,具备强大上下文处理能力(最高 20 万 tokens),可自动学习用户编码风格并保持一致性。支持多模态输入、代码检查点、终端命令及跨平台协作,适用于复杂代码库开发和日常编程任务,性能在基准测试中表现优异。
Stackie.AI
Stackie.AI 是一款基于AI的智能记录与管理工具,支持多模态输入(文本、语音、图像),提供自动整理、任务生成、个性化模板及角色互动等功能。适用于健康管理、学习辅助、日常计划与习惯养成等场景,提升信息处理效率与用户体验。