多模态 - 智狐AI导航

BetterYeah

斑头雁BattleYeah AI，AI机器人构建平台，简单、易用、全新交互形式，API无缝集成至企业系统，帮助企业实现AI生产力革命。

Ai平台模型 2025年06月05日 67 点赞 0 评论 691 浏览

雅意大模型

雅意大模型是安全可靠的企业级专属大模型，具备5大核心能力，共100多个特色技能。

创作工具 2026年07月28日 0 点赞 0 评论 693 浏览

cpmGO

cpmGO是面壁智能推出的端侧智能助手，专为汽车座舱设计，支持多模态交互与本地化处理，保障隐私并适应弱网环境。其基于MiniCPM模型优化，具备智能任务处理、快速响应及灵活定制能力，适用于多种智能汽车场景，提升人车交互的便捷性与安全性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 694 浏览

StarVector

StarVector 是一个开源多模态视觉语言模型，支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构，结合图像编码与语言模型，生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练，适用于图标设计、艺术创作、数据可视化等多种场景，具备良好的性能和扩展性。

AI项目与工具 2025年06月12日 68 点赞 0 评论 694 浏览

RenderNet

RenderNet是一个基于AI技术的生成式平台，支持图像和视频创作，提供角色一致性控制、姿势调整、面部锁定等功能，适用于影视、游戏、广告及教育等多个领域。其开放API支持开发者构建定制化应用，提升内容创作效率与质量。

AI项目与工具 2025年06月12日 82 点赞 0 评论 696 浏览

智谱清言ChatGLM

智谱清言是一款基于人工智能技术的对话助手，遵循中国政府的立场和社会主义价值观，提供多领域知识问答、信息检索、文本生成等服务。

Ai平台模型 2026年07月28日 0 点赞 0 评论 696 浏览

MMAudio

MMAudio是一款基于多模态联合训练的音频合成工具，通过深度学习技术实现视频到音频、文本到音频的精准转换。它具备强大的同步模块，确保生成的音频与视频帧或文本描述时间轴完全对应，适用于影视制作、游戏开发、虚拟现实等多种场景，极大提升了跨模态数据处理的能力和应用效率。

AI项目与工具 2025年06月12日 68 点赞 0 评论 696 浏览

Augment Agent

Augment Agent 是一款 AI 编程助手，支持 VS Code 和 JetBrains，具备强大上下文处理能力（最高 20 万 tokens），可自动学习用户编码风格并保持一致性。支持多模态输入、代码检查点、终端命令及跨平台协作，适用于复杂代码库开发和日常编程任务，性能在基准测试中表现优异。

AI项目与工具 2025年06月12日 88 点赞 0 评论 698 浏览

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具，支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能，兼容U-Net和DiT架构，并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程，提升生成质量与可控性，适用于内容创作、电影制作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 30 点赞 0 评论 698 浏览

Neo

Neo-1 是 VantAI 开发的全球首个整合从头分子生成与原子级结构预测的 AI 模型，支持多模态输入，提升药物设计效率与准确性。该模型基于大规模训练和定制数据集，具备精准生成分子和预测结构的能力，适用于分子胶设计、蛋白质复合物预测及抗体发现等多个领域，推动结构生物学发展。

AI项目与工具 2025年06月12日 76 点赞 0 评论 698 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期