多模态 - 智狐AI导航

FakeShield

FakeShield是一款由北京大学研发的多模态大型语言模型框架，主要用于检测和定位图像篡改。它通过结合视觉与文本信息，生成篡改区域掩码并提供详细的判断依据。其核心模块包括领域标签引导的检测模块和多模态定位模块，支持多种篡改技术的分析，具有较高的准确性与可解释性。FakeShield广泛应用于社交媒体内容审核、法律取证、新闻媒体真实性验证以及版权保护等领域。

AI项目与工具 2025年06月12日 41 点赞 0 评论 657 浏览

讯飞星火PC版

讯飞星火PC版是科大讯飞推出的一款桌面级AI工具，集成了强大的跨领域知识理解和语言处理能力。它支持自然对话方式，涵盖写作、搜索、问答、翻译、PPT生成、图像生成等功能，并新增了深度搜索与多模态交互能力，可广泛应用于办公、教育、内容创作和技术开发等领域，提供高效便捷的智能服务。

AI项目与工具 2024年10月29日 65 点赞 0 评论 645 浏览

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型，擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术，支持视觉文本生成、编辑、理解及感知等功能，广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练，TextHarmony在视觉与语言生成任务中表现出色。

AI项目与工具 2025年06月12日 47 点赞 0 评论 675 浏览

ExperAI

ExperAI是一款基于AI聊天机器人的创新型平台，支持文本和语音交互，可上传文档和自定义知识库以提升对话个性化水平。其功能包括创建数字个性、知识分享、客户服务、个性化推荐及社交媒体集成等，广泛应用于客户服务、教育、健康咨询、个人助理和市场调研等领域，旨在通过自然语言处理技术，为用户提供深入且高效的对话体验。

AI项目与工具 2025年06月12日 82 点赞 0 评论 615 浏览

LongVU

LongVU是一款由Meta AI团队研发的长视频理解工具，其核心在于时空自适应压缩机制，可有效减少视频标记数量并保留关键视觉细节。该工具通过跨模态查询与帧间依赖性分析，实现了对冗余帧的剔除及帧特征的选择性降低，并基于时间依赖性进一步压缩空间标记。LongVU支持高效处理长视频，适用于视频内容分析、搜索索引、生成描述等多种应用场景。

AI项目与工具 2025年06月12日 65 点赞 0 评论 571 浏览

PixVerse V3

PixVerse V3是一款由爱诗科技开发的AI视频生成工具，具备创意模板、口型匹配、风格转换等多模态生成能力。其核心功能包括精准的提示词理解、高质量视频生成、多种视频比例支持以及风格化功能升级。新增的口型适配功能和8个创意效果模板进一步丰富了应用场景，适用于社交媒体、广告营销、教育、影视及游戏开发等领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 849 浏览

VILA

VILA-U 是一款由 MIT 汉实验室开发的统一基础模型，整合了视频、图像和语言的理解与生成能力。它通过自回归框架简化模型结构，支持视觉理解、视觉生成、多模态学习和零样本学习等功能。VILA-U 在预训练阶段采用混合数据集，利用残差向量量化和深度变换器提升表示能力，适用于图像生成、内容创作辅助、自动化设计、教育和残障人士辅助等多种场景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 1286 浏览

Embed3

Embed3是一款由Cohere研发的多模态AI搜索模型，支持从文本和图像生成嵌入向量，实现智能化的跨模态搜索。它能够处理多种语言，支持复杂数据集的快速检索，并提供一致的用户体验。主要功能包括多模态搜索能力、跨语言支持、增强型检索-生成系统以及简化数据管理。适用于商业智能、电子商务、设计创作、文档管理和客户服务等多个领域。

AI项目与工具 2025年06月12日 16 点赞 0 评论 641 浏览

Talkie

Talkie是一款基于人工智能技术打造的虚拟伴侣应用，主打高度定制化虚拟角色和沉浸式互动体验。它支持用户通过文本、语音及图像与AI角色交流，并提供角色创建、卡牌收集、智能推荐等功能。自推出以来，Talkie迅速获得了全球用户的青睐，在个性化聊天、情感陪伴及沉浸式叙事方面展现出强大潜力。

AI项目与工具 2025年06月12日 17 点赞 0 评论 681 浏览

Show

Show-o 是一款基于统一 Transformer 架构的多模态 AI 工具，集成了自回归和离散扩散建模技术，可高效处理视觉问答、文本到图像生成、图像修复与扩展以及混合模态生成等多种任务。其创新性技术显著提高了生成效率，减少了采样步骤，适用于社交媒体内容创作、虚拟助手、教育与培训、广告营销、游戏开发及影视制作等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 517 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期