多模态

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理,能够通过稀疏控制信号(如手动轨迹、面部关键点序列或音频)实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习,能够将多种控制信号组合使用,生成复杂的动画效果,并能生成较长的视频片段。 ---

Dust

Dust 是一款面向企业用户的 AI 代理构建平台,支持无代码开发,可快速部署定制化 AI 代理,实现业务流程自动化。其核心功能包括多平台集成、实时数据同步、语义搜索、多模态交互及团队协作等,适用于市场营销、销售、技术支持等多个应用场景,有效提升工作效率和数据利用率。

无限画

无限画是一款方便、快捷并基于人工智能技术的免费AI绘画和创作平台,提供多种AI绘画工具和AIGC创作功能,如文生图、图生图等。

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型,能够生成长达10秒的高清视频片段,支持文本到视频、图像到视频的转换,并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情,提供运动画笔、高级相机控制和导演模式等高级控制工具,确保内容的安全性和合规性。

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的一款多模态语言模型,兼具高性能与低成本优势,适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理,可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域,具备良好的扩展性和系统集成能力。

AddressCLIP

AddressCLIP 是一种基于 CLIP 技术的端到端图像地理定位模型,由中科院自动化所与阿里云联合开发。它通过图像与地址文本对齐和地理匹配技术,实现街道级别的精确定位,无需依赖 GPS。模型在多个数据集上表现优异,适用于城市管理、社交媒体、旅游导航等多个场景,具备良好的灵活性和多模态结合潜力。

LMArena AI

前身为lmsys.org,是一个专注于众包AI基准测试的开放平台,用户可以在此平台上免费与AI聊天并进行投票,比较和测试不同的AI聊天机器人。

MiniMax

MiniMax-01是由MiniMax推出的高性能AI模型系列,包含语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。该系列采用线性注意力机制,支持处理长达400万token的上下文,性能接近国际领先模型。具备强大的语言理解、多模态处理及长文本分析能力,适用于企业、教育、科研及开发等多个领域。API定价合理,提供高效的长文本处理与多模态交互解决方案。

Aria

Aria是首个开源多模态原生混合专家(MoE)模型,支持文本、代码、图像和视频的综合处理,具有强大的多模态任务处理能力和长上下文窗口,可高效应对复杂长数据。模型开源且可扩展,适用于多模态AI领域的研究与应用。

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具,适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气,通过视频和音频反馈练习非语言沟通技巧,并获得个性化反馈以提升表达能力。支持多语言使用,可无限重试,便于反复练习。具备嵌入功能,方便集成到其他平台。