多模态

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。

MT

MT-MegatronLM 是摩尔线程推出的开源混合并行训练框架,支持密集模型、多模态模型和 MoE 模型的高效训练。采用 FP8 混合精度、高性能算子库和集合通信库,提升 GPU 集群算力利用率。通过模型并行、数据并行和流水线并行技术,实现大规模语言模型的高效分布式训练,适用于科研、企业及定制化 AI 应用场景。

Emotion

Emotion-LLaMA是一款基于多模态输入的情绪识别与推理模型,结合音频、视觉和文本信息,提升情感理解的准确性与可解释性。模型采用改进版LLaMA架构,通过指令调整增强情感处理能力,并依托自建的MERR数据集进行训练与验证。在多个挑战赛中表现优异,适用于人机交互、教育、心理健康、客户服务等领域,具有广泛的应用前景。

ExperAI

ExperAI是一款基于AI聊天机器人的创新型平台,支持文本和语音交互,可上传文档和自定义知识库以提升对话个性化水平。其功能包括创建数字个性、知识分享、客户服务、个性化推荐及社交媒体集成等,广泛应用于客户服务、教育、健康咨询、个人助理和市场调研等领域,旨在通过自然语言处理技术,为用户提供深入且高效的对话体验。

阶跃星辰

一家专注于人工智能领域的创新公司,阶跃星辰以“智能阶跃,十倍每一个人的可能”为使命,旨在实现通用人工智能(AGI)。

MobA

MobA是一种基于多模态大型语言模型的移动智能体,通过高级全局智能体(GA)和低级局部智能体(LA)的两级架构,实现任务规划、分解与执行,支持跨应用操作和自动化流程。其反思模块助力高效处理复杂任务,广泛应用于个人助理、智能家居控制、移动设备自动化及教育等领域。

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架,专为长视频设计。该框架结合自回归模型和扩散渲染技术,生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本,适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

小红书点点

一款主打生活场景的AI聚合搜索工具,生活搜索助手,小红书点点只要为用户提供便捷的生活服务和信息查询。

MCP万能工具箱

MCP万能工具箱是一个基于MCP开放协议的AI工具集成平台,提供近百款免费工具,覆盖办公、金融、数据处理等场景。支持一键调用多种功能,如财报解析、投资建议、地图导航等,并集成多个主流大模型。用户无需编程即可创建个性化智能体,提升工作效率与决策能力。平台具备安全机制,兼容多系统,适用于办公自动化、金融分析及专业领域支持等多种应用。

k1.5

k1.5 是月之暗面推出的多模态思考模型,具备强大的数学、代码、视觉推理能力。在 short-CoT 模式下,性能超越主流模型 550%,在 long-CoT 模式下达到 OpenAI o1 水平。支持文本与图像的联合处理,适用于复杂推理、跨模态分析、教育、科研等领域。通过长上下文扩展和策略优化,提升推理效率与准确性。