模型

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型,拥有 1.5 亿参数,专注于长音频处理,支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色,具备高效的训练方法和多任务处理能力,适用于语音助手、实时转写、归档理解等场景。

食神

食神是老板电器研发的烹饪领域AI大模型,基于46年烹饪数据与DeepSeek技术,可精准理解用户需求。支持语音、文字交互,提供个性化菜谱推荐、健康膳食规划,并能与智能厨电联动,实现烹饪全流程自动化。同时具备文化讲解与情感陪伴功能,提升用户体验。适用于家庭烹饪、健康管理及文化体验等多个场景。

Emu Video

Meta开发的文本到视频生成模型,Emu Video使用扩散模型根据文本提示创建视频,首先生成图像,然后根据文本和生成的图像创建视频。

S2V

S2V-01是MiniMax研发的视频生成模型,基于单图主体参考架构,可快速生成高质量视频。它能精准还原图像中的面部特征,保持角色一致性,并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出,具备电影感镜头效果,适用于短视频、广告、游戏、教育等多种场景,具有高效、稳定和高自由度的特点。

岩芯数智大模型

岩芯数智大模型是一个多功能的企业级AI解决方案,它通过提供高效的推理、快速的训练和高准确率,帮助企业提升知识管理能力、优化业务流程,并实现智能化升级。

Reka Flash 3

Reka Flash 3 是一款由 Reka AI 开发的开源推理模型,拥有 21 亿参数,支持多模态输入(文本、图像、视频、音频),并可处理最长 32k 个令牌的上下文。它具备高效的推理能力和多语言支持,适用于日常对话、编码辅助、指令执行等多种场景。模型可在本地部署,支持 4 位量化以降低资源占用,适合广泛的应用需求。

Objaverse

Objaverse 是一个为3D领域提供巨大资源的数据库,它不仅支持 AI 模型的训练和3D内容的生成,还与流行的3D编辑软件 Blender 兼容。

瀚海智语

瀚海智语(OceanDS)是国内首个面向海洋领域的垂直大语言模型,基于360智脑和Deepseek-R1大模型开发,具备海洋知识问答、信息检索、政策分析等功能。拥有全球最丰富的海洋中文知识库,词元总量超18亿,采用增量式数据库与加密技术保障信息安全。适用于海洋科研、教育、灾害预警及政策支持等领域,提供高效、专业的AI服务。

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具,支持零样本多语言生成,提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器,实现文本与图像的高效交互。实验表明其性能优于现有方法,适用于艺术创作、广告设计、影视制作等多个领域,具备高效、灵活和高质量的生成能力。

Resume Matcher

Resume Matcher 是一个免费的开源项目,专门为开发者设计,以简化简历创建过程并加速求职搜索。