应用

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型,基于 Qwen2.5-VL 架构,结合强化学习优化技术,具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析,支持自然语言指令定位图像目标,并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

Momo

Momo 是一款基于人工智能的照片生成工具,支持在移动端使用。用户上传 8-12 张照片后,可生成高真实度的 AI 头像和图像,并支持多种风格选择,如商务、约会、旅行等。应用提供高分辨率输出,适用于社交媒体、求职和约会等场景,帮助用户打造个性化的数字形象。

视频闪闪

视频闪闪类似剪映做好一个模板,然后随机替换文件夹内容(设置好文件夹内容以后),文字,转场,音频,特效都可以系统随机。

Instella

Instella是AMD推出的30亿参数开源语言模型,基于自回归Transformer架构,支持4096标记序列,具备强大的自然语言理解、指令跟随和多轮对话能力。通过多阶段训练和高效优化技术,Instella在多个任务中表现优异,适用于智能客服、内容创作、教育辅导、编程辅助和企业知识管理等多个场景。AMD全面开放了模型资源,促进AI技术发展与社区合作。

FastGPT

FastGPT是一款开源的AI知识库构建平台,支持多种文档格式导入和自动预处理,提供可视化工作流设计、多模型兼容及API集成功能。用户可快速构建智能问答系统和自动化流程,适用于客服、知识管理、教育、医疗和旅游等多个场景。平台提供不同版本的定价方案,满足个人、团队及企业的需求。

天工SkyMusic

天工SkyMusic是由昆仑万维公司推出的一款AI音乐生成模型,它基于昆仑万维的天工3.0超级大模型构建而成。

SeeMuseums

SeeMuseums 是一款基于AI的智能导览工具,支持多语言、智能推荐和AI音频讲解,帮助用户个性化探索博物馆内容。用户可通过提问获取详细解读,记录笔记并保存收藏,适用于艺术学习、文化探索和教育辅助等多种场景,提升参观体验与知识获取效率。

SongDonkey

SongDonkey是一款基于AI技术的音频处理工具,能够高效分离人声与乐器音轨,支持多种格式输出和预览功能。它适用于音乐制作、教学、分析及编辑等领域,为用户提供便捷的音频处理体验。