应用

MatAnyone

MatAnyone是一款由南洋理工大学S-Lab实验室与商汤科技联合开发的视频抠图框架,专注于复杂背景下人像视频的精准分割。采用一致内存传播和区域自适应内存融合技术,确保视频中目标的语义稳定性和边界细节精度。结合大规模分割数据和优化的训练策略,提升了模型在真实场景下的性能。适用于影视制作、直播、广告、游戏开发等多个领域,具备高精度、强适应性和良好的交互性。

DeepWiki MCP

DeepWiki MCP是Cognition Labs推出的远程服务器,基于开放标准的Model Context Protocol(MCP),为AI应用提供访问和搜索GitHub代码库文档的能力。它包含三个主要工具:获取文档主题列表、查看文档内容以及针对仓库提问获得AI回答。支持SSE和Streamable HTTP传输协议,确保信息实时性和准确性,适用于快速查询文档、技术问题解答、代码库结构概览

Concept Lancet

Concept Lancet(CoLan)是一种基于潜在空间稀疏分解的图像编辑框架,能够实现零样本、即插即用的精确概念替换、添加与移除。它通过构建视觉概念字典,结合扩散模型生成高质量图像,保持视觉一致性。适用于创意设计、影视制作、游戏开发等多个领域,提供高效的图像编辑解决方案。

LLM2LLM

LLM2LLM是一种基于教师-学生架构的迭代数据增强方法,通过生成针对性的合成数据提升语言模型在低数据量场景下的性能。该技术通过识别并强化模型预测错误的数据点,实现精准优化,同时控制数据质量和规模。适用于医学、法律、教育等数据稀缺领域,具有良好的可扩展性和实用性。

Artroom AI

一个允许用户在AI的帮助下创作艺术的平台。它使用一种称为**稳定扩散**的技术,可以从文本描述中生成逼真且多样化的图像.

OpenNN

它解决了能源、营销、健康等领域的许多实际应用。

Google AI Edge Gallery

Google AI Edge Gallery 是谷歌推出的实验性应用,支持在 Android 设备上本地运行机器学习和生成式人工智能模型,无需联网。用户可切换不同模型,进行图像问答、文本生成、多轮对话等操作,并实时查看性能指标。应用支持自带模型测试,提供丰富的开发者资源,助力探索设备端 AI 的强大功能。

Voila

Voila是一款开源的端到端语音大模型,支持实时语音交互与多轮对话,具备高保真、低延迟的音频处理能力。集成语音与语言建模功能,支持百万级预设声音及个性化定制,适用于语音助手、角色扮演、语音翻译等场景。采用多尺度Transformer架构,提升语音理解与生成质量,降低开发成本,提高通用性与灵活性。

FacePoke

FacePoke是一款基于AI的开源实时面部编辑工具,支持通过简单拖拽操作调整人物头部姿态和面部表情,使静态图像更加生动。其采用深度学习技术,具备高分辨率输出和精确控制能力,适用于数字艺术、内容创作及影视制作等领域。工具基于LivePortrait技术开发,支持本地和Docker部署,便于用户灵活使用。