AI工具

NovaMSS

NovaMSS是一款基于AI技术的音乐源分离工具,可精准分离人声、伴奏、贝斯、鼓点等音轨。支持多种音频格式和批量处理,操作简便,适用于音乐制作、音频修复及教学资源开发等多种场景。提供普通与专业模型,满足不同用户的音质需求,适合创作者和音乐爱好者使用。

VidSketch

VidSketch是由浙江大学研发的视频生成框架,支持通过手绘草图和文本提示生成高质量动画。它采用层级草图控制策略和时空注意力机制,提升视频连贯性和质量,适用于不同技能水平的用户。具备多样化风格支持和低门槛创作特点,广泛应用于创意设计、教学、广告及内容创作等领域。

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言;CosyVoice则专注于自然语音生成,支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景,其相关模型和代码已公开发布。

ima App

ima App是一款由腾讯推出的AI知识管理工具,结合腾讯混元大模型和DeepSeek-R1模型,提供智能问答、知识库管理、笔记整理及智能写作等功能。支持多端同步与云存储,适用于团队协作和个人知识管理,帮助用户高效获取、整理和应用信息。

Lemon Slice Live

Lemon Slice Live 是一款基于扩散变换器模型(DiT)的实时视频聊天工具,可将图片转化为可互动的动画角色,支持多语言和实时对话。通过优化模型提升流畅度与响应速度,适用于娱乐、教育、营销等多种场景,结合语音识别、文本生成等技术,提供完整的交互体验。

Maverick

Maverick 是一种基于AI 根据每位客户的购买历史、偏好和行为为其生成个性化视频并将其发送给客户的AI工具。

Chat2SVG

Chat2SVG 是一种基于大语言模型和图像扩散模型的文本到 SVG 生成工具,能够自动创建高质量矢量图形。通过多阶段处理流程,包括模板生成、细节增强和形状优化,确保图形在视觉质量和语义对齐方面达到较高标准。支持自然语言指令编辑,适用于设计原型、图标创作、教育演示及艺术创作等多种场景。

Agent TARS

Agent TARS 是字节跳动推出的开源多模态 AI 代理工具,支持浏览器、命令行和文件系统的集成,实现复杂任务的自动化执行。其核心功能包括代理工作流、数据处理、代码生成与解释等。基于事件流和模型上下文协议(MCP),Agent TARS 能高效分解任务并实时反馈结果,适用于网页自动化、任务管理、数据分析和代码辅助等多种场景。目前支持 macOS 平台,处于技术预览阶段。

AgentPrune

AgentPrune 是一种针对大型语言模型驱动的多智能体系统的通信优化框架,通过“剪枝”技术减少冗余通信内容,降低通信成本并提升系统性能。其核心技术包括时空图建模、低秩稀疏图掩码和一次性剪枝,可在 AutoGen 和 GPTSwarm 等框架中无缝集成,实现高达 72.8% 的 token 减少。同时具备对抗攻击防御能力,适用于复杂任务协作和工业级应用。

AnimateAI.Pro

AnimateAI.Pro是一款基于先进AI技术的动画视频生成平台,支持用户通过简单操作快速生成高质量的连贯角色视频内容。平台集成了角色生成、故事板设计、视频制作及多种AI工具,用户无需专业背景即可高效创作动画视频,适用于教育、娱乐、影视等多个领域。