工具

SoraWebui

一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。

Vizcom

Vizcom AI 是一款使用非常简单、功能非常垂直的 AI 应用,就是用来帮助设计师将手绘草图快速渲染为概念图。

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。

Zion

一个全面的无代码平台,用于开发和集成AI智能体应用。它的特点包括一站式开发环境、灵活的生成式AI应用开发框架、多数据源支持、结构化输出、工具调用能力以及商业化应用开发的支持。

Browser

一个开源的Python库,它把AI技术和浏览器自动化功能结合起来,能让AI代理像真人用户一样在网页上浏览、操作、提取信息。

网易见外

网易见外是由网易人工智能事业部研发的AI智能语音转写听翻平台,提供视频听翻、直播听翻、语音转写、文档直翻等功能。

DeepWiki MCP

DeepWiki MCP是Cognition Labs推出的远程服务器,基于开放标准的Model Context Protocol(MCP),为AI应用提供访问和搜索GitHub代码库文档的能力。它包含三个主要工具:获取文档主题列表、查看文档内容以及针对仓库提问获得AI回答。支持SSE和Streamable HTTP传输协议,确保信息实时性和准确性,适用于快速查询文档、技术问题解答、代码库结构概览

GaussianAnything

GaussianAnything 是一款基于多模态输入的 3D 内容生成框架,支持点云、文本和图像等多种输入方式,能够生成高精度且可编辑的 3D 模型。其核心技术包括点云结构化潜空间和级联扩散模型,具备几何与纹理解耦特性,适用于游戏开发、影视制作、VR/AR、工业设计等多个场景。该工具在生成质量和一致性方面表现优异,为 3D 内容创作提供了高效解决方案。

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。

星火插件

星火插件是一款基于星火大模型的浏览器扩展工具,集成了讯飞星火V4.0的AI能力,支持划词搜索、翻译、网页内容摘要生成及信息收藏等功能。它通过轻量化设计兼容主流浏览器,注重个性化配置,可跨平台使用,适用于信息检索、阅读、知识管理等多种场景,致力于提升用户的工作效率。