AI项目与工具

Pangea

Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型,支持39种语言,具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等,同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构,适用于多语言客户服务、教育、跨文化交流等多个领域。

Perplexideez

Perplexideez 是一款基于 AI 技术的本地化助手,支持用户在网络和自托管应用中高效搜索信息。它具备多用户支持、单点登录、网络搜索优化、结论来源追踪、个性化学习建议等功能,适用于个人知识管理、企业内部搜索、学术研究、教育和开发等领域。其核心技术包括 LLM 自然语言处理、Postgres 数据库支持及容器化部署。

星火人设

星火人设是科大讯飞推出的AI角色模拟工具,支持人物设定、剧情演绎与语言风格控制,具备会话记忆和推理能力。用户可自定义虚拟角色,提升交互的情感化与自然度。适用于医疗咨询、健康管理、虚拟互动、社交聊天及客户服务等多个场景,满足多样化需求。

NarratoAI

NarratoAI是一款基于AI技术的影视解说和编辑工具,它利用大型语言模型(LLM)、计算机视觉和自然语言处理技术来理解视频内容,自动生成解说文案,并将文案转化为配音,同时进行视频剪辑和字幕生成。该工具支持个性化定制,可以满足不同用户的视频制作需求,简化视频制作流程,帮助非专业人士快速制作出专业水准的视频内容。

ScaleMCP

ScaleMCP是普华永道推出的工具选择方法,通过动态为大型语言模型(LLM)Agents配备Model Context Protocol(MCP)工具,解决手动更新工具库导致的低效和不一致问题。其核心是自动同步工具索引管道,基于CRUD操作确保工具存储与MCP服务器一致,并采用工具文档加权平均(TDWA)嵌入策略提升工具检索和调用性能。支持多种LLM模型和存储系统,适用于金融、客服、医疗等多个场

MusicMint

MusicMint 是一款基于人工智能的音乐创作工具,支持多种音乐风格并提供高度自定义选项,如乐器、情绪、主题和结构等。用户可通过简单描述或选择参数快速生成原创音乐,并支持下载与分享。适用于个人创作、视频配乐、MV 制作及艺术项目等多种场景,是音乐爱好者和创作者的理想工具。

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。

WebWalker

WebWalker是阿里巴巴研发的AI工具,用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集,提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务,适用于信息检索、数据分析和内容监控等场景,具备良好的适应性和可扩展性。

ClipZap AI

ClipZap AI 是一款基于人工智能的视频创作与编辑工具,提供视频剪辑、多语言翻译、AI 换脸、视频生成与增强等多种功能,帮助用户高效制作高质量视频内容,适用于社交媒体推广、产品营销、教育及多语言内容制作等多个场景。

TRELLIS

TRELLIS是一款由清华大学、中国科学技术大学及微软研究院共同开发的3D生成模型,利用Structured LATent(SLAT)表示法,通过文本或图像提示生成高质量、多样化的3D资产。它融合了稀疏的3D网格结构与密集视觉特征,支持多格式输出及局部编辑,无需拟合训练即可生成细节丰富的模型。此外,TRELLIS具备两阶段生成流程,可灵活适应不同需求。