AI项目与工具

SWE

SWE-agent是普林斯顿大学NLP研究团队开发的开源AI工具,旨在帮助程序员和软件工程师解决GitHub存储库中的问题。它通过智能体-计算机接口(ACI)与代码库交互,实现代码浏览、编辑、测试及执行等功能。SWE-agent在SWE-bench测试集上的表现与Devin相近,平均93秒解决问题。其功能包括拉取请求问题解决、代码编辑与修复、自动语法检查、文件查看、全目录字符串搜索、命令与反馈处理

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架,专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力,可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域,同时支持预训练模型微调和端到端开发流程,为企业提供高效灵活的解决方案。

Marco

Marco是一款由阿里国际研发的大规模商用翻译大模型,支持15种主流语种,具备基于语境的精准翻译能力。其核心功能包括多语种翻译支持、跨境电商优化、多样化风格翻译以及高并发处理能力。Marco采用深度学习技术,结合多语言数据筛选和参数扩展方法,确保翻译质量和效率。它广泛应用于商品信息本地化、多语言客户服务、跨境电商平台及个人文档翻译等领域,助力全球化沟通。

Holiwise

Holiwise 是一款基于AI的旅行规划工具,能够根据用户输入的偏好生成个性化目的地推荐和行程安排。平台提供实时评分、社区评价、团队旅行支持及一站式旅行管理功能,适用于多种旅行场景,提升旅行规划效率与体验。

GraphReasoning

GraphReasoning 是一种基于人工智能的知识图谱构建工具,能够将大量科学文献转化为结构化的知识图谱。其主要功能包括知识图谱构建、结构分析、图推理、多模态数据处理及路径采样策略等,旨在促进跨学科创新、材料设计及复杂问题解答。同时,该工具通过自然语言处理、机器学习和推理算法实现智能化分析,并提供可视化界面支持。

VERBALATE

VERBALATE是一款基于AI的视频翻译与配音工具,支持多语言翻译及口型同步,适用于教育、娱乐、企业培训等场景。其主要功能包括视频翻译、声音克隆、口型同步、多语言支持及长视频处理,界面友好且操作简便,为企业和个人用户提供高效的多语言内容解决方案。

Cartwheel

Cartwheel 是一款基于文本到动画(Text-to-Motion)技术的 AI 3D 动画生成平台,用户只需输入文本描述即可快速生成高质量的 3D 角色动画。平台结合深度学习与传统动画技术,支持动作捕捉、自动化运动合成,并与主流 3D 软件无缝集成。其功能包括文本驱动动画、可编辑动画、动作库预设等,适用于游戏开发、影视制作、广告营销、VR/AR 及教育等多个场景。Cartwheel 提供不同

Brainly

Brainly是一款基于人工智能的学习平台,旨在为学生提供全方位的学术支持。它涵盖了多个学科领域,支持用户提问与解答,并通过社交学习模式促进知识共享。Brainly的核心功能包括AI驱动的个性化学习支持、专家验证的答案以及扫描数学问题获取逐步解决方案等。此外,平台还提供了丰富的学习工具,如练习测试和AI生成的学习计划,适用于家庭作业帮助、考试复习、学术研究、语言学习及教师备课等多种场景。

Pocket Flow

Pocket Flow 是一个极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。它具有轻量级、无依赖、无厂商锁定的特点,支持多 Agents、工作流、检索增强生成(RAG)等功能,帮助开发者快速构建基于 LLM 的应用程序。基于 Agentic Coding 范式,AI Agents 协助开发,提升效率。适用于多种编程语言,适合希望用极简方式开发 LLM 应用的开发者。

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言;CosyVoice则专注于自然语音生成,支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景,其相关模型和代码已公开发布。