框架

DL4J

DL4J开源的使用JVM部署和训练...

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架,采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容,第二阶段通过流匹配技术提升至1080p,仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用,适用于广告、影视、教育等领域。

JAX

JAXGoogle推出的用于变换数值...

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架,能够将任意角色图像与目标场景结合,生成高质量视频。它采用两阶段训练策略,确保角色细节的高保真保留,并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型,具备良好的泛化能力,适用于影视制作、艺术创作、虚拟现实等多个领域。

EvoAgentX

EvoAgentX 是一个开源的 AI Agent 自进化框架,通过进化算法实现多 Agent 系统的自动化生成与优化。它能根据目标描述自动生成工作流,并通过迭代优化提升性能。框架采用模块化设计,包含工作流生成器、Agent 管理器、执行器、评估器和优化器等核心组件,支持多种 LLM 模型,用户可通过自然语言提示轻松定制 Agent 和工作流。同时提供可视化工具和多环境支持,适用于复杂系统模拟、自

VARGPT

VARGPT是一款多模态大语言模型,整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制,支持文本与图像的混合输入和输出,具备高效的视觉生成能力。模型采用三阶段训练策略,提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AIEditor

AIEditor是一款基于Web Components技术开发的下一代富文本编辑器,支持多种前端框架。它具备拼写和语法检查、文本扩展、压缩、翻译和内容摘要等功能,还支持Markdown、实时协作和评论功能。此外,AIEditor还集成了虚拟白板、手绘草图和图表编辑器等工具。适用于内容创作与管理、教育与学术、企业文档处理及技术文档编写等多个领域。

PDFtoChat

PDFtoChat 是一款基于 AI 技术的开源工具,支持用户通过自然语言对话与 PDF 文件交互。它具备强大的文档解析、智能检索和即时反馈能力,广泛应用于学术研究、法律咨询、商业分析、教育培训和技术文档查询等领域,显著提升文档处理效率。

II

II-Agent 是一个开源的 Agent 框架,通过与大型语言模型(LLM)交互,简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口,适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。

AgentGen

AgentGen是一款由香港大学与微软联合研发的AI项目框架,旨在通过自动生成多样化环境和任务,显著提升大语言模型(LLM)的规划能力。其核心技术包括环境生成、任务生成和动态难度调节,支持零样本生成和指令微调,适用于机器人控制、智能家居等多个领域。