开源 - 智狐AI导航

WebRL

WebRL是一种由清华大学与智谱AI共同研发的自我进化的强化学习框架，专注于通过开放大型语言模型优化网络代理性能。该框架采用动态任务生成与结果监督奖励机制，并结合自适应强化学习策略，解决了任务稀缺和反馈稀疏等问题。其显著提升了开源模型在WebArena-Lite基准测试中的表现，具备自我进化、持续改进的特点。

AI项目与工具 2025年06月12日 75 点赞 0 评论 598 浏览

OuteTTS

OuteTTS是一款基于开源技术的文本到语音（TTS）工具，利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音，具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容，适用于有声读物、智能客服、语音导航等多种应用场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 459 浏览

AndroidLab

AndroidLab 是一款面向 Android 自主代理的训练与评估框架，集成了文本和图像模态操作环境，提供标准化的基准测试任务。它通过支持多种模型类型（LLMs 和 LMMs），覆盖九个应用场景的 138 项任务，有效提升了开源模型的性能。此外，AndroidLab 提供了丰富的评估指标和操作模式，助力研究者优化模型表现并推动开源解决方案的发展。

AI项目与工具 2025年06月12日 38 点赞 0 评论 662 浏览

AdaCache

AdaCache是一种开源的自适应缓存技术，由Meta开发，用于加速AI视频生成。它通过动态调整计算资源和引入运动正则化策略，优化视频生成过程中的缓存决策，显著提升生成速度，同时保持视频质量。AdaCache无需重新训练即可轻松集成到现有模型中，并适用于多GPU环境，广泛应用于影视制作、视频编辑、在线平台及虚拟现实等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 788 浏览

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具，具备文本到视频生成、图像到视频转换等功能，支持高清视频输出及音效匹配。它通过三维变分自编码器（3D VAE）、Transformer架构等技术手段，提升了视频生成的质量与效率，适用于内容创作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 875 浏览

OpenCoder

OpenCoder是一个开源代码大型语言模型（LLM），具备代码生成、审查、补全、错误调试等功能，支持多种编程语言，通过预训练、指令微调及优化策略提升性能，推动代码AI研究的透明化与可重复性，广泛应用于开发效率提升、代码质量保障及编程教育等领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 542 浏览

Infinity

Infinity-MM是智源研究院发布的千万级多模态指令数据集，包含4300万条样本，涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量，并采用合成数据生成技术扩展数据集规模。基于此数据集，智源研究院训练出了20亿参数的Aquila-VL-2B模型，在多项基准测试中表现出色，推动了多模态AI领域的研究与发展。

AI项目与工具 2025年06月12日 87 点赞 0 评论 610 浏览

AFFiNE

AFFiNE是一款开源的多功能知识管理和团队协作工具，集成了文档编辑、白板绘图和数据库管理功能。它通过AI技术提升用户的工作效率，支持个性化内容创作和团队协作，适用于个人知识管理、团队项目规划以及创意设计等场景。

AI项目与工具 2025年06月12日 76 点赞 0 评论 675 浏览

AlphaFold 3

AlphaFold 3 是一款由 DeepMind 开发的基于深度学习的 AI 工具，能够准确预测蛋白质、核酸、小分子等多种生物分子的三维结构。它在药物设计、疫苗研发、基础科研以及疾病研究等领域展现出强大的应用潜力。通过创新技术如 Pairformer 模块和扩散模块，AlphaFold 3 实现了更高的预测精度，并支持复杂生物系统的建模。

AI项目与工具 2025年06月12日 67 点赞 0 评论 762 浏览

PDFMathTranslate

PDFMathTranslate是一款专注于科技文档翻译的开源工具，能够精准保留PDF文档的排版格式，包括公式、图表和目录结构。支持双语对照查看，兼容多种翻译服务，可实现全文或局部翻译，适用于学术研究、教育、技术文档、法律文件等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 442 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期