开源

DL4J

DL4J开源的使用JVM部署和训练...

Hugeicons

一个庞大的图标资源库,提供超过36,000个精美图标,适用于SaaS、网站、印刷等现代界面。它为开发者和设计师提供了丰富的选择,支持多种风格,包括描边、双色、实心等。

WiseFlow

WiseFlow 是一个开源的 AI 信息挖掘工具,可以从网站、微信公众号、社交媒体等多源信息中智能提取并分类数据。该工具结合了统计学习和大型语言模型(LLM),优化了对微信公众号文章的解析,并支持多种新闻页面的处理。WiseFlow 设计轻巧,无需 GPU 即可运行,适用于任何硬件环境,是信息过载时代的信息管理理想助手。

Tailor

Tailor是一款免费开源的AI视频编辑工具,提供视频编辑、生成和优化三大功能。它能够实现人脸剪辑、语音剪辑、口播生成、字幕生成、色彩生成等功能,并支持背景更换及流畅度和清晰度优化。最新版本增加了语音驱动的口播生成和模型自检修复机制,进一步提升了用户体验。

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Colors

一个开源的学术期刊配色推荐器,收集整理了众多高质量论文插图的配色,可帮助我们轻松快速找到专业水准的配色组合。

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型,具备约5.15亿参数量,能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出,支持多种应用场景,包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型,具备高效计算能力和紧凑结构,支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构,结合高效与精准优势,支持无位置编码(NoPE)处理128K tokens上下文。内存需求降低72%,推理时仅激活1B参数,适用于边缘设备部署、长文本分析及企业级应用开发,适合资源受限环境下的AI研究与

BAGEL

BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,采用混合变换器专家架构(MoT),通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异,生成质量接近SD3,并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

Simba

一个能够帮助用户轻松收纳各种文档的强大工具,Simba可以作为一个后端知识库与任何检索增强生成(RAG)系统进行无缝集成。